CN110990395B - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN110990395B
CN110990395B CN201811152082.6A CN201811152082A CN110990395B CN 110990395 B CN110990395 B CN 110990395B CN 201811152082 A CN201811152082 A CN 201811152082A CN 110990395 B CN110990395 B CN 110990395B
Authority
CN
China
Prior art keywords
data
fault
target
data table
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811152082.6A
Other languages
English (en)
Other versions
CN110990395A (zh
Inventor
焦张波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201811152082.6A priority Critical patent/CN110990395B/zh
Publication of CN110990395A publication Critical patent/CN110990395A/zh
Application granted granted Critical
Publication of CN110990395B publication Critical patent/CN110990395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种数据处理方法及装置,涉及信息技术领域。本发明实施例通过获取源数据表中预定时间段内的增量数据,生成第一数据集,检测第一数据集中每个目标对象的第一故障数据是否存在于目标数据表中,若不存在,则在目标数据表中插入第一故障数据,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,若存在,则直接提取出没有结束时间的第二故障数据,根据第二数据集和第一数据集,更新目标数据表中第二故障数据的结束时间。根据源数据表中的增量数据,向目标数据表中插入第一故障数据,并第二故障数据的结束时间,能够快速的将增量数据合并到目标数据表中,使得用户可以在目标数据表中快速得知故障发生的时刻和时长。

Description

一种数据处理方法及装置
技术领域
本发明涉及信息技术领域,特别是涉及一种数据处理方法及装置。
背景技术
在油田监控系统中,为了正常开采和管理每个油井,对每个油井都会定时进行数据统计,并且根据统计的数据信息初步分析出故障类型。
但是,由于每个油井都是定时进行数据统计的,统计的数据中会存在大量的重复数据,而且统计的数据仅仅是一个状态数据,不方便用户根据统计的数据信息分析故障发生的时刻和时长。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法及装置。
依据本发明的一个方面,提供了一种数据处理方法,包括:
获取源数据表中预定时间段内的增量数据,生成第一数据集;所述第一数据集包括目标对象标识,以及对应的时间信息和状态类型,所述状态类型包括正常状态和至少一个故障类型;
检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中;所述第一故障数据为所述第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或所述第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据;
若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间;
提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
若存在于所述目标数据表中,则直接执行所述提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集的步骤;
根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间。
可选地,所述检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中的步骤,包括:
检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据;
若存在,则确定所述第一故障数据存在于所述目标数据表中;
若不存在,则确定所述第一故障数据不存在于所述目标数据表中。
可选地,所述根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间的步骤,包括:
获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据;
根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间;
根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
可选地,在所述根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间的步骤之后,还包括:
记录所述获取源数据表中预定时间段内的增量数据的获取时间;
所述获取源数据表中预定时间段内的增量数据,生成第一数据集的步骤,包括:
获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集。
可选地,所述目标数据表还包括标识字段,当所述标识字段为第一标识字段时,所述目标数据表中对应的第二故障数据的结束时间更新完成;当所述标识字段为第二标识字段时,所述目标数据表中对应的第二故障数据的结束时间未更新完成。
根据本发明的另一方面,提供了一种数据处理装置,包括:
增量数据获取模块,用于获取源数据表中预定时间段内的增量数据,生成第一数据集;所述第一数据集包括目标对象标识,以及对应的时间信息和状态类型,所述状态类型包括正常状态和至少一个故障类型;
检测模块,用于检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中;所述第一故障数据为所述第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或所述第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据;
插入模块,用于若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间;
第一提取模块,用于提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
第二提取模块,用于若存在于所述目标数据表中,则直接提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
更新模块,用于根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间。
可选地,所述检测模块,包括:
检测子模块,用于检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据;
第一确定子模块,用于若存在,则确定所述第一故障数据存在于所述目标数据表中;
第二确定子模块,用于若不存在,则确定所述第一故障数据不存在于所述目标数据表中。
可选地,所述更新模块,包括:
目标故障数据获取子模块,用于获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据;
第一更新子模块,用于根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间;
第二更新子模块,用于根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
可选地,还包括:
记录模块,用于记录所述获取源数据表中预定时间段内的增量数据的获取时间;
所述增量数据获取模块,包括:
增量数据获取子模块,用于获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集。
可选地,所述目标数据表还包括标识字段,当所述标识字段为第一标识字段时,所述目标数据表中对应的第二故障数据的结束时间更新完成;当所述标识字段为第二标识字段时,所述目标数据表中对应的第二故障数据的结束时间未更新完成。
根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的数据处理方法。
根据本发明的再一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的数据处理方法。
在本发明实施例中,通过获取源数据表中预定时间段内的增量数据,生成第一数据集,检测第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中,若不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,若存在于目标数据表中,则直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,根据第二数据集和第一数据集,更新目标数据表中第二故障数据的结束时间。根据源数据表中的增量数据,向目标数据表中插入新的第一故障数据,并更新目标数据表中没有结束时间的第二故障数据的结束时间,能够高效快速的将增量数据合并到目标数据表中,使得用户可以在目标数据表中快速得知故障发生的时刻和时长。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例的一种数据处理方法的流程图;
图2示出了本发明实施例的另一种数据处理方法的流程图;
图3示出了本发明实施例的一种数据处理装置的结构框图;
图4示出了本发明实施例的另一种数据处理装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
参照图1,示出了本发明实施例的一种数据处理方法的流程图,具体可以包括如下步骤:
步骤101,获取源数据表中预定时间段内的增量数据,生成第一数据集。
在本发明实施例中,在一些数据故障监控系统中,如油田监控系统等,通常会定时采集数据,将采集到的数据记录在源数据表中。
获取源数据表中预定时间段内的增量数据,生成第一数据集,其中,第一数据集包括目标对象标识,以及对应的时间信息和状态类型,状态类型包括正常状态和至少一个故障类型。
由于每个增量数据均包括目标对象标识,以及对应的时间信息和状态类型,因此,生成的第一数据集也包括目标对象标识,以及对应的时间信息和状态类型,且状态类型包括正常状态和至少一个故障类型。
其中,预定时间段可以人为设定,在预定时间段设定之后,自动定时获取源数据表中预定时间段内的增量数据。
例如,预定时间段为1小时,9:00获取了一次源数据表中的增量数据,等到10:00时,再次获取源数据表中9:00到10:00之间的增量数据,等到11:00时,接着获取源数据表中10:00到11:00之间的增量数据。
预定时间段也可以不人为设定,在获取一次源数据表中的增量数据后,记录获取的时间,当下次再获取源数据表中的增量数据时,获取的是当前时刻与上次获取时间之间的时间段内的增量数据,
例如,上次获取源数据表中的增量数据的获取时间为8:30,当前时刻为10:00,则此时获取的是源数据表中8:30到10:00之间的增量数据,并记录此时的获取时间10:00。
步骤102,检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中。
在本发明实施例中,在获取到源数据表中预定时间段内的增量数据,生成第一数据集之后,提取第一数据集中每个目标对象标识对应的目标对象的第一故障数据,其中,第一故障数据为第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据。
在提取出第一数据集中每个目标对象标识对应的目标对象的第一故障数据之后,依次检测每个目标对象的第一故障数据是否存在于目标数据表中。
需要说明的是,第一故障数据为第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据,因此,本发明实施例不仅使用到了第一数据集中的故障数据,也使用了第一数据集中的正常数据。
此外,且仅检测第一故障数据是否存在于目标数据表,省略了其他数据的检测过程,使得本发明的执行方案更高效。
步骤103,若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间。
在本发明实施例中,若第一数据集中的目标对象的第一故障数据不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间,实现向目标数据表中插入新增的第一故障数据的目的。
需要说明的是,步骤101至步骤103是在数据库中的一个事务中实现的,是数据库中的一个逻辑工作单元一次执行完成步骤101至步骤103,假如步骤101和步骤102执行完成,但是步骤103执行失败,则输出的结果显示失败,需从步骤101开始重新执行,使得数据处理的准确性提高。
步骤104,提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集。
在本发明实施例中,在目标数据表中插入第一故障数据之后,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集。
其中,由于在目标数据表中插入第一故障数据时,相应的插入了第一故障数据的开始时间,但是并没有插入第一故障数据的结束时间,因此,提取出的第二故障数据中除了包括目标数据表中原有的没有结束时间的故障数据,还包括第一故障数据。
步骤105,若存在于所述目标数据表中,则直接提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集。
在本发明实施例中,若第一数据集中的目标对象的第一故障数据存在于目标数据表中,则表示目标数据表中已记录过与目标对象的第一故障数据属于同一故障类型,且该故障还没有结束的故障数据,因此,为了避免数据重复,不再在目标数据表中插入第一故障数据,直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集。
步骤106,根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间。
在本发明实施例中,根据生成的第二数据集中的第二故障数据和第一数据集中的增量数据,更新目标数据表中第二故障数据的结束时间,使得目标数据表中记录的故障数据有开始时间和结束时间,便于用户可以在目标数据表中快速得知故障发生的时刻和时长。
在本发明一种优选的实施例中,所述目标数据表还包括标识字段,当所述标识字段为第一标识字段时,所述目标数据表中对应的第二故障数据的结束时间更新完成;当所述标识字段为第二标识字段时,所述目标数据表中对应的第二故障数据的结束时间未更新完成。
目标数据表中存储有多个没有结束时间的第二故障数据,此时,每个第二故障数据对应的标识字段为第二标识字段,当根据增量数据更新了其中一部分第二故障数据的结束时间后,将这部分第二故障数据对应的标识字段更改为第一标识字段,剩下未更新结束时间的第二故障数据,其对应的标识字段依旧为第二标识字段。
例如,第一标识字段为1,第二标识字段为0,目标数据表中存储有第二故障数据A1、A2和A3,当根据增量数据更新了第二故障数据A1和A2的结束时间后,将第二故障数据A1和A2对应的标识字段从0更改为1,而第二故障数据A3对应的标识字段依旧为0。
需要说明的是,源数据表和目标数据表均存储在同一数据库中,上述步骤101至步骤106均在数据库中执行,使得整个执行过程的效率和性能得到提高。
在本发明实施例中,通过获取源数据表中预定时间段内的增量数据,生成第一数据集,检测第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中,若不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,若存在于目标数据表中,则直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,根据第二数据集和第一数据集,更新目标数据表中第二故障数据的结束时间。根据源数据表中的增量数据,向目标数据表中插入新的第一故障数据,并更新目标数据表中没有结束时间的第二故障数据的结束时间,能够高效快速的将增量数据合并到目标数据表中,使得用户可以在目标数据表中快速得知故障发生的时刻和时长。
实施例二
参照图2,示出了本发明实施例的另一种数据处理方法的流程图,具体可以包括如下步骤:
步骤201,获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集。
在本发明实施例中,在每次获取源数据表中的增量数据时,都会记录获取时间,当前时刻需要获取增量数据时,获取的是源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,根据获取到的增量数据生成第一数据集。
其中,第一数据集包括目标对象标识,以及对应的时间信息和状态类型,且状态类型包括正常状态和至少一个故障类型。
以本发明实施例应用于油田监控系统为例,例如,获取到的增量数据如下表一:
井号 时间信息 状态类型
庄53-12 2018/4/23 1:20 供液不足
庄53-12 2018/4/23 2:00 正常
刘7-8H 2018/4/23 2:00 供液不足
庄53-12 2018/4/23 2:25 供液不足
庄53-12 2018/4/23 3:00 气体影响
刘7-8H 2018/4/23 3:45 正常
庄53-12 2018/4/23 3:45 正常
表一
其中,获取增量数据的当前时刻为4:00,获取到的是源数据表中2018/4/23 1:00到2018/4/23 4:00的增量数据,增量数据对应的目标对象标识包括庄53-12和刘7-8H。
在本发明的一种实施例中,增量数据的状态类型包括正常状态和故障状态,即状态类型中仅有一个故障类型,不区分具体是发生哪种故障。
在本发明的另一种实施例中,增量数据的状态类型包括正常状态和至少一个故障类型,状态类型中的故障类型包括多个,区分具体是发生哪种故障,如上表一,故障类型包括供液不足和气体影响。
步骤202,检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据。
在本发明实施例中,在获取到源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集之后,提取第一数据集中每个目标对象标识对应的目标对象的第一故障数据,其中,第一故障数据为第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据。
例如,获取到的增量数据如上表一,则提取出第一数据集中每个目标对象标识对应的目标对象的第一故障数据如下表二:
井号 时间信息 故障类型
庄53-12 2018/4/23 1:20 供液不足
刘7-8H 2018/4/23 2:00 供液不足
庄53-12 2018/4/23 2:25 供液不足
庄53-12 2018/4/23 3:00 气体影响
表二
其中,庄53-12对应的油井在2018/4/23 1:20的故障数据属于第一次出现故障时对应的数据,刘7-8H对应的油井在2018/4/23 2:00的故障数据属于第一次出现故障时对应的数据,而庄53-12对应的油井在2018/4/23 2:25的故障数据属于在正常状态后再次出现故障时对应的数据,因为庄53-12对应的油井在2018/4/23 2:00时的数据属于正常数据,庄53-12对应的油井在2018/4/23 3:00的故障数据属于第一次出现故障时对应的数据。
需要说明的是,从表一中提取的第一故障数据是对每个故障类型的故障数据进行提取,假如不区分故障类型,状态类型仅包括正常和故障,则提取到的第一故障数据不包括庄53-12对应的油井在2018/4/23 3:00的故障数据。
由于提取的第一故障数据对应的状态类型只包括故障类型,因此,将表二中对应位置更改为故障类型。
在提取出第一数据集中每个目标对象标识对应的目标对象的第一故障数据之后,检测目标数据表中的每个目标对象是否存在与第一故障数据属于同一故障类型,且没有结束时间的故障数据。
步骤203,若存在,则确定所述第一故障数据存在于所述目标数据表中。
在本发明实施例中,若目标数据表中的目标对象存在与第一故障数据属于同一故障类型,且没有结束时间的故障数据,则确定第一故障数据存在于目标数据表中。
例如,目标数据表中存储的故障数据中,目标对象标识为庄53-12,开始时间为0:50,故障类型为供液不足,且没有结束时间,则确定表二中的第一故障数据(即庄53-12对应的油井在2018/4/23 1:20的故障数据)存在于目标数据表中。
步骤204,若不存在,则确定所述第一故障数据不存在于所述目标数据表中。
在本发明实施例中,若目标数据表中的目标对象不存在与第一故障数据属于同一故障类型,且没有结束时间的故障数据,则确定第一故障数据不存在于目标数据表中。
需要说明的是,本发明实施例中第一故障数据不存在于目标数据表中包括两种情况,针对同一目标对象,第一种是目标数据表中没有存储与第一故障数据属于同一故障类型的故障数据,第二种是目标数据表中存储有与第一故障数据属于同一故障类型,但有结束时间的故障数据。
例如,目标数据表中还没有存储任何数据,也就是说目标数据表中没有存储与第一故障数据属于同一故障类型的故障数据,或者,目标数据表中存储有庄53-12对应的油井的故障数据,其故障类型为供液不足,但有结束时间0:55,则均可确定表二中的第一故障数据不存在于目标数据表中。
步骤205,若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间。
在本发明实施例中,若第一数据集中的目标对象的第一故障数据不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间。同时,在目标数据表中还插入第一故障数据的故障类型。
例如,表二中的第一故障数据均不存在于目标数据表中,则在目标数据表中插入表二中的第一故障数据,并将第一故障数据的时间信息作为开始时间,得到下表三:
井号 开始时间 结束时间 故障类型
庄53-12 2018/4/23 1:20 供液不足
刘7-8H 2018/4/23 2:00 供液不足
庄53-12 2018/4/23 2:25 供液不足
庄53-12 2018/4/23 3:00 气体影响
表三
步骤206,提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集。
在本发明实施例中,在目标数据表中插入第一故障数据之后,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集。
例如,在目标数据表中第一次插入表三中的第一故障数据时,目标数据表中的故障数据均有结束时间,则提取出的目标数据表中没有结束时间的第二故障数据如上表三中的最后四条数据所示。
步骤207,若存在于所述目标数据表中,则直接提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集。
在本发明实施例中,若第一数据集中的目标对象的第一故障数据存在于目标数据表中,则直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集。
步骤208,获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据。
在本发明实施例中,获取第一数据集中,与第二故障数据的开始时间间隔最小的、且与第二故障数据的状态类型不一样的目标故障数据。其中,状态类型包括正常状态和故障类型。
例如,第二故障数据为表三中的倒数第四条数据,即庄53-12对应的油井,其开始时间为2018/4/23 1:20,故障类型为供液不足,与表三中的倒数第四条数据的开始时间间隔最小的、且状态类型不一样的目标故障数据为表一中的第二条数据,即庄53-12对应的油井,其时间信息为2018/4/23 2:00,状态类型为正常状态;第二故障数据为表三中的倒数第三条数据,即刘7-8H对应的油井,其开始时间为2018/4/23 2:00,故障类型为供液不足,与表三中的倒数第三条数据的开始时间间隔最小的、且状态类型不一样的目标故障数据为表一中的第六条数据,即刘7-8H对应的油井,其时间信息为2018/4/233:45,状态类型为正常状态;第二故障数据为表三中的倒数第二条数据,即庄53-12对应的油井,其开始时间为2018/4/23 2:25,故障类型为供液不足,与表三中的倒数第二条数据的开始时间间隔最小的、且状态类型不一样的目标故障数据为表一中的第五条数据,即庄53-12对应的油井,其时间信息为2018/4/23 3:00,状态类型为气体影响;第二故障数据为表三中的最后一条数据,即庄53-12对应的油井,其开始时间为2018/4/23 3:00,故障类型为气体影响,与表三中的最后一条数据的开始时间间隔最小的、且状态类型不一样的目标故障数据为表一中第七条数据,即庄53-12对应的油井,其时间信息为2018/4/23 3:45,状态类型为正常状态。
步骤209,根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间。
在本发明实施例中,根据目标故障数据对应的时间信息,更新第二数据集中的第二故障数据的结束时间。
步骤210,根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
在本发明实施例中,根据更新后的第二数据集中的第二故障数据的结束时间,更新目标数据表中第二故障数据的结束时间。
例如,目标数据表中没有结束时间的第二故障数据如上表三所示,表三中的倒数第四条数据的结束时间为2018/4/23 2:00,表三中的倒数第三条数据的结束时间为2018/4/23 3:45,表三中的倒数第二条数据的结束时间为2018/4/23 3:00,表三中的最后一条数据的结束时间为2018/4/23 3:45,则得到的目标数据表如下表四:
井号 开始时间 结束时间 故障类型
庄53-12 2018/4/23 1:20 2018/4/23 2:00 供液不足
刘7-8H 2018/4/23 2:00 2018/4/23 3:45 供液不足
庄53-12 2018/4/23 2:25 2018/4/23 3:00 供液不足
庄53-12 2018/4/23 3:00 2018/4/23 3:45 气体影响
表四
由于第二数据集中的数据相对于目标数据表中的数据少,且第二数据集与目标数据表有对应的关联关系,则先更新第二数据集中的第二故障数据的结束时间,再根据第二故障数据的结束时间,更新目标数据表中第二故障数据的结束时间,比直接更新目标数据表中第二故障数据的结束时间来说,更新效率更高。
步骤211,记录所述获取源数据表中预定时间段内的增量数据的获取时间。
在本发明实施例中,在每次获取源数据表中预定时间段内的增量数据时,记录获取时间,以便下次获取增量数据时使用。其中,预定时间段为前时刻与上次获取时间之间的时间段。
依次循环执行步骤201至步骤211,将源数据表中的增量数据不断地合并到目标数据表中。
在本发明实施例中,获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集,检测目标数据表中的每个目标对象标识对应的目标对象,是否存在与第一故障数据属于同一故障类型,且没有结束时间的故障数据,若存在,则确定第一故障数据存在于目标数据表中,若不存在,则确定第一故障数据不存在于目标数据表中,若不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,若存在于目标数据表中,则直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,获取第一数据集中,与第二故障数据的开始时间间隔最小的、且与第二故障数据的状态类型不一样的目标故障数据,根据目标故障数据对应的时间信息,更新第二数据集中的第二故障数据的结束时间,根据第二数据集中的第二故障数据的结束时间,更新目标数据表中第二故障数据的结束时间,记录获取源数据表中预定时间段内的增量数据。根据源数据表中的增量数据,向目标数据表中插入新的第一故障数据,并更新目标数据表中没有结束时间的第二故障数据的结束时间,能够高效快速的将增量数据合并到目标数据表中,使得用户可以在目标数据表中快速得知故障发生的时刻和时长;而且采用先更新第二数据集中的第二故障数据的结束时间,再根据第二数据集中的结束时间,更新目标数据表中第二故障数据的结束时间的方法,更新效率更高。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例三
参照图3,示出了本发明实施例的一种数据处理装置的结构框图,所述数据处理装置300具体可以包括如下模块:
增量数据获取模块301,用于获取源数据表中预定时间段内的增量数据,生成第一数据集;所述第一数据集包括目标对象标识,以及对应的时间信息和状态类型,所述状态类型包括正常状态和至少一个故障类型;
检测模块302,用于检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中;所述第一故障数据为所述第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或所述第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据;
插入模块303,用于若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间;
第一提取模块304,用于提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
第二提取模块305,用于若存在于所述目标数据表中,则直接提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
更新模块306,用于根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间。
参照图4,示出了本发明实施例的另一种数据处理装置的结构框图。
在图3的基础上,可选的,所述检测模块302,包括:
检测子模块3021,用于检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据;
第一确定子模块3022,用于若存在,则确定所述第一故障数据存在于所述目标数据表中;
第二确定子模块3023,用于若不存在,则确定所述第一故障数据不存在于所述目标数据表中。
可选的,所述更新模块306,包括:
目标故障数据获取子模块3061,用于获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据;
第一更新子模块3062,用于根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间;
第二更新子模块3063,用于根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
可选的,所述数据处理装置300,还包括:
记录模块307,用于记录所述获取源数据表中预定时间段内的增量数据的获取时间;
所述增量数据获取模块301,包括:
增量数据获取子模块3011,用于获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集。
可选的,所述目标数据表还包括标识字段,当所述标识字段为第一标识字段时,所述目标数据表中对应的第二故障数据的结束时间更新完成;当所述标识字段为第二标识字段时,所述目标数据表中对应的第二故障数据的结束时间未更新完成。
在本发明实施例中,通过获取源数据表中预定时间段内的增量数据,生成第一数据集,检测第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中,若不存在于目标数据表中,则在目标数据表中插入第一故障数据,并将第一故障数据的时间信息作为开始时间,提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,若存在于目标数据表中,则直接提取出目标数据表中没有结束时间的第二故障数据,生成第二数据集,根据第二数据集和第一数据集,更新目标数据表中第二故障数据的结束时间。根据源数据表中的增量数据,向目标数据表中插入新的第一故障数据,并更新目标数据表中没有结束时间的第二故障数据的结束时间,能够高效快速的将增量数据合并到目标数据表中,使得用户可以在目标数据表中快速得知故障发生的时刻和时长。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的数据处理方法。
本发明实施例另外提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的数据处理方法。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据处理方法及装置设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (6)

1.一种数据处理方法,其特征在于,包括:
获取源数据表中预定时间段内的增量数据,生成第一数据集;所述第一数据集包括目标对象标识,以及对应的时间信息和状态类型,所述状态类型包括正常状态和至少一个故障类型;
检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中;所述第一故障数据为所述第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或所述第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据;
若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间;
提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
若存在于所述目标数据表中,则直接执行所述提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集的步骤;
根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间;
所述检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中的步骤,包括:
检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据;
若存在,则确定所述第一故障数据存在于所述目标数据表中;
若不存在,则确定所述第一故障数据不存在于所述目标数据表中;
所述根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间的步骤,包括:
获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据;
根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间;
根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间的步骤之后,还包括:
记录所述获取源数据表中预定时间段内的增量数据的获取时间;
所述获取源数据表中预定时间段内的增量数据,生成第一数据集的步骤,包括:
获取源数据表中当前时刻与上次获取时间之间的时间段内的增量数据,生成第一数据集。
3.根据权利要求1所述的方法,其特征在于,所述目标数据表还包括标识字段,当所述标识字段为第一标识字段时,所述目标数据表中对应的第二故障数据的结束时间更新完成;当所述标识字段为第二标识字段时,所述目标数据表中对应的第二故障数据的结束时间未更新完成。
4.一种数据处理装置,其特征在于,包括:
增量数据获取模块,用于获取源数据表中预定时间段内的增量数据,生成第一数据集;所述第一数据集包括目标对象标识,以及对应的时间信息和状态类型,所述状态类型包括正常状态和至少一个故障类型;
检测模块,用于检测所述第一数据集中每个目标对象标识对应的目标对象的第一故障数据是否存在于目标数据表中;所述第一故障数据为所述第一数据集中的每个目标对象第一次出现故障时对应的数据,和/或所述第一数据集中的每个目标对象在正常状态后再次出现故障时对应的数据;
插入模块,用于若不存在于所述目标数据表中,则在所述目标数据表中插入所述第一故障数据,并将所述第一故障数据的时间信息作为开始时间;
第一提取模块,用于提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
第二提取模块,用于若存在于所述目标数据表中,则直接提取出所述目标数据表中没有结束时间的第二故障数据,生成第二数据集;
更新模块,用于根据所述第二数据集和所述第一数据集,更新所述目标数据表中所述第二故障数据的结束时间;
所述检测模块,包括:
检测子模块,用于检测所述目标数据表中的所述每个目标对象标识对应的目标对象,是否存在与所述第一故障数据属于同一故障类型,且没有结束时间的故障数据;
第一确定子模块,用于若存在,则确定所述第一故障数据存在于所述目标数据表中;
第二确定子模块,用于若不存在,则确定所述第一故障数据不存在于所述目标数据表中;
所述更新模块,包括:
目标故障数据获取子模块,用于获取所述第一数据集中,与所述第二故障数据的开始时间间隔最小的、且与所述第二故障数据的状态类型不一样的目标故障数据;
第一更新子模块,用于根据所述目标故障数据对应的时间信息,更新所述第二数据集中的第二故障数据的结束时间;
第二更新子模块,用于根据所述第二数据集中的第二故障数据的结束时间,更新所述目标数据表中所述第二故障数据的结束时间。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1~3中任一项所述的数据处理方法。
6.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1~3中任一项所述的数据处理方法。
CN201811152082.6A 2018-09-29 2018-09-29 一种数据处理方法及装置 Active CN110990395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811152082.6A CN110990395B (zh) 2018-09-29 2018-09-29 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811152082.6A CN110990395B (zh) 2018-09-29 2018-09-29 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN110990395A CN110990395A (zh) 2020-04-10
CN110990395B true CN110990395B (zh) 2023-04-07

Family

ID=70059781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811152082.6A Active CN110990395B (zh) 2018-09-29 2018-09-29 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN110990395B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270253A (zh) * 2011-06-15 2011-12-07 北京航空航天大学 一种基于状态图的机内测试建模仿真方法
CN102484365A (zh) * 2009-08-31 2012-05-30 Abb研究有限公司 故障相选择和故障类型确定的方法
CN105373448A (zh) * 2015-10-27 2016-03-02 北京百度网讯科技有限公司 数据库中故障数据的恢复方法和系统
CN107888397A (zh) * 2016-09-30 2018-04-06 华为技术有限公司 确定故障类型的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698410B2 (en) * 2007-04-27 2010-04-13 Yahoo! Inc. Context-sensitive, self-adjusting targeting models

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102484365A (zh) * 2009-08-31 2012-05-30 Abb研究有限公司 故障相选择和故障类型确定的方法
CN102270253A (zh) * 2011-06-15 2011-12-07 北京航空航天大学 一种基于状态图的机内测试建模仿真方法
CN105373448A (zh) * 2015-10-27 2016-03-02 北京百度网讯科技有限公司 数据库中故障数据的恢复方法和系统
CN107888397A (zh) * 2016-09-30 2018-04-06 华为技术有限公司 确定故障类型的方法和装置

Also Published As

Publication number Publication date
CN110990395A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
US9262260B2 (en) Information processing apparatus, information processing method, and recording medium
CN109934268B (zh) 异常交易检测方法及系统
US20120209882A1 (en) System, method, and computer readable media for identifying a user-initiated log file record in a log file
CN110537170B (zh) 分析大规模数据处理作业的方法、系统以及计算机可读存储设备
CN104216822B (zh) 一种异常信息的处理方法及装置
CN111767227A (zh) 一种录制回放测试的方法及装置
CN105630934A (zh) 一种数据统计方法及系统
CN109358898B (zh) 一种信息处理方法、装置、电子设备和存储介质
CN111680085A (zh) 数据处理任务分析方法、装置、电子设备和可读存储介质
CN111125298A (zh) 重建ntfs文件目录树的方法、设备及存储介质
CN112256635A (zh) 一种识别文件类型的方法及装置
CN113918658A (zh) 恢复数据的方法及装置
CN112783749A (zh) 一种静态代码扫描优化方法、装置、电子设备和存储介质
CN104794130A (zh) 一种表间关联查询方法和装置
CN108093275B (zh) 一种数据处理方法及装置
CN104965779A (zh) 一种基于PoolMon的内存泄露检测和定位的方法及装置
CN110737585A (zh) Ui自动化测试用例及系统、页面元素加载等待方法及系统
CN110990395B (zh) 一种数据处理方法及装置
CN111413952B (zh) 机器人故障检测方法、装置、电子设备及可读存储介质
CN109144874B (zh) 一种测试环境的监测方法和装置
CN108108467B (zh) 数据删除方法及装置
CN106569731B (zh) 极限存储方法、装置及设备
CN107908697B (zh) 主机批处理作业结果的自动采集方法及装置
CN109189672A (zh) 微服务的自动测试方法、服务器及计算机可读存储介质
CN106570024B (zh) 数据增量处理的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant