CN105138656A - 一种处理数据的方法及装置 - Google Patents

一种处理数据的方法及装置 Download PDF

Info

Publication number
CN105138656A
CN105138656A CN201510548026.4A CN201510548026A CN105138656A CN 105138656 A CN105138656 A CN 105138656A CN 201510548026 A CN201510548026 A CN 201510548026A CN 105138656 A CN105138656 A CN 105138656A
Authority
CN
China
Prior art keywords
data
target data
linked list
message queue
speed message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510548026.4A
Other languages
English (en)
Inventor
李光学
张田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Co Ltd
Original Assignee
Inspur Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Co Ltd filed Critical Inspur Software Co Ltd
Priority to CN201510548026.4A priority Critical patent/CN105138656A/zh
Publication of CN105138656A publication Critical patent/CN105138656A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种处理数据的方法及装置,该方法包括:获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;获取每个线性链表中的每个目标数据的存入时间;根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。本发明提供了一种处理数据的方法及装置,能够对全量数据进行流计算。

Description

一种处理数据的方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种处理数据的方法及装置。
背景技术
传统的计算机分析和数据整理方式,首先是收集数据,然后储存在数据库程序中并且在收到请求后搜索这些数据。这是一个高效的处理方式,但却是一个紧绷的结构,而且通常会造成时间的浪费。而在流计算当中,高级软件的运算法则在接收流数据时就开始对其进行分析。现有技术中,主要是对增量数据进行增量流计算,针对全量数据还没有一种较有效的流计算方法。
发明内容
有鉴于此,本发明提供了一种处理数据的方法及装置,能够对全量数据进行流计算。
一方面,本发明提供了一种处理数据的方法,包括:
S0:获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
S1:获取每个线性链表中的每个目标数据的存入时间;
S2:根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
S3:根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
S4:根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
进一步地,该方法还包括:预先设置高速消息队列;
所述S0中,所述获取目标数据包括:
通过高速消息队列接收外部输入的待处理数据;
接收外部输入的数据需求信息;
根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
进一步地,该方法还包括:接收外部输入的目标字段信息;
所述S3,包括:
根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段;
确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
进一步地,所述将具有相同主键的目标数据存储到同一个线性链表中,包括:
按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
进一步地,在所述通过高速消息队列接收外部输入的待处理数据之后,还包括:将所述高速消息队列接收到的待处理数据存储到内存中。
进一步地,该方法还包括:预先为每个高速消息队列设置互为备份的备份高速消息队列;
将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
另一方面,本发明提供了一种处理数据的装置,包括:
数据获取单元,用于获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
时间获取单元,用于获取每个线性链表中的每个目标数据的存入时间;
第一确定单元,用于根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
第二确定单元,用于根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
流计算单元,用于根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
进一步地,该装置还包括:第一设置单元,用于设置高速消息队列;
所述数据获取单元,在执行所述获取目标数据时,具体执行:通过高速消息队列接收外部输入的待处理数据,接收外部输入的数据需求信息,根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
进一步地,该装置还包括:接收单元,用于接收外部输入的目标字段信息;
所述第二确定单元,用于根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段,确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
进一步地,所述数据获取单元,在执行所述将具有相同主键的目标数据存储到同一个线性链表中时,具体执行:按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
进一步地,所述数据获取单元,还用于在所述通过高速消息队列接收外部输入的待处理数据之后,将所述高速消息队列接收到的待处理数据存储到内存中。
进一步地,该装置还包括:第二设置单元,用于为每个高速消息队列设置互为备份的备份高速消息队列;
备份单元,用于将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
通过本发明实施例提供的一种处理数据的方法及装置,将具有相同主键的目标数据存储到同一个线性链表中,然后针对每个线性链表中的目标数据进行处理,通过记录目标数据的存入时间来确定目标数据之间的先后关系,进而确定出目标数据及其前目标数据的增量数据,实现了对目标数据的处理转换为对增量数据的处理,根据每个线性链表中的增量数据,对每个线性链表中的所有目标数据进行处理,能够实现对全量数据的流计算。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种处理数据的方法的流程图;
图2是本发明一实施例提供的另一种处理数据的方法的流程图
图3是本发明一实施例提供的一种处理数据的装置的示意图;
图4是本发明一实施例提供的另一种处理数据的装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种处理数据的方法,该方法可以包括以下步骤:
S0:获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
S1:获取每个线性链表中的每个目标数据的存入时间;
S2:根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
S3:根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
S4:根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
通过本发明实施例提供的一种处理数据的方法,将具有相同主键的目标数据存储到同一个线性链表中,然后针对每个线性链表中的目标数据进行处理,通过记录目标数据的存入时间来确定目标数据之间的先后关系,进而确定出目标数据及其前目标数据的增量数据,实现了对目标数据的处理转换为对增量数据的处理,根据每个线性链表中的增量数据,对每个线性链表中的所有目标数据进行处理,能够实现对全量数据的流计算。
为了便于获取外部输入的目标数据,可以将高速消息队列作为与外部连接的统一接口,外部只需向高速消息队列中输入数据即可。在一种可能的实现方式中,该方法还包括:预先设置高速消息队列。
所述获取目标数据包括:通过高速消息队列接收外部输入的待处理数据,接收外部输入的数据需求信息,根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
其中,外部根据处理要求设置数据需求信息,该数据需求信息可以是数据类型。
为了保证同一线性链表中的数据的先后顺序更加准确,在一种可能的实施方式中,所述将具有相同主键的目标数据存储到同一个线性链表中,包括:
按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
为了加快数据处理的速度,节省数据读取的时间,可以将高速消息队列中的数据都储存在内存中,这样就节省了从硬盘中读取数据的时间。在一种可能的实现方式中,所述通过高速消息队列接收外部输入的待处理数据之后,还包括:将所述高速消息队列接收到的待处理数据存储到内存中。
为了保证高速消息队列中的数据的安全,可以为每个高速消息队列设置备份高速消息队列。具体地,该方法还包括:预先为每个高速消息队列设置互为备份的备份高速消息队列。
将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
另外,可以通过多个高速消息队列接收外部发来的数据,在接收数据时,可以通过设置的控制模块跟进每个高速消息队列的负载情况,为每个高速消息队列分配数据,也可以通过对数据标识取模的方式来分配数据。举例来说,每个数据都将交易顺序号作为标识,则可以根据交易顺序号取模的方式为不同的高速消息队列分配数据。这样可以使得对应同一个标识的数据存储到同一个高速消息队列中,便于后续数据的获取和处理。通过以上的数据分配方式,还能实现高速交易队列的动态负载均衡和水平扩展。
在进行数据处理时,可能只需要对一条数据的某些字段进行处理即可,在一种可能的实现方式中,该方法还包括:接收外部输入的目标字段信息。
所述S3,包括:根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段;确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
本发明实施例中的目标数据可以是全量数据,全量数据是指每次接收的数据都是一个时间点的镜像数据,只是产生数据的那个时间点的一个数据最终结果,不是过程数据。本发明实施例中,通过追溯到每个全量数据的历史上的上一个数据,或者全部数据,从而计算出整个数据的增量过程,得到增量数据,然后对增量数据进行流计算。
在本发明实施例中,流计算依赖的是高速消息队列,因为取的历史数据,可以从高速交易队列中查询获得。本发明实施例中,可以用户可以通过配置文件来输入数据需求信息和目标字段信息。本发明实施例计算出全局和指定维度的增量结果,并把处理后的数据发送的业务端,进行下一步的业务处理。
另外,为了简化开发过程,可以将本发明实施例提高的方法针对企业开发做了一些统一的封装,在企业开发框架下,封装传统流计算的所需要的复杂操作,统一计算模型,并分析目前数据处理过程中的数据模型,进行高度抽象后,形成了统一的数据传输模型,使流计算所需要的算法和数据模型做统一处理,不再让业务开发人员接触,使流计算变成简单配置就可以直接从此架构中接受处理后的数据,并把数据用于展示或者进一步处理。
本发明实施例提供的方法,在现有业务基础上,能够通过配置实施全量数据的流计算,节约开发成本,节约了人力成本,同时,通过使用流计算,节约了统计分析的计算成本,节约了硬件资源成本。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
本发明实施例针对网上购物产生的订单数据进行流计算处理,其中,产生的订单数据均属全量数据。举例来说,一个客户在网上购买了一个书包,产生的订单的订单号为001,在订单001中,书包的数量是1,价格是100,则高速消息队列接收到的是一条以订单号001为主键的交易数据A,交易数据A中有两个字段,数量字段和价格字段,数量字段的数值为1,价格字段的数值为100。之后,该客户想购买三个书包,并修改了订单001,在修改后的订单001中,书包的数量是3,价格是300,在修改后,高速消息队列接收到以订单001为主键的交易数据B,交易数据B中数量字段为3,价格字段为300。修改前和修改后的交易数据的增量数据为数量字段为2,价格字段200的数据。可见,高速消息队列接收到的是全量数据,并不是增量数据。在本发明实施例中,对高速消息队列中的全量数据进行流计算。另外,外部可能还会向高速消息队列中存储交易数据外其他数据,用户可以通过设置数据请求信息的方式来获取交易数据。
如图2所示,本发明实施例提供了一种数据处理的方法,该方法可以包括以下步骤:
步骤201:预先设置高速消息队列,通过高速消息队列接收外部输入的待处理数据。
步骤202:接收外部输入的交易数据需求信息和数量字段信息。
用户通过输入交易数据需求信息向高速消息队列获取交易数据。通过输入数量字段信息来对数量字段进行处理。
步骤203:根据交易数据需求信息,从高速消息队列中的待处理数据中筛选出目标数据,该目标数据包括:修改前的为以订单号001为主键的交易数据A,以及修改后的为以订单号001为主键的交易数据B。
其中,交易数据A中数量字段的数值为1,价格字段的数值为100。交易数据B中数量字段为3,价格字段为300。
步骤204:按照高速消息队列接收目标数据的时间顺序,将主键均为订单号001的交易数据A和交易数据B依次存储到线性链表C中,记录交易数据A和交易数据B存入线性链表C中的存入时间,交易数据A的存入时间为8:00,交易数据B的存入时间为8:01。
由于高速消息队列先接收到交易数据A,因此先将交易数据A存储到线性链表C中。
步骤205:获取线性链表C中交易数据A的存入时间为8:00,并获取线性链表C中交易数据B的存入时间为8:01。
步骤206:根据线性链表C中的交易数据A和交易数据B的存入时间,确定交易数据B的在线性链表C中的前一个存入的前目标数据为交易数据A。
由于交易数据A存入的时间比交易数据B存入的时间早,且两个存入时间之间没有存入其他数据,因此,交易数据A为交易数据B的前目标数据。由于线性链表C中,在交易数据A存入之前没有其他数据存入,因此,交易数据A没有前目标数据。
步骤207:根据数量字段信息,确定交易数据A和交易数据B的数量字段。
由于输入的是数量字段信息,因此用户需要对数量字段进行处理。这里只需提取交易数据中的数量字段进行处理即可。
步骤208:确定交易数据B的数量字段与交易数据A的数量字段的增量数据为2。
通过该步骤确定交易数据B与其前目标数据的增量数据,即交易数据B与交易数据A的增量数据。在交易数据B中,数量字段为3,在交易数据A中,数量字段为1,因此,从交易数据A到交易数据B,数量字段的增量为2。
步骤209:根据线性链表C中的增量数据,对应线性链表C中的所有目标数据进行流计算。
通过本发明实施例提供的一种处理数据的方法,将对全量数据的计算转换为对增量数据的计算,进而实现了对全量数据的流计算。该方法通过高速消息队列接收外部输入的数据,可以解耦各种复杂的应用情况,通过对目标数据的回溯,实现对全量数据项增量数据的转换。
如图3、图4所示,本发明实施例提供了一种处理数据的装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的一种处理数据的装置所在设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种处理数据的装置,包括:
数据获取单元401,用于获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
时间获取单元402,用于获取每个线性链表中的每个目标数据的存入时间;
第一确定单元403,用于根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
第二确定单元404,用于根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
流计算单元405,用于根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
在一种可能的实现方式中,该装置还包括:第一设置单元,用于设置高速消息队列;
所述数据获取单元401,在执行所述获取目标数据时,具体执行:通过高速消息队列接收外部输入的待处理数据,接收外部输入的数据需求信息,根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
在一种可能的实现方式中,该装置还包括:接收单元,用于接收外部输入的目标字段信息;
所述第二确定单元404,用于根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段,确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
在一种可能的实现方式中,所述数据获取单元401,在执行所述将具有相同主键的目标数据存储到同一个线性链表中时,具体执行:按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
在一种可能的实现方式中,所述数据获取单元401,还用于在所述通过高速消息队列接收外部输入的待处理数据之后,将所述高速消息队列接收到的待处理数据存储到内存中。
在一种可能的实现方式中,还包括:第二设置单元,用于为每个高速消息队列设置互为备份的备份高速消息队列;
备份单元,用于将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供的一种处理数据的方法及装置,具有如下有益效果:
1、通过本发明实施例提供的一种处理数据的方法及装置,将具有相同主键的目标数据存储到同一个线性链表中,然后针对每个线性链表中的目标数据进行处理,通过记录目标数据的存入时间来确定目标数据之间的先后关系,进而确定出目标数据及其前目标数据的增量数据,实现了对目标数据的处理转换为对增量数据的处理,根据每个线性链表中的增量数据,对每个线性链表中的所有目标数据进行处理,能够实现对全量数据的流计算。
2、通过本发明实施例提供的一种处理数据的方法及装置,将高速消息队列作为与外部连接的统一接口,使得获取外部输入的目标数据更加方便,外部只需向高速消息队列中输入数据即可。
3、通过本发明实施例提供的一种处理数据的方法及装置,将高速消息队列中的数据都储存在内存中,加快了数据处理的速度,节省了从硬盘中读取数据的时间。
4、通过本发明实施例提供的一种处理数据的方法及装置,为每个高速消息队列设置备份高速消息队列,保证了高速消息队列中的数据的安全。
5、通过本发明实施例提供的一种处理数据的方法及装置,将对全量数据的计算转换为对增量数据的计算,进而实现了对全量数据的流计算。该方法通过高速消息队列接收外部输入的数据,可以解耦各种复杂的应用情况,通过对目标数据的回溯,实现对全量数据项增量数据的转换。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种处理数据的方法,其特征在于,包括:
S0:获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
S1:获取每个线性链表中的每个目标数据的存入时间;
S2:根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
S3:根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
S4:根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
2.根据权利要求1所述的方法,其特征在于,还包括:预先设置高速消息队列;
所述S0中,所述获取目标数据包括:
通过高速消息队列接收外部输入的待处理数据;
接收外部输入的数据需求信息;
根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
3.根据权利要求1所述的方法,其特征在于,还包括:接收外部输入的目标字段信息;
所述S3,包括:
根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段;
确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
4.根据权利要求2所述的方法,其特征在于,所述将具有相同主键的目标数据存储到同一个线性链表中,包括:
按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
5.根据权利要求2所述的方法,其特征在于,
在所述通过高速消息队列接收外部输入的待处理数据之后,还包括:将所述高速消息队列接收到的待处理数据存储到内存中;
和/或,
还包括:预先为每个高速消息队列设置互为备份的备份高速消息队列;
将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
6.一种处理数据的装置,其特征在于,包括:
数据获取单元,用于获取目标数据,将具有相同主键的目标数据存储到同一个线性链表中,记录每个目标数据存入对应的线性链表中的存入时间;
时间获取单元,用于获取每个线性链表中的每个目标数据的存入时间;
第一确定单元,用于根据每个线性链表中的每个目标数据的存入时间,确定每个目标数据的在同一个线性链表中的前一个存入的前目标数据;
第二确定单元,用于根据每个目标数据和每个目标数据对应的前目标数据,确定所述每个目标数据与对应的前目标数据的增量数据;
流计算单元,用于根据每个线性链表中的每个增量数据,对应每个线性链表中的所有目标数据进行处理。
7.根据权利要求6所述的方法,其特征在于,还包括:第一设置单元,用于设置高速消息队列;
所述数据获取单元,在执行所述获取目标数据时,具体执行:通过高速消息队列接收外部输入的待处理数据,接收外部输入的数据需求信息,根据所述数据需求信息,从所述高速消息队列中的所述待处理数据中筛选出所述目标数据。
8.根据权利要求6所述的装置,其特征在于,还包括:接收单元,用于接收外部输入的目标字段信息;
所述第二确定单元,用于根据所述目标字段信息,确定所述每个目标数据的目标字段,以及每个前目标数据的目标字段,确定所述每个目标数据的目标字段与每个目标数据对应的前目标数据的目标字段的增量数据。
9.根据权利要求7所述的装置,其特征在于,所述数据获取单元,在执行所述将具有相同主键的目标数据存储到同一个线性链表中时,具体执行:按照所述高速消息队列接收所述目标数据的时间顺序,将具有相同主键的目标数据依次存储到同一个线性链表中。
10.根据权利要求7所述的装置,其特征在于,所述数据获取单元,还用于在所述通过高速消息队列接收外部输入的待处理数据之后,将所述高速消息队列接收到的待处理数据存储到内存中;
和/或,
还包括:第二设置单元,用于为每个高速消息队列设置互为备份的备份高速消息队列;
备份单元,用于将每个高速消息队列接收到的待处理数据写入到日志文件中,将写入到日志文件中的待处理消息写入到每个高速消息队列对应的备份高速消息队列中。
CN201510548026.4A 2015-08-31 2015-08-31 一种处理数据的方法及装置 Pending CN105138656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510548026.4A CN105138656A (zh) 2015-08-31 2015-08-31 一种处理数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510548026.4A CN105138656A (zh) 2015-08-31 2015-08-31 一种处理数据的方法及装置

Publications (1)

Publication Number Publication Date
CN105138656A true CN105138656A (zh) 2015-12-09

Family

ID=54724004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510548026.4A Pending CN105138656A (zh) 2015-08-31 2015-08-31 一种处理数据的方法及装置

Country Status (1)

Country Link
CN (1) CN105138656A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656863A (zh) * 2016-12-31 2017-05-10 广东欧珀移动通信有限公司 业务监控方法、装置和计算机设备
CN108062350A (zh) * 2017-11-08 2018-05-22 深圳市金立通信设备有限公司 一种数据处理方法、节点设备及计算机可读介质
CN110019671A (zh) * 2017-11-07 2019-07-16 北京京东尚科信息技术有限公司 一种处理实时消息的方法和系统
CN111597200A (zh) * 2019-02-21 2020-08-28 阿里巴巴集团控股有限公司 数据处理方法、装置及存储介质
CN111985944A (zh) * 2019-05-21 2020-11-24 北京沃东天骏信息技术有限公司 物料数据的处理方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184501A1 (en) * 2005-02-17 2006-08-17 Fuji Xerox Co., Ltd. Information analysis apparatus, information analysis method, and information analysis program
CN101106477A (zh) * 2006-07-12 2008-01-16 中兴通讯股份有限公司 基于流水号生成增量数据的方法
CN102521225A (zh) * 2011-09-29 2012-06-27 用友软件股份有限公司 增量数据抽取装置和增量数据抽取方法
CN102841897A (zh) * 2011-06-23 2012-12-26 阿里巴巴集团控股有限公司 一种实现增量数据抽取的方法、装置及系统
CN104125600A (zh) * 2013-04-27 2014-10-29 腾讯科技(深圳)有限公司 移动终端的流量识别方法和装置
CN104156367A (zh) * 2013-05-14 2014-11-19 阿里巴巴集团控股有限公司 一种搜索引擎的扩容方法及搜索服务系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184501A1 (en) * 2005-02-17 2006-08-17 Fuji Xerox Co., Ltd. Information analysis apparatus, information analysis method, and information analysis program
CN101106477A (zh) * 2006-07-12 2008-01-16 中兴通讯股份有限公司 基于流水号生成增量数据的方法
CN102841897A (zh) * 2011-06-23 2012-12-26 阿里巴巴集团控股有限公司 一种实现增量数据抽取的方法、装置及系统
CN102521225A (zh) * 2011-09-29 2012-06-27 用友软件股份有限公司 增量数据抽取装置和增量数据抽取方法
CN104125600A (zh) * 2013-04-27 2014-10-29 腾讯科技(深圳)有限公司 移动终端的流量识别方法和装置
CN104156367A (zh) * 2013-05-14 2014-11-19 阿里巴巴集团控股有限公司 一种搜索引擎的扩容方法及搜索服务系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡向英: "校园一卡通系统安全平台的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656863A (zh) * 2016-12-31 2017-05-10 广东欧珀移动通信有限公司 业务监控方法、装置和计算机设备
CN110019671A (zh) * 2017-11-07 2019-07-16 北京京东尚科信息技术有限公司 一种处理实时消息的方法和系统
CN108062350A (zh) * 2017-11-08 2018-05-22 深圳市金立通信设备有限公司 一种数据处理方法、节点设备及计算机可读介质
CN111597200A (zh) * 2019-02-21 2020-08-28 阿里巴巴集团控股有限公司 数据处理方法、装置及存储介质
CN111985944A (zh) * 2019-05-21 2020-11-24 北京沃东天骏信息技术有限公司 物料数据的处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Al-Sai et al. Big data impacts and challenges: a review
CN105138656A (zh) 一种处理数据的方法及装置
CN106909372B (zh) 一种移动端用户购买路径计算方法及系统
CN112256720B (zh) 数据成本计算方法、系统、计算机设备和存储介质
CN111339073A (zh) 实时数据处理方法、装置、电子设备及可读存储介质
US9881036B2 (en) Avoid double counting of mapped database data
EP3021224B1 (en) Method and apparatus for producing a benchmark application for performance testing
US9009175B2 (en) System and method for database migration and validation
CN103399797B (zh) 服务器资源配置方法及装置
CN110728422A (zh) 用于施工项目的建筑信息模型、方法、装置和结算系统
CN105630934A (zh) 一种数据统计方法及系统
CN109254976A (zh) 一种图形的绘制方法、装置、电子设备及存储介质
CN111639121A (zh) 一种构建客户画像的大数据平台及构建方法
CN110852559A (zh) 资源的分配方法和装置、存储介质、电子装置
CN109242298A (zh) 一种智能派工过程中的工单分配方法及装置
CN102347851B (zh) 事件处理方法及服务器
CN110781235A (zh) 基于大数据的采购数据处理方法、装置、终端及存储介质
CN110737673B (zh) 一种数据处理的方法及系统
CN103455509A (zh) 一种获取时间窗口模型参数的方法和系统
CN109472680A (zh) 一种账务处理方法及系统
CN106920124A (zh) 一种数据采集和分析方法及装置
US8417594B2 (en) Dimension-based financial reporting using multiple combinations of dimensions
CN109800265A (zh) 数据加载方法、装置、设备及计算机可读存储介质
CN111857670B (zh) 应用架构的确定方法和装置
CN114791915A (zh) 数据归集方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151209

WD01 Invention patent application deemed withdrawn after publication