CN105656706B - 业务数据的处理方法及设备 - Google Patents

业务数据的处理方法及设备 Download PDF

Info

Publication number
CN105656706B
CN105656706B CN201410649441.4A CN201410649441A CN105656706B CN 105656706 B CN105656706 B CN 105656706B CN 201410649441 A CN201410649441 A CN 201410649441A CN 105656706 B CN105656706 B CN 105656706B
Authority
CN
China
Prior art keywords
log
data
servers
log data
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410649441.4A
Other languages
English (en)
Other versions
CN105656706A (zh
Inventor
任长延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tongda Unlimited Technology Co ltd
Original Assignee
Beijing Tongda Unlimited Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tongda Unlimited Technology Co ltd filed Critical Beijing Tongda Unlimited Technology Co ltd
Priority to CN202010820014.3A priority Critical patent/CN112003743B/zh
Priority to CN201410649441.4A priority patent/CN105656706B/zh
Publication of CN105656706A publication Critical patent/CN105656706A/zh
Application granted granted Critical
Publication of CN105656706B publication Critical patent/CN105656706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施例公开了一种业务数据的处理方法及设备。该方法包括:从多个服务器获取相应的业务数据,其中多个服务器分别用于多种业务;基于该业务数据,生成日志数据;以及将该日志数据分别存储在与该业务数据相应的服务器的相应位置处。本发明的实施例能够获得规范和统一的日志数据并且将其直接用于大数据应用,从而提高大数据应用特别是大数据收集和大数据解析的工作效率。

Description

业务数据的处理方法及设备
技术领域
本发明的实施例涉及数据处理,具体涉及一种业务数据的处理方法及设备。
背景技术
随着互联网的迅猛发展,各个互联网企业每天都会产生海量业务数据。通过对这些业务数据进行大数据应用,例如进行大数据收集、大数据解析和大数据分析等操作,互联网企业能够有效进行企业战略决策。
然而,各种业务的业务数据之间可能不规范和不统一从而不适于直接用于大数据应用。例如,用于出租车业务的业务数据更关注于出租车和乘客的距离,于是按照一种格式生成业务数据,而用于专车业务的业务数据更关注于专车的支付流程,于是按照另外一种格式生成业务数据,这就使得它们的业务数据在数据格式上存在一定差异,这些差异将降低大数据应用特别是大数据收集和大数据解析的工作效率。
发明内容
本发明的实施例旨在提供一种业务数据的处理方法及设备,能够解决相关技术中大数据应用的工作效率不高的问题。
根据本发明的一个方面,提供了一种业务数据的处理方法。该方法包括:从多个服务器获取相应的业务数据,其中多个服务器分别用于多种业务;基于该业务数据,生成日志数据;以及将该日志数据分别存储在与该业务数据相应的服务器的相应位置处。
根据本发明的一个方面,还提供了一种业务数据的处理方法。该方法包括:从多个服务器的相应位置处获取多个日志文件;以及将多个日志文件分别存储到多个文件夹中,其中多个服务器分别用于多种业务,多个日志文件分别基于相应的日志数据而生成,这些日志数据分别基于从多个服务器获取的相应的业务数据而生成。
根据本发明的另一个方面,提供了一种业务数据的处理设备。该设备包括:获取装置,用于从多个服务器获取相应的业务数据,其中多个服务器分别用于多种业务;第一生成装置,用于基于该业务数据,生成日志数据;以及存储装置,用于将该日志数据分别存储在与该业务数据相应的服务器的相应位置处,以用于大数据应用。
根据本发明的另一个方面,还提供了一种业务数据的处理设备。该设备包括:第一获取装置,用于从多个服务器的相应位置处获取多个日志文件;以及存储装置,用于将多个日志文件分别存储到多个文件夹中,其中多个服务器分别用于多种业务,多个日志文件分别基于相应的日志数据而生成,该日志数据分别基于从多个服务器获取的相应的业务数据而生成。
本发明的实施例能够获得规范和统一的日志数据并且将其直接用于大数据应用,从而提高大数据应用特别是大数据收集和大数据解析的工作效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是图示了本发明的实施例可实现于其中的网络架构100的图;
图2是根据本发明的实施例的业务数据的处理方法200的流程图;
图3是根据本发明的实施例的业务数据的处理方法300的流程图;
图4是根据本发明的实施例的业务数据的处理设备400的结构框图;以及
图5是根据本发明的实施例的业务数据的处理设备500的结构框图。
具体实施方式
下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当理解,描述这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
参考图1,其图示了本发明的实施例可实现于其中的网络架构100的图。该网络架构100包括由网络120连接的多个服务器102、104、106、112、114和116。这些服务器可以分别用于不同的业务。例如,服务器102、104和106可以分别用于出租车业务,而服务器112、114和116可以分别用于专车业务。另外,该网络架构100还可以包括用于大数据应用的大数据服务器122。这些服务器中的每个服务器都可以包括处理设备和数据库,该数据库用于存储相应的计算机指令和业务数据,该处理设备用于执行在相应的数据库中所存储的计算机指令以执行例如根据本发明的实施例的业务数据处理的功能。
本领域技术人员可以理解,上述服务器既可以代表比如计算机服务器的单个计算设备,也可以代表一起工作以执行功能的多个计算设备(例如云服务器hadoop)。同时,上述网络120既可以是公用通信网络(例如因特网、蜂窝数据网络、通过电话的拨号调制解调器网络),也可以是私有通信网络(例如私有局域网、专线)。
应当理解,图1中的网络架构100仅仅用于说明目的,并非旨在限制本发明的实施例的范围。在某些情况下,某些组件可以按照具体需要而增加或者减少。
图2是根据本发明的实施例的业务数据的处理方法200的流程图。本领域技术人员可以理解,该方法200可以由参考图1所示的服务器中的处理设备来执行。为讨论方便,下文将参考图1所示的网络结构100来描述该方法200。
在方法200开始之后,在步骤S202,从多个服务器获取相应的业务数据,其中这些服务器分别用于多种业务。例如,在图1中的网络架构100中,可以分别从服务器102、104和106获取用于出租车业务的业务数据,和/或分别从服务器112、114和116获取用于专车业务的业务数据。这种获取既可以由该服务器内部的处理设备来执行,也可以由该服务器外部的处理设备来执行。本领域技术人员可以理解,由该服务器内部的处理设备来执行是简便地从而是可选地,这可以减少业务数据在网络中的传输量。
接下来,该方法200进行到步骤S204,基于该业务数据,生成日志数据。如本发明背景技术部分所说明的,各种业务的业务数据由于不规范和不统一因而不适于直接用于大数据应用。因此,本发明的实施例基于这些业务数据而生成具有特定格式的日志数据从而使得该日志数据规范和统一。例如,如下文将更加详细描述的,如果需要将用于出租车业务的业务数据和用于专车业务的业务数据都用于微信支付的大数据应用,则所生成的日志数据可以包括这些业务数据所共有的数据,例如支付时间、支付总额、利用微信红包所支付的金额以及利用现金所支付的金额,从而避免由于业务数据不规范和不统一所产生的影响。
该方法200继而进行到步骤S206,将上述日志数据分别存储在与上述业务数据相应的服务器的相应位置处。例如,在图1中的网络架构100中,对于从服务器102所获取的业务数据,在通过上述步骤S204生成相应的日志数据之后,将该日志数据存储在该服务器102的相应位置处。其中,该相应位置既可以与获取该业务数据的位置相同,也可以与获取该业务数据的位置不同。本领域技术人员可以理解,该相应位置与获取该业务数据的位置不同是可靠地从而是可选地,这可以将该日志数据与该业务数据进行分离以避免影响服务器102中业务的正常进行。
根据本发明的实施例,该相应位置对于每个服务器是固定的。也就是说,如果对于从服务器102所获取的业务数据,在通过上述步骤S204生成相应的日志数据之后,将该日志数据存储在该服务器102的/home/app/log文件夹中,则对于从服务器112所获取的业务数据,在通过上述步骤S204生成相应的日志数据之后,将该日志数据也存储在该服务器112的/home/app/log文件夹中。本领域技术人员可以理解,作为示例的/home/app/log文件夹可以预先建立在每个服务器中,从而避免由于业务数据的存储位置不规范和不统一所产生的影响。
在步骤S206之后,如下文将更加详细描述的,用于大数据应用的大数据服务器能够获得上述规范和统一的日志数据并且将其直接用于大数据应用,从而提高大数据应用特别是大数据收集和大数据解析的工作效率。例如,该大数据服务器可以将多个服务器的服务器编号和上述相应位置进行组合以得到多个存储位置,以及分别在这些存储位置中收集上述日志数据。
根据本发明的实施例,上述步骤S206可以实现如下:按照生成日志数据的时间所归属的时间区间,分别生成包括相应的日志数据的多个日志文件,其中每个日志文件的文件名称与该时间区间关联,以及将该多个日志文件分别存储在上述相应位置处。本领域技术人员可以理解,在这一实施例中,划分上述日志数据从而生成多个日志文件并且通过文件名称来区分这些日志文件,从而避免由于日志数据的规模不统一所产生的影响。
在这一实施例中,可以例如将每小时的日志数据划分为一个日志文件。例如,对于2014年9月12日5:00-6:00所生成的日志数据,可以建立名称为2014091206的日志文件以包括该日志数据,其中2014091206就代表了生成该日志数据的时间。类似地,对于2014年9月12日6:00-7:00所生成的日志数据,可以建立名称为2014091207的日志文件以包括该日志数据,其中2014091207就代表了生成该日志数据的时间。应当理解的是,这一实施例仅仅用于举例而非进行限制,同时本领域技术人员还可以采用其它时间区间来划分日志数据,并且还可以采用其它命名方式,其均应当纳入本发明的保护范围。
通过这一实施例,可以使得大数据服务器快捷、准确地收集某些特定时间所生成的业务数据。具体来说,该大数据服务器可以按照生成日志数据的时间所归属的时间区间而预先建立多个文件夹,其中每个文件夹中将存储相应的时间区间中的多个日志文件,其中每个日志文件的文件名称与该时间区间关联。例如,该大数据服务器可以预先建立名称为2014091206和2014091207的两个文件夹,其中前者用于存储包括2014年9月12日5:00-6:00期间、服务器102、104、106、112、114和116所生成的日志数据的日志文件,类似地后者用于存储包括2014年9月12日6:00-7:00期间、服务器102、104、106、112、114和116所生成的日志数据的日志文件。这样,经由文件夹2014091207,该大数据服务器能够快捷、准确地定位到2014年9月12日6:00-7:00期间所生成的日志数据,从而进行大数据收集。
应当理解的是,这一实施例仅仅用于举例而非进行限制,同时本领域技术人员还可以针对文件夹采用其它命名方式,例如/user/data/log/publiclog/年/月/日/时/,其均应当纳入本发明的保护范围。
上述内容通过保证日志文件存储位置和日志文件命名格式的规范和统一,从而保证了大数据收集对各种业务可以完全重复使用。具体来说,对于同种业务,不需要对新增业务数据进行任何处理,将自动生成基于该业务数据的日志数据,然后存储该日志数据以便进行大数据收集;对于不同业务,只需要在配置文件中新增相应服务器的服务器编号,同样将自动生成基于业务数据的日志数据,然后存储该日志数据以便进行大数据收集。
如上文所讨论的,上述步骤S204生成具有特定格式的日志数据从而使得该日志数据规范和统一。下面结合示例来详细描述。
第一,从业务数据中提取具有特定键名的数据以及基于所提取的数据而生成日志数据。其中,该日志数据的格式可以例如是:||键名1=键值1||键名2=键值2||键名3=键值3||键名4=键值4||。
例如,如上文所讨论的,基于出租车业务和专车业务的业务数据,对于用于微信支付的大数据应用,所生成的日志数据可以包括例如支付时间、支付总额、利用微信红包所支付的金额以及利用现金所支付的金额,这些内容都可以作为上述特定键名而用于该日志数据。因此,该日志数据的格式可以例如是:“||支付时间=0630||支付总额=20||红包金额=5||现金金额=15||”。
类似地,同样基于出租车业务和专车业务的业务数据,对于用于衡量订单价值的大数据应用,所生成的日志数据可以包括例如出发地、目的地、调度费以及抢单司机数量。因此,该日志数据的格式可以例如是:“||出发地=蓟门桥||目的地=回龙观||调度费=5||抢单司机数量=10||”。
第二,生成用于唯一指示该日志数据的类型的日志前缀以及在该日志数据中的、所提取的数据之前增加该日志前缀。
例如,对应于微信支付的日志前缀可以例如是“微信支付”或者“WechatPay”;对应于订单价值的日志前缀可以例如是“订单价值”或者“OrderValue”。因此,该日志数据的格式可以相应地是:“微信支付||支付时间=0630||支付总额=20||红包金额=5||现金金额=15||”以及“订单价值||出发地=蓟门桥||目的地=回龙观||调度费=5||抢单司机数量=10||”。
第三,如果需要针对该日志数据增加键名,则在该日志数据中的、所提取的数据之后增加该键名。
例如,对于用于微信支付的大数据应用,如果需要增加利用积分所支付的金额,则在该日志数据之后增加该键名,因此该日志数据的格式可以例如是:“微信支付||支付时间=0630||支付总额=20||红包金额=5||现金金额=10||积分金额=5||”。这样,能够避免所增加的键名对已经生成的日志数据的影响。
第四,如果需要针对该日志数据减少键名,则将该键名所对应的键值设置为默认值,而不在该日志数据中减少该键名。
例如,对于用于微信支付的大数据应用,如果需要减少利用红包所支付的金额,则将该键名所对应的键值设置为默认值(例如0),而不在该日志数据中减少该键名。因此该日志数据的格式可以例如是:“微信支付||支付时间=0630||支付总额=20||红包金额=0||现金金额=20”。这样,能够避免所减少的键名对已经生成的日志数据的影响。
通过上述四点,可以使得大数据服务器快捷、准确地解析具有特定格式和/或特定内容的日志数据。具体而言,大数据服务器可以按照该日志数据中的日志前缀来解析该日志数据,将该日志数据向相应的输出路径进行输出。例如,如果需要得到2014年9月12日6:00-7:00期间的微信支付的情况,该大数据服务器将对文件夹2014091207中的日志文件(或者日志数据)进行解析,如果解析结果指示该日志数据中的日志前缀是“微信支付”,则将该日志数据向预定的用于微信支付的大数据应用的输出路径进行输出。这样,既保证了能够通过唯一的日志前缀来区分不同的日志数据,又保证了日志数据解析程序对各种业务都可以完全重复使用。也就是说,如果需要解析得到新增日志数据,则只需要在日志数据解析程序的配置文件里面新增该日志数据的日志前缀。
图3是根据本发明的实施例的业务数据的处理方法300的流程图。本领域技术人员可以理解,该方法300可以由参考图1所示的服务器122中的处理设备来执行。为讨论方便,下文将参考图1所示的网络结构100来描述该方法300。
在方法300开始之后,在步骤S302,从多个服务器的相应位置处获取多个日志文件,其中多个服务器分别用于多种业务,多个日志文件分别基于相应的日志数据而生成,这些日志数据分别基于从多个服务器获取的相应的业务数据而生成。具体来说,该相应位置对于每个服务器是固定的,因此可以通过将多个服务器的服务器编号和该相应位置进行组合从而得到多个存储位置。也就是说,如果对于服务器102的位置是102/home/app/log,则对于服务器112的位置是112/home/app/log。
接下来,该方法300进行到步骤S304,将多个日志文件分别存储到多个文件夹中,从而进行大数据收集。具体来说,可以按照多个日志文件的文件名称而将多个日志文件分别存储到多个文件夹中,其中每个文件夹按照生成日志数据的时间所归属的时间区间而建立,该文件名称与该时间区间关联。例如,如果大数据服务器需要收集2014年9月12日6:00-7:00期间的情况,则该大数据服务器将收集名称为2014091207的日志文件,并且将所收集的日志文件存储在大数据服务器中的名称为2014091207的文件夹中。
根据本发明的实施例,该方法300还可以包括步骤S306,在多个文件夹中获取多个日志文件;以及按照多个日志文件中的日志数据的日志前缀输出日志数据,其中该日志前缀用于唯一指示日志数据的类型。例如,如果大数据服务器需要得到2014年9月12日6:00-7:00期间的微信支付的情况,则该大数据服务器将在名称为2014091207的文件夹中获取多个日志文件,对这些日志文件进行解析,如果解析结果指示该日志文件中的日志数据中的日志前缀是“微信支付”,则将该日志数据向预定的用于微信支付的大数据应用的输出路径进行输出。
本发明的实施例还提供了一个实例,用以说明上述根据本发明的实施例的业务数据的处理方法的实现过程。下面对该实例进行详细描述。
假设目前网络中部署了600台服务器,其中服务器编号分别为001-300的300台服务器用于出租车业务,服务器编号分别为301-600的另外300台服务器用于专车业务。以001号服务器和301号服务器为例,并假设将存储日志数据的位置设置为/home/app/log/,则用于存储001号服务器和301号服务器的日志数据的位置分别是:001/home/app/log/和301/home/app/log/。
因此,根据本发明的实施例的业务数据的处理方法,从001号服务器获取用于出租车业务的业务数据,基于该业务数据而生成日志数据,并且将该日志数据存储在001/home/app/log/目录。这一目录中具有成千上万条日志数据,其中按照这些日志数据的生成时间而每小时生成一个日志文件以用于包括这个小时中的这些日志数据。例如,名称为2014091207的日志文件包括在2014年9月12日6:00-7:00所生成的日志数据。另外,为了将上述业务数据用于微信支付的大数据应用,该日志数据的格式是:“微信支付||支付时间=值1||支付总额=值2||红包金额=值3||现金金额=值4||”。同时,为了将上述业务数据还用于衡量订单价值的大数据应用,该日志数据的格式是“订单价值||出发地=值1||目的地=值2||调度费=值3||抢单司机数量=值4||”。因此,例如在2014年9月12日6:00-7:00所生成的这两种日志数据将都包括于在001/home/app/log/目录中存储的、名称为2014091207的日志文件中。
类似地,根据本发明的实施例的业务数据的处理方法,从301号服务器获取用于专车业务的业务数据,基于该业务数据而生成日志数据,并且将该日志数据存储在301/home/app/log/目录。这一目录中具有成千上万条日志数据,其中按照这些日志数据的生成时间而每小时生成一个日志文件以用于包括这个小时中的这些日志数据。例如,名称为2014091207的日志文件包括在2014年9月12日6:00-7:00所生成的日志数据。另外,为了将上述业务数据用于微信支付的大数据应用,该日志数据的格式是:“微信支付||支付时间=值1||支付总额=值2||红包金额=值3||现金金额=值4||”。同时,为了将上述业务数据还用于衡量订单价值的大数据应用,该日志数据的格式是“订单价值||出发地=值1||目的地=值2||调度费=值3||抢单司机数量=值4||”。因此,例如在2014年9月12日6:00-7:00所生成的这两种日志数据将都包括于在301/home/app/log/目录中存储的、名称为2014091207的日志文件中。
本领域技术人员可以理解,在001/home/app/log/目录以及301/home/app/log/目录中还存储有其它时间所生成的其它日志文件,例如包括在2014年9月12日5:00-6:00所生成的日志数据的、名称为2014091206的日志文件。
本领域技术人员还可以理解,在002-300以及302-600号服务器中同样具有/home/app/log/目录,其中存储有名称为2014091206、2014091207的日志文件以及其它时间所生成的其它日志文件,并且这些日志文件中至少包括用于微信支付的大数据应用的日志数据以及用于衡量订单价值的大数据应用的日志数据。
然后,如上文所讨论的,如果大数据服务器需要得到2014年9月12日6:00-7:00期间的微信支付的情况,则该大数据服务器将服务器编号1-600和/home/app/log/进行组合以得到600个存储位置,以及该大数据服务器分别在这些存储位置中收集名称为2014091207的日志文件,并且将所收集的600个日志文件存储在大数据服务器中的名称为2014091207的文件夹中。
在大数据收集之后,如上文所讨论的,大数据服务器将对文件夹2014091207中的600个日志文件进行解析,如果解析结果指示该日志文件中的日志数据中的日志前缀是“微信支付”,则将该日志数据向预定的用于微信支付的大数据应用的输出路径进行输出。
进而,假设网络中又部署了服务器编号为601-900的300台服务器以用于新业务,并且假设将存储日志数据的位置仍然设置为/home/app/log/并且日志数据格式和日志前缀也相同。因此,如果大数据服务器需要得到2014年9月12日6:00-7:00期间的订单价值的情况,则大数据服务器只需要在配置文件中新增服务器编号601-900,就可以分别在这900台服务器的相应存储位置中收集名称为2014091207的日志文件,并且将所收集的900个日志文件存储在大数据服务器中的名称为2014091207的文件夹中;同时,大数据服务器只需要在日志数据解析程序的配置文件里面新增“订单价值”,就可以对文件夹2014091207中的900个日志文件进行解析,如果解析结果指示该日志文件中的日志数据中的日志前缀是“订单价值”,则将该日志数据向预定的用于衡量订单价值的大数据应用的输出路径进行输出。
图4是根据本发明的实施例的业务数据的处理设备400的结构框图。如图4所示,该设备400包括:获取装置402,用于从多个服务器获取相应的业务数据,其中多个服务器分别用于多种业务;第一生成装置404,用于基于该业务数据,生成日志数据;以及存储装置406,用于将该日志数据分别存储在与该业务数据相应的服务器的相应位置处,以用于大数据应用。
根据本发明的实施例,第一生成装置404包括:提取单元4042,用于从该业务数据中提取具有特定键名的数据;以及第一生成单元4044,用于基于所提取的数据,生成日志数据。
根据本发明的实施例,该设备400还包括:第二生成装置408,用于生成用于唯一指示该日志数据的类型的日志前缀;以及第一增加装置410,用于在该日志数据中的、所提取的数据之前增加该日志前缀。
根据本发明的实施例,该设备400还包括:第二增加装置412,用于在针对该日志数据增加键名的情况下,在该日志数据中的、所提取的数据之后增加该键名。
根据本发明的实施例,该设备400还包括:设置装置414,用于在针对该日志数据减少键名的情况下,将该键名所对应的键值设置为默认值,而不在该日志数据中减少该键名。
根据本发明的实施例,存储装置406包括:第二生成单元4062,用于按照生成该日志数据的时间所归属的时间区间,分别生成包括相应的日志数据的多个日志文件,其中每个日志文件的文件名称与该时间区间关联;以及存储单元4064,用于将多个日志文件分别存储在与业务数据相应的服务器的相应位置处。
图5是根据本发明的实施例的业务数据的处理设备500的结构框图。如图5所示,该设备500包括:第一获取装置502,用于从多个服务器的相应位置处获取多个日志文件;以及存储装置504,用于将多个日志文件分别存储到多个文件夹中,其中多个服务器分别用于多种业务,多个日志文件分别基于相应的日志数据而生成,该日志数据分别基于从多个服务器获取的相应的业务数据而生成。
根据本发明的实施例,第一获取装置502包括:组合单元5022,用于将多个服务器的服务器编号和相应位置进行组合,以得到多个存储位置;以及收集单元5024,用于在多个存储位置中分别收集多个日志文件。
根据本发明的实施例,存储装置504包括:存储单元5042,用于按照多个日志文件的文件名称将多个日志文件分别存储到多个文件夹中,其中每个文件夹按照生成日志数据的时间所归属的时间区间而建立,该文件名称与该时间区间关联。
根据本发明的实施例,该设备500还包括:第二获取装置506,用于在多个文件夹中获取多个日志文件;以及输出装置508,用于按照多个日志文件中的日志数据的日志前缀输出日志数据,其中该日志前缀用于唯一指示该日志数据的类型。
综上所述,根据上述本发明的实施例,提供了一种业务数据的处理方法及设备。该方法包括:从多个服务器获取相应的业务数据,其中多个服务器分别用于多种业务;基于该业务数据,生成日志数据;以及将该日志数据分别存储在与该业务数据相应的服务器的相应位置处。本发明的实施例能够获得规范和统一的日志数据并且将其直接用于大数据应用,从而提高大数据应用特别是大数据收集和大数据解析的工作效率。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明可选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等效替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种业务数据的处理方法,包括:
从多个服务器获取相应的业务数据,其中所述多个服务器分别用于多种业务;
基于所述业务数据,生成日志数据;以及
将所述日志数据分别存储在与所述业务数据相应的服务器的相应位置处,以便从所述相应的服务器直接获取所述日志数据以用于大数据应用的重复使用,其中所述相应位置对于每个服务器是固定的。
2.根据权利要求1所述的方法,其中基于所述业务数据,生成日志数据包括:
从所述业务数据中提取具有特定键名的数据;以及
基于所述提取的数据,生成所述日志数据。
3.根据权利要求2所述的方法,还包括:
生成用于唯一指示所述日志数据的类型的日志前缀;以及
在所述日志数据中的、所述提取的数据之前增加所述日志前缀。
4.根据权利要求2所述的方法,还包括:
如果针对所述日志数据增加键名,则在所述日志数据中的、所述提取的数据之后增加所述键名。
5.根据权利要求2所述的方法,还包括:
如果针对所述日志数据减少键名,则将所述键名所对应的键值设置为默认值,而不在所述日志数据中减少所述键名。
6.根据权利要求1至5中任一项所述的方法,其中将所述日志数据分别存储在与所述业务数据相应的服务器的相应位置处包括:
按照生成所述日志数据的时间所归属的时间区间,分别生成包括相应的日志数据的多个日志文件,其中每个日志文件的文件名称与所述时间区间关联;以及
将所述多个日志文件分别存储在与所述业务数据相应的服务器的相应位置处。
7.一种业务数据的处理方法,包括:
从所述业务数据的相应多个服务器的相应位置处直接获取多个日志文件,其中所述相应位置对于每个服务器是固定的;以及
将所述多个日志文件分别存储到多个文件夹中,并且在所述多个服务器的相应位置处具有所述多个日志文件,
其中所述多个服务器分别用于多种业务,所述多个日志文件分别基于相应的日志数据而生成,所述日志数据分别基于从所述多个服务器获取的相应的业务数据而生成,并且所述日志数据被固定存储在所述业务数据的相应服务器的相应位置处;
其中将所述多个日志文件分别存储到多个文件夹中包括:
按照所述多个日志文件的文件名称,将所述多个日志文件分别存储到所述多个文件夹中,其中每个文件夹按照生成所述日志数据的时间所归属的时间区间而建立,所述文件名称与所述时间区间关联。
8.根据权利要求7所述的方法,其中从所述多个服务器的所述相应位置处获取所述多个日志文件包括:
将所述多个服务器的服务器编号和所述相应位置进行组合,以得到多个存储位置;以及
在所述多个存储位置中分别收集所述多个日志文件。
9.根据权利要求7至8中任一项所述的方法,还包括:
在所述多个文件夹中获取所述多个日志文件;以及
按照所述多个日志文件中的日志数据的日志前缀输出所述日志数据,其中所述日志前缀用于唯一指示所述日志数据的类型。
10.一种业务数据的处理设备,包括:
获取装置,用于从多个服务器获取相应的业务数据,其中所述多个服务器分别用于多种业务;
第一生成装置,用于基于所述业务数据,生成日志数据;以及
存储装置,用于将所述日志数据分别存储在与所述业务数据相应的服务器的相应位置处,以便从所述相应的服务器直接获取所述日志数据以用于大数据应用的重复使用,其中所述相应位置对于每个服务器是固定的。
11.根据权利要求10所述的设备,其中所述第一生成装置包括:
提取单元,用于从所述业务数据中提取具有特定键名的数据;以及
第一生成单元,用于基于所述提取的数据,生成所述日志数据。
12.根据权利要求11所述的设备,还包括:
第二生成装置,用于生成用于唯一指示所述日志数据的类型的日志前缀;以及
第一增加装置,用于在所述日志数据中的、所述提取的数据之前增加所述日志前缀。
13.根据权利要求11所述的设备,还包括:
第二增加装置,用于在针对所述日志数据增加键名的情况下,在所述日志数据中的、所述提取的数据之后增加所述键名。
14.根据权利要求11所述的设备,还包括:
设置装置,用于在针对所述日志数据减少键名的情况下,将所述键名所对应的键值设置为默认值,而不在所述日志数据中减少所述键名。
15.根据权利要求10至14中任一项所述的设备,其中所述存储装置包括:
第二生成单元,用于按照生成所述日志数据的时间所归属的时间区间,分别生成包括相应的日志数据的多个日志文件,其中每个日志文件的文件名称与所述时间区间关联;以及
存储单元,用于将所述多个日志文件分别存储在与所述业务数据相应的服务器的相应位置处。
16.一种业务数据的处理设备,包括:
第一获取装置,用于从多个服务器的相应位置处直接获取多个日志文件,其中所述相应位置对于每个服务器是固定的;以及
存储装置,用于将所述多个日志文件分别存储到多个文件夹中,并且在所述多个服务器的相应位置处具有所述多个日志文件,
其中所述多个服务器分别用于多种业务,所述多个日志文件分别基于相应的日志数据而生成,所述日志数据分别基于从所述多个服务器获取的相应的业务数据而生成,并且所述日志数据被固定存储在所述业务数据的相应服务器的相应位置处;
其中,所述存储装置包括:存储单元,用于按照所述多个日志文件的文件名称将所述多个日志文件分别存储到所述多个文件夹中,其中每个文件夹按照生成所述日志数据的时间所归属的时间区间而建立,所述文件名称与所述时间区间关联。
17.根据权利要求16所述的设备,所述第一获取装置包括:
组合单元,用于将所述多个服务器的服务器编号和所述相应位置进行组合,以得到多个存储位置;以及
收集单元,用于在所述多个存储位置中分别收集所述多个日志文件。
18.根据权利要求16至17中任一项所述的设备,还包括:
第二获取装置,用于在所述多个文件夹中获取所述多个日志文件;以及
输出装置,用于按照所述多个日志文件中的日志数据的日志前缀输出所述日志数据,其中所述日志前缀用于唯一指示所述日志数据的类型。
CN201410649441.4A 2014-11-14 2014-11-14 业务数据的处理方法及设备 Active CN105656706B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010820014.3A CN112003743B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备
CN201410649441.4A CN105656706B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410649441.4A CN105656706B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010820014.3A Division CN112003743B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备

Publications (2)

Publication Number Publication Date
CN105656706A CN105656706A (zh) 2016-06-08
CN105656706B true CN105656706B (zh) 2020-09-15

Family

ID=56478936

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010820014.3A Active CN112003743B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备
CN201410649441.4A Active CN105656706B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010820014.3A Active CN112003743B (zh) 2014-11-14 2014-11-14 业务数据的处理方法及设备

Country Status (1)

Country Link
CN (2) CN112003743B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107870842B (zh) * 2016-09-28 2021-05-04 平安科技(深圳)有限公司 一种日志管理方法及系统
CN106843763A (zh) * 2017-01-19 2017-06-13 北京神州绿盟信息安全科技股份有限公司 一种基于hdfs系统的文件合并方法及装置
CN110096418A (zh) * 2019-03-21 2019-08-06 平安普惠企业管理有限公司 业务日志分析方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060124188A (ko) * 2005-05-31 2006-12-05 하나로텔레콤 주식회사 광동축 혼합망 가입자 관리 시스템
CN102065322A (zh) * 2009-11-17 2011-05-18 青岛海信传媒网络技术有限公司 一种iptv系统面向多业务的日志处理方法及装置
CN102768636A (zh) * 2011-05-05 2012-11-07 阿里巴巴集团控股有限公司 一种日志解析方法及装置
CN103425750A (zh) * 2013-07-23 2013-12-04 国云科技股份有限公司 一种跨平台跨应用的日志收集系统及其收集管理方法
CN103546312A (zh) * 2013-08-27 2014-01-29 中国航天科工集团第二研究院七〇六所 一种海量多源异构日志关联分析方法
CN103593277A (zh) * 2012-08-15 2014-02-19 深圳市世纪光速信息技术有限公司 日志处理方法及系统
CN103699548A (zh) * 2012-09-27 2014-04-02 阿里巴巴集团控股有限公司 一种通过使用日志恢复数据库数据的方法及设备

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3943851B2 (ja) * 2001-03-19 2007-07-11 株式会社東芝 クライアント稼動状態把握システム、およびクライアント稼動状態把握用プログラム
JP2004288026A (ja) * 2003-03-24 2004-10-14 Fuji Xerox Co Ltd サービス処理システム、サービス処理システムの処理結果確認方法、及びサービス処理プログラム
CN101163265B (zh) * 2007-11-20 2010-08-18 中兴通讯股份有限公司 基于分布式数据库的彩信日志查询方法与系统
CN101610174B (zh) * 2009-07-24 2011-08-24 深圳市永达电子股份有限公司 一种日志事件关联分析系统与方法
CN102111285B (zh) * 2009-12-24 2015-06-10 北京世纪互联宽带数据中心有限公司 一种日志信息管理方法及系统
WO2011077501A1 (ja) * 2009-12-26 2011-06-30 株式会社ラピースドリーム コミュニケーションシステム
CN102158748A (zh) * 2010-05-14 2011-08-17 青岛海信传媒网络技术有限公司 一种日志收集与上传方法及系统
CN101964795A (zh) * 2010-09-30 2011-02-02 北京世纪互联工程技术服务有限公司 日志采集系统、日志采集方法和日志回收服务器
CN102790686B (zh) * 2011-05-17 2015-09-16 浙江核新同花顺网络信息股份有限公司 日志数据采集方法、系统及服务器
US9311175B2 (en) * 2011-05-24 2016-04-12 Verizon Patent And Licensing Inc. Method and system for processing log information
JP2013030044A (ja) * 2011-07-29 2013-02-07 Canon Inc 印刷管理システム、及び印刷管理方法
CN102394771A (zh) * 2011-10-26 2012-03-28 广州杰赛科技股份有限公司 插座式嵌入的日志收集系统及收集方法
CN103166785A (zh) * 2011-12-15 2013-06-19 同程网络科技股份有限公司 基于Hadoop的分布式日志分析系统
CN103176888B (zh) * 2011-12-22 2018-01-23 阿里巴巴集团控股有限公司 一种日志记录的方法和系统
CN102902813B (zh) * 2012-10-22 2016-08-24 北京奇虎科技有限公司 日志收集系统
CN103823811A (zh) * 2012-11-19 2014-05-28 北京百度网讯科技有限公司 用于处理日志的方法及其系统
CN103902537B (zh) * 2012-12-25 2017-02-08 重庆新媒农信科技有限公司 多业务的日志数据存储处理和查询系统及其方法
CN103532754B (zh) * 2013-10-12 2016-08-17 北京首信科技股份有限公司 一种通过高速内存、分布式处理海量日志的系统及方法
CN103838867A (zh) * 2014-03-20 2014-06-04 网宿科技股份有限公司 日志处理方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060124188A (ko) * 2005-05-31 2006-12-05 하나로텔레콤 주식회사 광동축 혼합망 가입자 관리 시스템
CN102065322A (zh) * 2009-11-17 2011-05-18 青岛海信传媒网络技术有限公司 一种iptv系统面向多业务的日志处理方法及装置
CN102768636A (zh) * 2011-05-05 2012-11-07 阿里巴巴集团控股有限公司 一种日志解析方法及装置
CN103593277A (zh) * 2012-08-15 2014-02-19 深圳市世纪光速信息技术有限公司 日志处理方法及系统
CN103699548A (zh) * 2012-09-27 2014-04-02 阿里巴巴集团控股有限公司 一种通过使用日志恢复数据库数据的方法及设备
CN103425750A (zh) * 2013-07-23 2013-12-04 国云科技股份有限公司 一种跨平台跨应用的日志收集系统及其收集管理方法
CN103546312A (zh) * 2013-08-27 2014-01-29 中国航天科工集团第二研究院七〇六所 一种海量多源异构日志关联分析方法

Also Published As

Publication number Publication date
CN105656706A (zh) 2016-06-08
CN112003743B (zh) 2023-04-18
CN112003743A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
US10332084B2 (en) Systems and methods for automatically collection of performance data in a multi-tenant database system environment
EP2924588A1 (en) Report creation method, device and system
CN108509392B (zh) 多机构对账方法、系统、计算机设备和存储介质
CN107506383B (zh) 一种审计数据处理方法和计算机设备
CN110233741B (zh) 服务计费方法、装置、设备及存储介质
CN105656706B (zh) 业务数据的处理方法及设备
CN105677663A (zh) 对自助办税终端进行统一管理的方法和系统
US8726077B2 (en) Method and system for partitioning data files for efficient processing
CN112422299A (zh) 分析公有云计费数据的方法、装置和计算机可读存储介质
CN111224831B (zh) 用于生成话单的方法和系统
CN107730375A (zh) 一种税务地图管理的方法、系统及终端设备
CN110990350B (zh) 日志的解析方法及装置
CN113190513A (zh) 一种数据集成系统及方法
CN105260168B (zh) 日志输出方法和装置
CN113923208B (zh) 一种下载海量路测数据的处理方法
CN114185770A (zh) 生成测试数据的方法、装置、计算机设备和存储介质
US10855850B2 (en) Data processing
CN115496470A (zh) 全链路配置化数据处理方法、装置和电子设备
CN110347657A (zh) 数据生成方法、装置、电子设备及存储介质
CN112036836B (zh) 业务开通方法、系统及设备
CN107580305A (zh) 一种客户成员纯度分析方法及系统
CN114169985A (zh) 一种资产减值阶段确定方法及装置
CN101482945A (zh) 一种会计管理过程余额账本收、发、存查询统计的实现方法
CN110956430A (zh) 一种部门推荐的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant