CN106921614A - 业务数据处理方法和装置 - Google Patents
业务数据处理方法和装置 Download PDFInfo
- Publication number
- CN106921614A CN106921614A CN201510990185.XA CN201510990185A CN106921614A CN 106921614 A CN106921614 A CN 106921614A CN 201510990185 A CN201510990185 A CN 201510990185A CN 106921614 A CN106921614 A CN 106921614A
- Authority
- CN
- China
- Prior art keywords
- data
- row
- target
- service
- data row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0263—Rule management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
Abstract
本申请公开了一种业务数据处理方法和装置。其中,该方法包括:对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,目标数据列为表征数据业务的业务信息的列;根据每个数据业务的业务信息之间的依赖关系,对目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过中间数据表将待处理数据导入到数据仓库中,其中,中间数据表为用于按照预设规则来存储业务信息的数据表。本申请解决了现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种业务数据处理方法和装置。
背景技术
在数据处理领域,通常需要将原始检测到的不同数据业务的数据从原始数据库导入到数据仓库中,例如,在对交互式网络电视(IPTV)的数据业务检测到的数据,其中,交互式网络电视的数据业务可以包括直播业务、回看业务和点播业务等,再将这些检测到的原始数据从原始数据库(Receiver)导入数据仓库(DW)。但是,由于原始数据的多样性,导致原始数据从原始数据库(Receiver)流向数据仓库(DW)过程中,数据的处理逻辑每次都要修改。而实际上,这里的处理逻辑从业务上是不需要变化的,因此,由于原始数据的改变,数据的处理逻辑就要做出相应的处理。当数据的处理逻辑发生改变时,会严重影响原始数据库到数据仓库的处理逻辑的稳定性。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种业务数据处理方法和装置,以至少解决现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题。
根据本申请实施例的一个方面,提供了一种业务数据处理方法,包括:对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表。
进一步地,对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列包括:对所述待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将所述第一数据列和所述第二数据列均作为所述目标数据列,其中,所述第一数据列所记录的业务信息为预设白名单上存在的业务信息,所述第二数据列为所记录的业务信息为所述预设白名单之外的业务信息。
进一步地,对所述待处理数据进行筛选出第一数据列和第二数据列包括:将所述待处理数据中的数据列与所述预设白名单上存在的业务信息进行比较;在比较出在所述预设白名单上包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第一数据列;在比较出在所述预设白名单上不包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第二数据列。
进一步地,根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合包括:在所述目标数据列中选取多个关联目标数据列,其中,所述多个关联目标数据列为存在所述依赖关系的数据列;将所述多个关联目标数据列进行组合在一起,得到所述目标数据列组合。
进一步地,根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合包括:查询用于进行组合的多个目标数据列;在查询出缺少所述多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,所述预设数据列为设置成默认值的数据列。
根据本申请实施例的另一方面,还提供了一种业务数据处理装置,包括:处理单元,用于对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;组合单元,用于根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;存储单元,用于依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表。
进一步地,所述处理单元包括:筛选模块,用于对所述待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将所述第一数据列和所述第二数据列均作为所述目标数据列,其中,所述第一数据列所记录的业务信息为预设白名单上存在的业务信息,所述第二数据列为所记录的业务信息为所述预设白名单之外的业务信息。
进一步地,所述筛选模块包括:比较子模块,用于将所述待处理数据中的数据列与所述预设白名单上存在的业务信息进行比较;第一确定子模块,用于在比较出在所述预设白名单上包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第一数据列;第二确定子模块,用于在比较出在所述预设白名单上不包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第二数据列。
进一步地,所述组合单元包括:选择模块,用于在所述目标数据列中选取多个关联目标数据列,其中,所述多个关联目标数据列为存在所述依赖关系的数据列;组合模块,用于将所述多个关联目标数据列进行组合在一起,得到所述目标数据列组合。
进一步地,所述组合单元包括:查询模块,用于查询用于进行组合的多个目标数据列;使用模块,用于在查询出缺少所述多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,所述预设数据列为设置成默认值的数据列。
在本申请实施例中,采用对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表的方式,通过对获取到的待处理数据进行处理,得到每个数据业务的目标数据列,并对目标数据列进行组合,将最终组合之后得到的目标数据列组合存储至中间数据表中,进而将目标数据列组合导入至数据仓库,相对于现有技术中未对数据进行筛选和组合的处理,达到了在数据处理过程中处理逻辑保持稳定性的目的,进而解决了现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题,从而实现屏蔽数据不一致给处理程序带来影响的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种业务数据处理方法的流程图;
图2是根据本申请实施例的一种业务数据处理装置的示意图;以及
图3是根据本申请可选实施例的一种业务数据处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种业务数据处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种业务数据处理方法的流程图,如图1所示,该方法包括如下步骤S102至步骤S106:
步骤S102,对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,目标数据列为表征数据业务的业务信息的列。
待处理数据中数据列的数量可以为多个,且每个数据业务的目标数据列可以为多个。若数据业务为交互式网络电视中的直播业务,则目标数据列为与直播业务相关的数据列,例如,列名为日期、用户、观看频道和观看节目等数据。
步骤S104,根据每个数据业务的业务信息之间的依赖关系,对目标数据列进行组合,得到与每个数据业务对应的目标数据列组合。
例如,直播业务中的业务信息可以为日期、用户、观看频道和观看节目等信息。其中,日期或用户独立存在时无实际意义,因此,可以将与用户存在依赖关系的日期和观看节目进行组合,进而得到每个数据业务的目标数据列组合,该组合表示为某用户在某日期观看了某频道。
步骤S106,依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过中间数据表将待处理数据导入到数据仓库中,其中,中间数据表为用于按照预设规则来存储业务信息的数据表。
中间数据表的数量可以为一个,还可以为多个,即可以将多个目标数据列组合存储至一个中间数据表中,还可以将一个目标数据列组合对应地存储至一个中间数据表中。
在本申请实施例中,通过对获取到的待处理数据进行处理,得到每个数据业务的目标数据列,并对目标数据列进行组合,将最终组合之后得到的目标数据列组合存储至中间数据表中,进而将目标数据列组合导入至数据仓库,相对于现有技术中未对数据进行筛选和组合的处理,达到了在数据处理过程中处理逻辑保持稳定性的目的,进而解决了现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题,从而实现屏蔽数据不一致给处理程序带来影响的技术效果。
可选地,对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列包括如下步骤S1021:对待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将第一数据列和第二数据列均作为目标数据列,其中,第一数据列所记录的业务信息为预设白名单上存在的业务信息,第二数据列为所记录的业务信息为预设白名单之外的业务信息。
具体地,待处理数据的数据列中包含多个数据业务的数据列,并且该数据列中可以包括需要调用的数据列,还可以包括可能需要调用的数据列。在对数据列进行处理的时候,可以将全部待处理数据进行筛选,筛选出需要调用的数据列和可能需要调用的数据列。其中,第一数据列和第二数据列均可以作为数据业务的目标数据列。
在对待处理数据进行筛选,得到第一数据列和第二数据列之前,该方法还可以包括:将包含多种格式的异构数据源转化为统一格式的数据源,进而得到待处理数据。接下来对待处理数据中的数据列进行处理,抽象出相同的数据列,鉴别不相同的数据列。其中,相同的数据列为含列名不同,但内容含义相同的数据列,不相同的数据列为列名不相同,并且内容含义也不相同的数据列。若从待处理处理数据中抽象出相同的数据列,则需将该数据列合并为一个数据列,通过将待处理数据进行处理,抽象出相同的数据列和不相同的数据列,实现了对数据进行整合,得到了一个可用的数据列的说明表,并提高了后续数据处理的效率。
需要说明的是,在本申请实施例中,异构数据源主要是采集的源数据,例如IPTV业务,其采用C3日志对数据进行采集,而对于C3日志的不同版本,日志中包含的字段数及字段名称也会有所不同,针对每个版本的日志,都需要开发一种对应的处理逻辑,增加了开发的复杂度。因此,需对获取到的异构数据源进行处理,得到格式统一的待处理数据,进而对待处理数据列再进行后续的处理。
例如,用户查询直播业务的日期、用户和观看频道等信息,系统首先在需要的数据列(即,第一数据列)中查询是否存在上述日期、用户和观看频道等信息,若在需要的数据列中不存在上述业务信息,则在可能需要的数据列(即,第二数据)中查询上述业务信息。通过上述方案对待处理数据的数据列分成第一数据集合和第二数据集合,在用户查询相关业务信息时,可以有效提高相关业务信息的查询效率。
通过上述方法对待处理数据进行处理之后,还可以得到第一数据列集合,即多个数据业务的第一数据列的集合;并得到第二数据列集合,即多个数据业务的第二数据列的集合。
对待处理数据进行筛选出第一数据列和第二数据列的方法可以有很多种,在另一可选实施例中,可以将待处理数据中的数据列与预设白名单上存在的业务信息进行比较,在比较出在预设白名单上包含待处理数据中的数据列的情况下,确定数据列为第一数据列,在比较出在预设白名单上不包含待处理数据中的数据列的情况下,确定数据列为第二数据列。
具体地,对待处理数据筛选得到第一数据列和第二数据列之前,还可以对待处理数据进行分类,例如,根据数据业务把得到的需要调用的数据列和可能需要调用的数据列划分给不同的数据业务,比如直播业务相关的数据列,点播业务相关的数据列,回看业务相关的数据列等等。然后,将分类之后的待处理数据与预设白名单中的业务信息进行比较,得到每个数据业务的第一数据列,即每个数据业务中需要调用的数据列。
其中,预设白名单可以为用户预设设置一个名单,在该名单用于保存在数据调用过程中调用率较高的业务信息,例如,观看频道、观看节目、用户和日期等多个业务信息。通过将分类之后的待处理数据与名单中已设置的业务信息进行比较,即可确定该数据列是否为需要调用的数据列。其中,在比较出名单中包含该数据列的情况下,确定该数据列为需要调用的数据列(即,第一数据列),在比较出名单中不包含该数据列的情况下,确定该数据列为可能需要调用或者不需要调用的数据列(即,第二数据列)。
可选地,根据每个数据业务的业务信息之间的依赖关系,对目标数据列进行组合,得到与每个数据业务对应的目标数据列组合包括如下步骤S1041至步骤S1043:
步骤S1041,在目标数据列中选取多个关联目标数据列,其中,多个关联目标数据列为存在依赖关系的数据列。
步骤S1043,将多个关联目标数据列进行组合在一起,得到目标数据列组合。
具体地,在归类后的目标数据列中选取多个关联的目标数据列,并按照一定的规则将多个目标关联的目标数据列组合到不同的中间数据表中,得到目标数据列组合。例如直播相关的数据列有:日期,用户,观看频道。这三列之间是有依赖关系的,只有三列同时出现才有意义,表示某用户在某日期观看了哪一个频道,因此,这三列就需要放到一个表中。
需要说明的是,在本申请实施例中,每个数据业务中的数据列还可以实现公用或者复制。例如,直播业务中,除上述日期、用户和观看频道存在依赖关系之外,日期,用户和观看节目,这三列之间同样存在依赖关系,则复制日期和用户,并将复制的日期和用户与观看节目进行组合,再次得到目标数据列组合,并将该组合存储至中间数据表中。
其中,在根据日期、用户和观看频道,或者日期和用户与观看节目得到目标数据列组合之前,用户可预先建立多个业务模型,其中,每个业务模型由数据业务中相关联的业务信息组成。例如,可以将日期、用户和观看频道可组成一个业务模型,在数据处理的过程中,则可直接根据该业务模型从目标数据列中选取日期、用户和观看频道的多个关联的目标数据列,进而组合成目标数据列组合。
根据每个数据业务的业务信息之间的依赖关系,对目标数据列进行组合包括如下步骤S1045至步骤S1047:
步骤S1045,查询用于进行组合的多个目标数据列。
步骤S1047,在查询出缺少多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,预设数据列为设置成默认值的数据列。
具体地,在对目标数据列按照业务模型进行组合的过程中,需在目标数据列中查询是否存在业务模型中的业务信息。若查询到目标数据列中不包含该业务信息时,则设置预设数据列,并将该预设数据列与待组合的目标数据列进行组合。其中,预设数据列中用户可根据实际需要设置为默认值。
需要说明的是,在本申请实施例中,中间数据表可以是预先建立的空表,由于该中间数据表用于存储数据业务对应的目标数据列组合的数据列,因此,可以根据每个数据业务来建立相应的中间数据表的空表,该空表中不包含有实体数据,例如,当数据业务A包括“用户”、“日期”和“观看节目”三个数据列,本申请实施例中,可以预先建立包含“用户”、“日期”和“观看节目”这三个数据指标的空列(即每个数据指标内不包含相应的指标数据)的中间数据表a。在进行数据处理的过程中,在组合出上述三个指标数据的数据列之后,可以直接将其存储至预先建立的中间数据表a中。
中间数据表建立完成之后,将获取到的异构数据源经过处理之后,即可存储至该中间数据表中,并通过中间数据表推送至数据仓库(DW)中,当中间数据表将处理得到的目标数据列组合推送至DW之后,将清除中间数据表的数据,释放一定的空间,继续后续数据的相关操作。
在建立中间数据表的过程中,还需建立控制表,控制表包括总控制表和单控制表。总控制表可以由一个或者多个控制表组成,用于数据流程的控制和操作信息的记录,例如控制数据处理中的流程和数据处理过程中相关日志的记录;每个数据业务均包括一个单控制表,用于控制与本数据业务相关的操作和信息记录,例如,控制该数据业务数据处理中的流程和数据处理过程中相关日志的记录。需要说明的是,在本申请实施例中,控制表除用于数据流程的控制和操作信息的记录之外,还可以在每个单控制表中配置相关信息,该信息用于识别获取到的待处理数据中的相关标识,其中,单控制表来识别待处理数据的标识,用于识别该数据是直播业务的相关数据,还是点播业务的相关数据。通过配置该信息,可以实现待处理数据的快速分流,分流给不同的数据业务。
在本申请实施例中,通过将待处理数据转化为统一形式的数据(例如,目标数据列组合),并存入至中间数据表中,保证了中间数据表的稳定性,隔绝了数据的多样性而带来的数据由原始数据库投递至数据仓库时处理逻辑的变化,进而保证了中间层(即,中间数据表)和下层(即,数据仓库)之间的稳定性。
本申请实施例还提供了一种业务数据处理装置,该装置主要用于执行本申请实施例上述内容所提供的业务数据处理方法,以下对本申请实施例所提供的业务数据处理装置做具体介绍。
图2是根据本申请实施例的一种业务数据处理装置的示意图,如图2所示,该网站流量异常的检测装置主要包括处理单元10、组合单元20和存储单元30,其中:
处理单元10,用于对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,目标数据列为表征数据业务的业务信息的列。
待处理数据中数据列的数量可以为多个,且每个数据业务的目标数据列可以为多个。若数据业务为交互式网络电视中的直播业务,则目标数据列为与直播业务相关的数据列,例如,列名为日期、用户、观看频道和观看节目等数据。
组合单元20,用于根据每个数据业务的业务信息之间的依赖关系,对目标数据列进行组合,得到与每个数据业务对应的目标数据列组合。
例如,直播业务中的业务信息可以为日期、用户、观看频道和观看节目等信息。其中,日期或用户独立存在时无实际意义,因此,可以将与用户存在依赖关系的日期和观看节目进行组合,进而得到每个数据业务的目标数据列组合,该组合表示为某用户在某日期观看了某频道。
存储单元30,用于依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过中间数据表将待处理数据导入到数据仓库中,其中,中间数据表为用于按照预设规则来存储业务信息的数据表。
间数据表的数量可以为一个,还可以为多个,即可以将多个数据列组合存储至一个中间数据表中,还可以将一个数据列组合存储至一个中间数据表中。
在本申请实施例中,通过对获取到的待处理数据进行处理,得到每个数据业务的目标数据列,并对目标数据列进行组合,将最终组合之后得到的目标数据列组合存储至中间数据表中,进而将目标数据列组合导入至数据仓库,相对于现有技术中未对数据进行筛选和组合的处理,达到了在数据处理过程中处理逻辑保持稳定性的目的,进而解决了现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题,从而实现屏蔽数据不一致给处理程序带来影响的技术效果
可选地,处理单元包括:筛选模块,用于对待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将第一数据列和第二数据列均作为目标数据列,其中,第一数据列所记录的业务信息为预设白名单上存在的业务信息,第二数据列为所记录的业务信息为预设白名单之外的业务信息。
具体地,待处理数据的数据列中包含多个数据业务的数据列,并且该数据列中可以包括需要调用的数据列,还可以包括可能需要调用的数据列。在对数据列进行处理的时候,可以通过调用筛选模块将全部待处理数据进行筛选,筛选出需要调用的数据列和可能需要调用的数据列。其中,第一数据列和第二数据列均可以作为数据业务的目标数据列。
在对待处理数据进行筛选,得到第一数据列和第二数据列之前,还可以将待处理数据与异构数据源进行比较处理,将包含多种格式的异构数据源转化为统一格式的数据源,进而得到待处理数据。接下来对待处理数据中的数据列进行处理,抽象出相同的数据列,鉴别不相同的数据列。其中,相同的数据列为含列名不同,但内容含义相同的数据列,不相同的数据列为列名不相同,并且内容含义也不相同的数据列。若从待处理处理数据中抽象出相同的数据列,则需将该数据列合并为一个数据列,通过将待处理数据进行处理,抽象出相同的数据列和不相同的数据列,实现了对数据进行整合,得到了一个可用的数据列的说明表,并提高了后续数据处理的效率。
需要说明的是,在本申请实施例中,异构数据源主要是采集的源数据,例如IPTV业务,其采用C3日志对数据进行采集,而对于C3日志的不同版本,日志中包含的字段数及字段名称也会有所不同,针对每个版本的日志,都需要开发一种对应的处理逻辑,增加了开发的复杂度。因此,需对获取到的异构数据源进行处理,得到格式统一的待处理数据,进而对待处理数据列再进行后续的处理。
可选地,筛选模块包括:比较子模块,用于将待处理数据中的数据列与预设白名单上存在的业务信息进行比较;第一确定子模块,用于在比较出在预设白名单上包含待处理数据中的数据列的情况下,确定数据列为第一数据列;第二确定子模块,用于在比较出在预设白名单上不包含待处理数据中的数据列的情况下,确定数据列为第二数据列。
具体地,对待处理数据筛选得到第一数据列和第二数据列之前,还可以对待处理数据进行分类,例如,根据数据业务把得到的需要调用的数据列和可能需要调用的数据列划分给不同的数据业务,比如直播业务相关的数据列,点播业务相关的数据列,回看业务相关的数据列等等。然后,通过调用比较子模块将分类之后的待处理数据与预设白名单中的业务信息进行比较,得到每个数据业务的第一数据列,即每个数据业务中需要调用的数据列。
其中,预设白名单额可以为用户预设设置一个名单,在该名单用于保存在数据调用过程中调用率较高的业务信息,例如,观看频道、观看节目、用户和日期等多个业务信息。通过将分类之后的待处理数据与名单中已设置的业务信息进行比较,即可通过第一确定子模块确定该数据列是否为需要调用的数据列,并通过第二确定子模块确定该数据列是否为可能调用的数据列。其中,在比较出名单中包含该数据列的情况下,确定该数据列为需要调用的数据列(即,第一数据列),在比较出名单中不包含该数据列的情况下,确定该数据列为可能需要调用或者不需要调用的数据列(即,第二数据列)。
可选地,组合单元包括:选择模块,用于在目标数据列中选取多个关联目标数据列,其中,多个关联目标数据列为存在依赖关系的数据列;组合模块,用于将多个关联目标数据列进行组合在一起,得到目标数据列组合。
具体地,通过选择模块在归类后的目标数据列中选取多个关联的目标数据列,并通过组合模块按照一定的规则将多个目标关联的目标数据列组合到不同的中间数据表中,得到目标数据列组合。例如直播相关的数据列有:日期,用户,观看频道。这三列之间是有依赖关系的,只有三列同时出现才有意义,表示某用户在某日期观看了哪一个频道,因此,这三列就需要放到一个表中。
需要说明的是,在本申请实施例中,每个数据业务中的数据列还可以实现公用或者复制。例如,直播业务中,除上述日期、用户和观看频道存在依赖关系之外,日期,用户和观看节目,这三列之间同样存在依赖关系,则复制日期和用户,并将复制的日期和用户与观看节目进行组合,再次得到目标数据列组合,并将该组合存储至中间数据表中。
其中,在根据日期、用户和观看频道,或者日期和用户与观看节目得到目标数据列组合之前,用户可预先建立多个业务模型,其中,每个业务模型由数据业务中相关联的业务信息组成。例如,可以将日期、用户和观看频道可组成一个业务模型,在数据处理的过程中,则可直接根据该业务模型从目标数据列中选取日期、用户和观看频道的多个关联的目标数据列,进而组合成目标数据列组合。
可选地,组合单元包括:查询模块,用于查询用于进行组合的多个目标数据列;使用模块,用于在查询出缺少多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,预设数据列为设置成默认值的数据列。
具体地,在对目标数据列按照业务模型进行组合的过程中,需通过查询模块在目标数据列中查询是否存在业务模型中的业务信息。若查询到目标数据列中不包含该业务信息时,则通过使用模块设置预设数据列,并将该预设数据列与待组合的目标数据列进行组合。其中,预设数据列中用户可根据实际需要设置为默认值。
图3是根据本申请可选实施例的一种业务数据处理装置的示意图,如图3所示,包括日志读取器(LogReader)层、预处理(PreProcess)层和数据抽取、转换和加载(ETL)层。其中,预处理层又可以称为中间数据层,则日志读取器层又可以称为上层,ETL层又可以称为下层,该日志读取器层可以通过适配器和异构数据源连接,ETL层可以通过数据抽取、转换和加载等处理逻辑进入数据仓库(DW)。在本申请实施例中,通过LogReader加载待处理数据,数据加载的过程中可以对加载的数据进行格式转换,数据有效性验证、缺失或者错误数据的修正。经过上述处理之后,则可将待处理数据导入原始数据库(Receiver)的E_BULK表中。
在本申请实施例中,采用C3日志对异构数据源进行采集,其中,C3包括多个版本,例如,C3的1.0版本和C3的1.1版本,每种版本得到的异构数据源格式为不相同的格式,因此,当处理异构数据源时,数据的处理逻辑会发生相应地改变。因此,为通过每个C3版本获取到的数据源均连接一个适配器,该适配器的主要功能是将异构数据源的格式转化为统一的格式。例如,在通过C3日志获取原始数据时,数据的格式可以为:“日期2015年10月20日上午8时,用户A,观看频道CCTV”、“日期2015年10月21日上午9时,用户B,观看频道CCTV5”,此时,需将数据进行规范化处理,例如将日期统计为一个数据列,然后,将每个日期对应的用户和观看频道等信息对应的存储至该日期所在的行中,进而,得到了关于日期的数据列,关于用户的数据列和关于观看频道的数据列。
导入之后,在图3中的数据转换一部分即可根据上述描述的业务数据处理的方案对数据进行转换(例如,数据分流,数据拆分和数据过滤),并将转换之后的数据(例如,上述实施例中的目标数据列组合)导入至原始数据库中的业务表(即,上述实施例中的中间数据表)。
最后,将业务表中的数据经过数据转换二之后,即可导入至数据仓库(DW)中。其中,待处理数据中可能存在不可变的逻辑的数据,则这些数据需通过数据转换二部分进行聚合、匹配、运算和去重等处理。
所述业务数据处理装置包括处理器和存储器,上述处理单元、组合单元和存储单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来保持数据处理过程中的处理逻辑稳定性,进而解决了现有技术中由于原始数据的多样性导致在数据处理过程中逻辑发生变化的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种业务数据处理方法,其特征在于,包括:
对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;
根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;
依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表。
2.根据权利要求1所述的方法,其特征在于,对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列包括:
对所述待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将所述第一数据列和所述第二数据列均作为所述目标数据列,其中,所述第一数据列所记录的业务信息为预设白名单上存在的业务信息,所述第二数据列为所记录的业务信息为所述预设白名单之外的业务信息。
3.根据权利要求2所述的方法,其特征在于,对所述待处理数据进行筛选出第一数据列和第二数据列包括:
将所述待处理数据中的数据列与所述预设白名单上存在的业务信息进行比较;
在比较出在所述预设白名单上包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第一数据列;
在比较出在所述预设白名单上不包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第二数据列。
4.根据权利要求1所述的方法,其特征在于,根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合包括:
在所述目标数据列中选取多个关联目标数据列,其中,所述多个关联目标数据列为存在所述依赖关系的数据列;
将所述多个关联目标数据列进行组合在一起,得到所述目标数据列组合。
5.根据权利要求1所述的方法,其特征在于,根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合包括:
查询用于进行组合的多个目标数据列;
在查询出缺少所述多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,所述预设数据列为设置成默认值的数据列。
6.一种业务数据处理装置,其特征在于,包括:
处理单元,用于对待处理数据中的数据列进行处理,得到每个数据业务的目标数据列,其中,所述目标数据列为表征所述数据业务的业务信息的列;
组合单元,用于根据每个数据业务的业务信息之间的依赖关系,对所述目标数据列进行组合,得到与每个数据业务对应的目标数据列组合;
存储单元,用于依次将每个数据业务对应的目标数据列组合存储至中间数据表中,以通过所述中间数据表将所述待处理数据导入到数据仓库中,其中,所述中间数据表为用于按照预设规则来存储所述业务信息的数据表。
7.根据权利要求6所述的装置,其特征在于,所述处理单元包括:
筛选模块,用于对所述待处理数据进行筛选出第一数据列和第二数据列,得到第一数据列集合和第二数据列集合,将所述第一数据列和所述第二数据列均作为所述目标数据列,其中,所述第一数据列所记录的业务信息为预设白名单上存在的业务信息,所述第二数据列为所记录的业务信息为所述预设白名单之外的业务信息。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块包括:
比较子模块,用于将所述待处理数据中的数据列与所述预设白名单上存在的业务信息进行比较;
第一确定子模块,用于在比较出在所述预设白名单上包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第一数据列;
第二确定子模块,用于在比较出在所述预设白名单上不包含所述待处理数据中的数据列的情况下,确定所述数据列为所述第二数据列。
9.根据权利要求6所述的装置,其特征在于,所述组合单元包括:
选择模块,用于在所述目标数据列中选取多个关联目标数据列,其中,所述多个关联目标数据列为存在所述依赖关系的数据列;
组合模块,用于将所述多个关联目标数据列进行组合在一起,得到所述目标数据列组合。
10.根据权利要求6所述的装置,其特征在于,所述组合单元包括:
查询模块,用于查询用于进行组合的多个目标数据列;
使用模块,用于在查询出缺少所述多个目标数据列中一个目标数据列时,利用预设数据列作为缺少的数据列与查询到的目标数据列进行组合,其中,所述预设数据列为设置成默认值的数据列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510990185.XA CN106921614B (zh) | 2015-12-24 | 2015-12-24 | 业务数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510990185.XA CN106921614B (zh) | 2015-12-24 | 2015-12-24 | 业务数据处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106921614A true CN106921614A (zh) | 2017-07-04 |
CN106921614B CN106921614B (zh) | 2020-05-22 |
Family
ID=59459355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510990185.XA Active CN106921614B (zh) | 2015-12-24 | 2015-12-24 | 业务数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106921614B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109542891A (zh) * | 2018-10-18 | 2019-03-29 | 北京新唐思创教育科技有限公司 | 数据融合方法及计算机存储介质 |
CN109614417A (zh) * | 2018-10-30 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 基于数据流的报表指标的显示方法、装置及终端 |
CN110110018A (zh) * | 2018-01-30 | 2019-08-09 | 普天信息技术有限公司 | 存储的处理方法、装置、电子设备和存储介质 |
CN110457348A (zh) * | 2018-05-02 | 2019-11-15 | 北京三快在线科技有限公司 | 一种数据处理方法及装置 |
CN112015738A (zh) * | 2020-08-28 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 用于实现多个数据明细表的联表处理的方法及装置 |
CN112528613A (zh) * | 2020-12-21 | 2021-03-19 | 金蝶软件(中国)有限公司 | 一种数据表生成方法及其相关设备 |
CN112668287A (zh) * | 2019-09-30 | 2021-04-16 | 北京国双科技有限公司 | 数据表确定方法、系统及装置 |
CN113806332A (zh) * | 2021-08-23 | 2021-12-17 | 北京金蝶云基科技有限公司 | 一种异构系统集成数据处理方法、装置和计算机设备 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1826601A (zh) * | 2003-08-29 | 2006-08-30 | 瑞士银行股份有限公司 | 多用途数据的无冗余提供 |
CN101305365A (zh) * | 2004-12-17 | 2008-11-12 | 亚马逊科技公司 | 用于进行数据仓储的设备和方法 |
CN101689210A (zh) * | 2007-06-21 | 2010-03-31 | 微软公司 | 聚集和搜索来自多个服务的简档数据 |
CN102255955A (zh) * | 2011-06-22 | 2011-11-23 | 浙江工商大学 | 基于依赖关系的Web服务动态组合方法 |
CN102508839A (zh) * | 2011-09-22 | 2012-06-20 | 用友软件股份有限公司 | 数据处理装置和方法 |
CN102841938A (zh) * | 2012-08-14 | 2012-12-26 | 北京久其软件股份有限公司 | 一种参数化报表的生成方法及系统 |
CN103336843A (zh) * | 2013-07-18 | 2013-10-02 | 山东中创软件工程股份有限公司 | 一种数据集成方法及装置 |
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和系统 |
CN103902574A (zh) * | 2012-12-27 | 2014-07-02 | 中国移动通信集团内蒙古有限公司 | 一种基于数据流技术的实时数据加载方法和装置 |
CN103942245A (zh) * | 2014-02-19 | 2014-07-23 | 浪潮软件股份有限公司 | 基于元数据的数据抽取方法 |
CN104123392A (zh) * | 2014-08-11 | 2014-10-29 | 吉林禹硕动漫游戏科技股份有限公司 | 一种关系型数据库迁移到HBase数据库的工具和方法 |
CN104252506A (zh) * | 2013-06-28 | 2014-12-31 | 易保网络技术(上海)有限公司 | 同步构建业务模型和数据仓库模型及其映射的方法及系统 |
CN104317913A (zh) * | 2014-10-28 | 2015-01-28 | 用友软件股份有限公司 | 属性组合的筛选方法和属性组合的筛选装置 |
CN104376053A (zh) * | 2014-11-04 | 2015-02-25 | 南京信息工程大学 | 一种基于海量气象数据的存储与检索方法 |
CN104462344A (zh) * | 2014-12-04 | 2015-03-25 | 北京国双科技有限公司 | 在目标服务器构建etl系统的处理方法及装置 |
CN104731953A (zh) * | 2015-03-31 | 2015-06-24 | 河海大学 | 一种基于r的数据预处理系统的构建方法 |
US9098555B2 (en) * | 2008-11-25 | 2015-08-04 | Dell Products L.P. | Method and system for health scoring information systems, users, and updates |
CN105069117A (zh) * | 2015-08-11 | 2015-11-18 | 国网技术学院 | 一种基于存储过程的数据流效率提升方法 |
-
2015
- 2015-12-24 CN CN201510990185.XA patent/CN106921614B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1826601A (zh) * | 2003-08-29 | 2006-08-30 | 瑞士银行股份有限公司 | 多用途数据的无冗余提供 |
CN101305365A (zh) * | 2004-12-17 | 2008-11-12 | 亚马逊科技公司 | 用于进行数据仓储的设备和方法 |
CN101689210A (zh) * | 2007-06-21 | 2010-03-31 | 微软公司 | 聚集和搜索来自多个服务的简档数据 |
US9098555B2 (en) * | 2008-11-25 | 2015-08-04 | Dell Products L.P. | Method and system for health scoring information systems, users, and updates |
CN102255955A (zh) * | 2011-06-22 | 2011-11-23 | 浙江工商大学 | 基于依赖关系的Web服务动态组合方法 |
CN102508839A (zh) * | 2011-09-22 | 2012-06-20 | 用友软件股份有限公司 | 数据处理装置和方法 |
CN102841938A (zh) * | 2012-08-14 | 2012-12-26 | 北京久其软件股份有限公司 | 一种参数化报表的生成方法及系统 |
CN103902574A (zh) * | 2012-12-27 | 2014-07-02 | 中国移动通信集团内蒙古有限公司 | 一种基于数据流技术的实时数据加载方法和装置 |
CN104252506A (zh) * | 2013-06-28 | 2014-12-31 | 易保网络技术(上海)有限公司 | 同步构建业务模型和数据仓库模型及其映射的方法及系统 |
CN103336843A (zh) * | 2013-07-18 | 2013-10-02 | 山东中创软件工程股份有限公司 | 一种数据集成方法及装置 |
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和系统 |
CN103942245A (zh) * | 2014-02-19 | 2014-07-23 | 浪潮软件股份有限公司 | 基于元数据的数据抽取方法 |
CN104123392A (zh) * | 2014-08-11 | 2014-10-29 | 吉林禹硕动漫游戏科技股份有限公司 | 一种关系型数据库迁移到HBase数据库的工具和方法 |
CN104317913A (zh) * | 2014-10-28 | 2015-01-28 | 用友软件股份有限公司 | 属性组合的筛选方法和属性组合的筛选装置 |
CN104376053A (zh) * | 2014-11-04 | 2015-02-25 | 南京信息工程大学 | 一种基于海量气象数据的存储与检索方法 |
CN104462344A (zh) * | 2014-12-04 | 2015-03-25 | 北京国双科技有限公司 | 在目标服务器构建etl系统的处理方法及装置 |
CN104731953A (zh) * | 2015-03-31 | 2015-06-24 | 河海大学 | 一种基于r的数据预处理系统的构建方法 |
CN105069117A (zh) * | 2015-08-11 | 2015-11-18 | 国网技术学院 | 一种基于存储过程的数据流效率提升方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110018A (zh) * | 2018-01-30 | 2019-08-09 | 普天信息技术有限公司 | 存储的处理方法、装置、电子设备和存储介质 |
CN110457348A (zh) * | 2018-05-02 | 2019-11-15 | 北京三快在线科技有限公司 | 一种数据处理方法及装置 |
CN109542891A (zh) * | 2018-10-18 | 2019-03-29 | 北京新唐思创教育科技有限公司 | 数据融合方法及计算机存储介质 |
CN109542891B (zh) * | 2018-10-18 | 2021-04-09 | 北京新唐思创教育科技有限公司 | 数据融合方法及计算机存储介质 |
CN109614417A (zh) * | 2018-10-30 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 基于数据流的报表指标的显示方法、装置及终端 |
CN109614417B (zh) * | 2018-10-30 | 2020-09-22 | 北京奇艺世纪科技有限公司 | 基于数据流的报表指标的显示方法、装置及终端 |
CN112668287A (zh) * | 2019-09-30 | 2021-04-16 | 北京国双科技有限公司 | 数据表确定方法、系统及装置 |
CN112015738A (zh) * | 2020-08-28 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 用于实现多个数据明细表的联表处理的方法及装置 |
CN112528613A (zh) * | 2020-12-21 | 2021-03-19 | 金蝶软件(中国)有限公司 | 一种数据表生成方法及其相关设备 |
CN113806332A (zh) * | 2021-08-23 | 2021-12-17 | 北京金蝶云基科技有限公司 | 一种异构系统集成数据处理方法、装置和计算机设备 |
CN113806332B (zh) * | 2021-08-23 | 2024-03-19 | 北京金蝶云基科技有限公司 | 一种异构系统集成数据处理方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106921614B (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106921614A (zh) | 业务数据处理方法和装置 | |
CN106708841B (zh) | 网站访问路径的聚合方法和装置 | |
CN106658096A (zh) | 推送直播节目的方法和装置 | |
CN106326219A (zh) | 核对业务系统数据的方法、装置及系统 | |
CN105323601A (zh) | 基于多屏用户行为数据的人员属性标识方法 | |
CN103548076A (zh) | 利用音频信号来识别内容的装置和方法 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
CN101711392A (zh) | 视频检测系统和方法 | |
CN110083714A (zh) | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 | |
CN106528787A (zh) | 一种基于海量数据多维分析的查询方法及装置 | |
CN105138611A (zh) | 短信类别识别方法及装置 | |
CN107392684A (zh) | 一种获取电子发票抬头信息的方法及相关系统 | |
CN106933935A (zh) | 任务存储方法和装置 | |
CN108153719A (zh) | 合并电子表格的方法和装置 | |
CN105989102A (zh) | 一种备份数据的删除方法及装置 | |
CN101739439A (zh) | 一种基于模板的统计对象动态定制方法和系统 | |
CN106649368A (zh) | 数据存储方法、装置和数据查询方法、装置 | |
CN106933897A (zh) | 数据查询方法和装置 | |
CN108259489A (zh) | 一种投票数据处理方法、装置及电子设备 | |
CN104598520B (zh) | 一种处理商品信息的方法和装置 | |
CN108073641A (zh) | 查询数据表的方法和装置 | |
CN112232290B (zh) | 数据聚类方法、服务器、系统以及计算机可读存储介质 | |
CN112307297B (zh) | 一种基于优先级规则的用户标识统一方法及系统 | |
CN108053275A (zh) | 一种在线产品筛选方法、系统及存储介质 | |
CN108090095B (zh) | 批量重建数据库的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |