CN104298671B - 数据统计分析方法及装置 - Google Patents

数据统计分析方法及装置 Download PDF

Info

Publication number
CN104298671B
CN104298671B CN201310298192.4A CN201310298192A CN104298671B CN 104298671 B CN104298671 B CN 104298671B CN 201310298192 A CN201310298192 A CN 201310298192A CN 104298671 B CN104298671 B CN 104298671B
Authority
CN
China
Prior art keywords
task
parameters
database
data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310298192.4A
Other languages
English (en)
Other versions
CN104298671A (zh
Inventor
梅迎春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN201310298192.4A priority Critical patent/CN104298671B/zh
Publication of CN104298671A publication Critical patent/CN104298671A/zh
Application granted granted Critical
Publication of CN104298671B publication Critical patent/CN104298671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Abstract

本发明公开了一种数据统计分析方法及装置,所述方法包括:解析所接收的任务参数,按照预设规则组装数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中。通过本发明的技术方案,解决了相关技术中无法获知任务的操作记录和执行任务后的统计分析结果的问题。

Description

数据统计分析方法及装置
技术领域
本发明涉及数据库技术,尤其涉及一种数据统计分析方法及装置。
背景技术
Hive是基于Apache分布式框架Hadoop的数据仓库工具,用于存储和处理海量结构化数据,Hive将数据存储于Hadoop分布式文件系统(HDFS,Hadoop Distributed FileSystem),采用类似数据库的数据存储和处理机制,并采用HQL(Hive Query Language)对这些数据进行自动化管理和处理。
分布式的、面向列的数据库HBase可以使用本地文件系统或HDFS存储数据,但为了提高数据可靠性和系统的健壮性,发挥HBase处理大数据量的优势时需要使用HDFS作为存储数据的文件系统。
Hive将海量结构化数据映射到一张数据库表中,而实际上这些数据分布式地存储在HDFS中,Hive对数据分析人员下达的命令语句进行解析和转换,最终生成一系列基于Hadoop的映射/规约(Map/Reduce)模型的任务(Job),由Hadoop执行这些任务完成对数据的统计分析。
目前,数据分析人员直接操作Hive时需要有较高的专业操作技能,不利于该技术的推广,并且,Hive的一些功能例如用户定义函数(UDF,User Defined Function)需要频繁加载,操作繁琐且效率低下;对于频繁执行或者定期执行的对HBase的数据文件进行统计分析的任务,通常编写脚本通过任务管理工具Cron来调度执行,实际应用中任务数量较多,且管理人员无从得知脚本具体的功能,因此无法得知相应任务的操作记录,任务失败时也就无法进行恢复操作。
综上所述,由于相关技术中无法获知脚本的具体功能,因此无法获知任务的操作记录以及任务的统计分析结果。
发明内容
有鉴于此,本发明的主要目的在于提供一种数据统计分析方法及装置,以解决相关技术中无法获知任务的操作记录以及任务的统计分析结果的问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种数据统计分析方法,该方法支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,该方法包括:
解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;
根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中。
优选地,解析所接收的任务参数之前,该方法还包括:
将所接收的任务参数存储至缓冲存储器;
持久化所接收的任务参数至所述数据库;
在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器。
优选地,所述任务参数包括:任务身份标识(ID,IDentity)、任务对应的命令语句;
相应地,所述解析所接收的任务参数之前,该方法还包括:
确定所述存储缓冲器中未存储所述任务ID,且所述命令语句有效。
优选地,所述解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作,包括:
解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与所述任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段。
优选地,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
相应地,所述根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中,包括:
根据所述命令语句和所述任务关联的编程模型生成任务,在确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时,调度所述分布式框架而执行所生成的任务,并将执行所述任务的记录和执行所述任务后确定的统计分析的结果,存储至所述数据库中所述查询字段对应的字段。
本发明还提供了一种数据统计分析装置,该装置支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,该装置包括:接收模块、解析建表模块、任务生成模块和调度执行模块;其中,
所述接收模块,用于接收任务参数;
所述解析建表模块,用于解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;
所述任务生成模块,用于根据所述任务参数生成所述任务参数对应的任务;
所述调度执行模块,用于根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
优选地,该装置还包括缓冲存储器和发送模块;其中,
所述接收模块,还用于将接收的任务参数存储至所述缓冲存储器;持久化所接收的任务参数至所述数据库;
所述发送模块,用于在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器。
优选地,所述任务参数包括:任务ID、任务对应的命令语句;
该装置还包括:确定模块,用于确定所述存储缓冲器中未存储所述任务ID,且所述命令语句有效时,触发所述解析建表模块。
优选地,所述解析建表模块,还用于解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与所述任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段。
优选地,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
所述任务生成模块,还用于根据所述命令语句和所述任务关联的编程模型生成任务;
所述确定模块,还用于确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时触发所述调度执行模块;
所述调度执行模块,还用于调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
本发明所提供的技术方案中,根据任务参数在数据库中建立与任务对应的表,并根据所述任务参数调度分布式框架执行根据任务参数生成的任务,而任务执行后统计分析的结果存储在所建立的表中,解决了无法获知任务操作记录及任务统计分析结果的问题;
进一步地,在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器,保证了任务执行的健壮性和稳定性;
进一步地,确定所述存储缓冲器中未存储所述任务ID,且所述命令语句有效,如此,在任务ID重复或任务对应的命令语句无效时,方便了数据分析人员及时排查错误,提高了数据统计分析效率;
进一步地,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与所述任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段,方便了数据分析人员查询执行失败的任务,以及时恢复任务;
进一步地,通过任务对应的状态标识、任务执行日期和任务执行时间来调度分布式框架执行所生成的任务,实现了高效地对任务进行管理。
附图说明
图1为本发明实施例的数据统计分析方法的实现流程示意图;
图2为本发明实施例的数据统计分析装置的组成结构示意图;
图3为本发明实施例的预定义任务的实现流程示意图;
图4为本发明实施例的调度执行任务的实现流程示意图。
具体实施方式
本发明的基本思想是:通过预设类型的任务参数,例如任务ID、任务对应的命令语句,任务状态标识等区分任务,并根据任务参数在数据库中建立与任务ID对应的表,并在表中建立与任务对应命令语句的查询字段对应的字段,通过该字段存储任务的操作记录和统计分析结果。
下面结合附图及具体实施例对本发明做进一步详细的说明。
本发明实施例记载了一种数据统计分析方法,该方法支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,图1为本发明实施例的数据统计分析方法的实现流程示意图,如图1所示,主要包括以下步骤:
步骤101:解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;
步骤102:根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中。
优选地,解析所接收的任务参数之前,还包括:
将所接收的任务参数存储至缓冲存储器;
持久化所接收的任务参数至所述数据库;
在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器。
优选地,所述任务参数包括:任务ID、任务对应的命令语句;
相应地,所述解析所接收的任务参数之前,该方法还包括:
确定所述存储缓冲器中未存储所述任务ID,且所述命令语句有效。
优选地,所述解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作,包括:
解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与所述任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段。
优选地,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
相应地,所述根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所述任务,将执行所述任务后的统计分析的结果存储至在所述数据库建立的表中,包括:
根据所述命令语句和所述任务关联的编程模型生成任务,在确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时,调度所述分布式框架而执行所生成的任务,并将执行所述任务的记录和执行所述任务后确定的统计分析的结果,存储至所述数据库中所述查询字段对应的字段。
其中,所述数据仓库工具可以采用Hive,所述分布式框架可以采用开源分布式框架Hadoop,相应地,所述数据库为对应Hadoop的数据库HBase,所述任务关联的编程模型为映射/规约(Map/Reduce)模型。
其中,所述任务对应的命令语句可以采用HQL语句,也可以根据实际的应用场景定义所使用的语句。
需要说明的是,本发明实施例中所述的任务参数不仅限于以上所述,例如,任务参数还可以包括:任务名称、任务描述(任务的功能或用途)。
本发明实施例还记载了一种数据统计分析装置,该装置支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,图2为本发明实施例的数据统计分析装置的组成结构示意图,如图2所示,该装置包括:接收模块21、解析建表模块22、任务生成模块23和调度执行模块24;其中,
所述接收模块21,用于接收任务参数;
所述解析建表模块22,用于解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;
所述任务生成模块23,用于根据所述任务参数生成所述任务参数对应的任务;
所述调度执行模块24,用于根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
所述接收模块21,可以通过显示器显示对应任务的界面,来提示操作人员输入任务对应的参数信息,并通过输入设备接收对应的任务参数。
优选地,该装置还包括缓冲存储器25和发送模块26;其中,
所述接收模块21,还用于将接收的任务参数存储至所述缓冲存储器25;持久化所接收的任务参数至所述数据库;
所述发送模块26,用于在所述缓冲存储器25存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器25。
优选地,所述任务参数包括:任务ID、任务对应的命令语句;
该装置还包括:确定模块27,用于确定所述存储缓冲器25中未存储所述任务ID,且所述命令语句有效时,触发所述解析建表模块22。
优选地,所述解析建表模块22,还用于解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与所述任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段。
优选地,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
所述任务生成模块23,还用于根据所述命令语句和所述任务关联的编程模型生成任务;
所述确定模块27,还用于确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时触发所述调度执行模块24;
所述调度执行模块24,还用于调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
其中,所述数据仓库工具可以采用Hive,所述分布式框架可以采用开源分布式框架Hadoop,相应地,所述数据库为对应Hadoop的数据库HBase,所述任务关联的编程模型为Map/Reduce模型。
其中,所述任务对应的命令语句可以采用HQL语句,也可以根据实际的应用场景定义所使用的语句。
需要说明的是,本发明实施例中所述的任务参数不仅限于以上所述,例如,任务参数还可以包括:任务名称、任务描述(任务的功能或用途)。
下面以预定义任务,即解析接收的任务参数,并进行相应的初始化为例,对本发明实施例记载的数据统计分析方法及装置作进一步详细说明,图3为本发明实施例的预定义任务的实现流程示意图,如图3所示,主要包括以下步骤:
步骤301:接收任务参数;
任务参数包括:任务ID、任务对应的HQL语句;任务参数还可以包括:任务状态标识、任务执行日期、任务执行时间和任务关联的Map/Reduce模型。
步骤302:检验任务参数;
步骤303:判断任务参数检验是否通过,如果通过则执行步骤305;否则,执行步骤304;
存储缓冲器中未存储所述任务ID,且所述命令语句有效时,则任务参数检验通过。
步骤304:返回检验失败消息;
步骤305:存储任务参数至缓冲存储器;
步骤306:持久化任务信息至HBase;
步骤307:初始化运行环境;
解析任务参数中的HQL语句,从HQL语句的解析结果中提取查询字段,在HBase中建立与任务ID对应的表,在对应的表中建立与查询字段对应的字段。
步骤308:返回初始化成功消息。
下面以调度执行任务,即调度分布式框架Hadoop执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在HBase所建立的对应的表中为例,对本发明实施例记载的数据统计分析方法即装置作进一步详细说明,图4为本发明实施例的调度执行任务的实现流程示意图,如图4所示,主要包括以下步骤:
步骤401:根据任务参数为任务分配资源;
本发明实施例中为任务分配的资源可以采用线程的形式。
步骤402:查找任务对应的HQL语句;
步骤403:读取任务关联的数据文件;
任务关联的数据文件位于HBase中。
步骤404:调用Map/Reduce模型执行生成的任务,对数据文件进行统计分析;
步骤405:解析统计分析后的数据文件,将解析后的数据文件存储至HBase;
步骤406:操作记录和执行任务后的统计分析的结果存储至HBase。
操作记录,即任务执行日志,通过任务跟踪(Jobtrace)对象获取。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (8)

1.一种数据统计分析方法,其特征在于,该方法支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,该方法包括:
解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作,包括:解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段;
根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中。
2.根据权利要求1所述的方法,其特征在于,解析所接收的任务参数之前,该方法还包括:
将所接收的任务参数存储至缓冲存储器;
持久化所接收的任务参数至所述数据库;
在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器。
3.根据权利要求2所述的方法,其特征在于,所述任务参数包括:任务身份标识ID、任务对应的命令语句;
相应地,所述解析所接收的任务参数之前,该方法还包括:
确定所述缓冲存储器中未存储所述任务ID,且所述命令语句有效。
4.根据权利要求3所述的方法,其特征在于,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
相应地,所述根据所述任务参数生成所述任务参数对应的任务,并根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果存储至在所述数据库所建立的对应的表中,包括:
根据所述命令语句和所述任务关联的编程模型生成任务,在确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时,调度所述分布式框架而执行所生成的任务,并将执行所述任务的记录和执行所述任务后确定的统计分析的结果,存储至所述数据库中所述查询字段对应的字段。
5.一种数据统计分析装置,其特征在于,该装置支持数据仓库工具对基于分布式框架的数据库中的数据进行统计分析,所述数据库中的数据与对所述数据库中的数据进行统计分析的任务预关联,该装置包括:接收模块、解析建表模块、任务生成模块和调度执行模块;其中,
所述接收模块,用于接收任务参数;
所述解析建表模块,用于解析所接收的任务参数,按照预设规则组装所述数据库的建表语句,并根据所述建表语句在所述数据库中执行建表操作;
所述解析建表模块,还用于解析所述任务参数中的命令语句,从所述命令语句的解析结果中提取查询字段,在所述数据库中建立与任务ID对应的表,在所述对应的表中建立与所述查询字段对应的字段;
所述任务生成模块,用于根据所述任务参数生成所述任务参数对应的任务;
所述调度执行模块,用于根据所述任务参数调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
6.根据权利要求5所述的装置,其特征在于,该装置还包括缓冲存储器和发送模块;其中,
所述接收模块,还用于将接收的任务参数存储至所述缓冲存储器;持久化所接收的任务参数至所述数据库;
所述发送模块,用于在所述缓冲存储器存储的任务参数丢失时,将所述数据库中的任务参数发送至所述缓冲存储器。
7.根据权利要求6所述的装置,其特征在于,所述任务参数包括:任务ID、任务对应的命令语句;
该装置还包括:确定模块,用于确定所述缓冲存储器中未存储所述任务ID,且所述命令语句有效时,触发所述解析建表模块。
8.根据权利要求7所述的装置,其特征在于,所述任务参数还包括:任务状态标识、任务执行日期、任务执行时间和任务关联的编程模型;
所述任务生成模块,还用于根据所述命令语句和所述任务关联的编程模型生成任务;
所述确定模块,还用于确定所生成的任务对应的状态标识为开启时,在所述任务执行日期的所述任务执行时间指定的时间到来时触发所述调度执行模块;
所述调度执行模块,还用于调度所述分布式框架执行所生成的任务,将执行所生成的任务后确定的统计分析的结果,存储至在所述数据库所建立的对应的表中。
CN201310298192.4A 2013-07-16 2013-07-16 数据统计分析方法及装置 Active CN104298671B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310298192.4A CN104298671B (zh) 2013-07-16 2013-07-16 数据统计分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310298192.4A CN104298671B (zh) 2013-07-16 2013-07-16 数据统计分析方法及装置

Publications (2)

Publication Number Publication Date
CN104298671A CN104298671A (zh) 2015-01-21
CN104298671B true CN104298671B (zh) 2018-02-13

Family

ID=52318399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310298192.4A Active CN104298671B (zh) 2013-07-16 2013-07-16 数据统计分析方法及装置

Country Status (1)

Country Link
CN (1) CN104298671B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045602B (zh) * 2015-08-24 2019-07-23 北京金山安全软件有限公司 一种构建Hadoop应用开发框架的方法、装置及电子装置
CN106528070B (zh) * 2015-09-15 2019-09-03 阿里巴巴集团控股有限公司 一种数据表生成方法及设备
CN106503210A (zh) * 2016-11-03 2017-03-15 北京集奥聚合科技有限公司 一种hive持久化函数的控制方法及系统
CN109977139B (zh) * 2019-03-18 2022-12-02 京东科技控股股份有限公司 基于类结构化查询语句的数据处理方法和装置
CN111611077A (zh) * 2020-05-20 2020-09-01 北京字节跳动网络技术有限公司 任务参数处理方法、终端和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214236A (zh) * 2011-06-30 2011-10-12 北京新媒传信科技有限公司 一种海量数据处理方法和系统
CN102880503A (zh) * 2012-08-24 2013-01-16 新浪网技术(中国)有限公司 数据分析系统及数据分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7299466B2 (en) * 2001-12-20 2007-11-20 Cadence Design Systems, Inc. Mechanism for managing execution environments for aggregated processes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214236A (zh) * 2011-06-30 2011-10-12 北京新媒传信科技有限公司 一种海量数据处理方法和系统
CN102880503A (zh) * 2012-08-24 2013-01-16 新浪网技术(中国)有限公司 数据分析系统及数据分析方法

Also Published As

Publication number Publication date
CN104298671A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
CN106104533B (zh) 处理大型数据储存库中的数据集
CN104298671B (zh) 数据统计分析方法及装置
Yang et al. A system architecture for manufacturing process analysis based on big data and process mining techniques
CN105426394B (zh) 基于跨平台的移动报表生成方法和系统
CN108319547A (zh) 测试用例生成方法、装置和系统
CN109656963B (zh) 元数据获取方法、装置、设备及计算机可读存储介质
CN107957940B (zh) 一种测试日志处理方法、系统及终端
CN108038207A (zh) 一种日志数据处理系统、方法和服务器
CN107577586B (zh) 一种用于确定分布式系统中业务执行链路的方法和设备
AU2019201821B2 (en) Generating an execution script for configuration of a system
CN104102701B (zh) 一种基于hive的历史数据存档与查询方法
CN107526645A (zh) 一种通信优化方法及系统
CN106528169B (zh) 一种基于AnGo动态演化模型的Web系统开发可复用方法
US10990359B2 (en) Use and advancements of assistive technology in automation for the visually-impaired workforce
KR20200046769A (ko) 보고서 자동 생성 기반의 업무 프로세스 관리 시스템 제공 방법
CN109684332A (zh) 一种数据宽表生成方法、装置及系统
US20240036563A1 (en) Method and system for determining maintenance time of pipe networks of natural gas
CN108134812A (zh) 数据处理方法和装置
CN109800081A (zh) 一种大数据任务的管理方法及相关设备
CN113806429A (zh) 基于大数据流处理框架的画布式日志分析方法
CN107515866A (zh) 一种数据操作方法、装置和系统
CN106802865A (zh) 用于软件测试的应答模拟装置及方法
CN103218682A (zh) 基于Web服务编排描述语言的多方协同业务流程监控系统
CN108153896A (zh) 针对输入数据、输出数据的处理方法及装置
CN109190969A (zh) 称重设备管控方法、系统、称重设备管理中间件及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant