CN107423203A - 非侵入式Hadoop应用性能分析装置和方法 - Google Patents

非侵入式Hadoop应用性能分析装置和方法 Download PDF

Info

Publication number
CN107423203A
CN107423203A CN201710255494.1A CN201710255494A CN107423203A CN 107423203 A CN107423203 A CN 107423203A CN 201710255494 A CN201710255494 A CN 201710255494A CN 107423203 A CN107423203 A CN 107423203A
Authority
CN
China
Prior art keywords
performance
module
data
hadoop
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710255494.1A
Other languages
English (en)
Inventor
刘鹏
王杰瑞
华幸成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710255494.1A priority Critical patent/CN107423203A/zh
Publication of CN107423203A publication Critical patent/CN107423203A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3404Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for parallel or distributed programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种非侵入式的Hadoop应用性能分析装置,包括依次信号相连的动态追踪模块,数据聚合模块和数据分析模块。动态追踪模块,用于为子任务添加JVM代理程序,在子任务启动时通过二进制代码动态插桩的方式动态注入字节码,对子任务的性能事件进行动态追踪,并将性能事件记录在性能日志文件中;数据聚合模块,用于将集群所有节点中的性能日志文件进行汇总处理;所述数据分析模块,用于对汇总处理后得到的性能事件进行分析,生成应用程序性能分析结果。本发明还提供一种非侵入式Hadoop应用性能分析方法,实现了动态获取应用程序的运行时信息并重构出高层的应用运行时数据流模型和行为特性,帮助用户了解Hadoop应用程序的性能,并指明其性能调优方向。

Description

非侵入式Hadoop应用性能分析装置和方法
技术领域
本发明涉及大数据处理分析领域,具体涉及一种非侵入式Hadoop应用性能分析装置和方法。
背景技术
在大数据时代,越来越多的公司、研究机构及政府部门都在源源不断地从互联网、传感器网络或社交网络中收集海量的数据。从海量的数据中挖掘出有效的信息目前正得到越来越多的关注。Hadoop是Apache软件基金会中的一个开源分布式数据处理框架,也是当前使用最为广泛的大数据分析与处理平台。由于Hadoop具有高可扩展性、容错处理机制以及数据并行处理等特性,目前已经被很多公司和学术机构采用。
得益于Hadoop提供的基础数据处理平台,用户可以基于MapReduce编程模型快速地开发海量数据处理应用,并可以充分地利用Hadoop所提供的数据高度并行处理的特性。这使得处理海量数据变得高效且易于操作。用户可以从分布式数据处理的很多混乱而复杂的细节中抽离出来,诸如数据分割、任务分布、任务调度、负载均衡、容错处理、节点通信等。用户只需要关注数据处理的业务逻辑,而无须关注更底层的实现细节。这一举措虽然简化了用户编写分布式数据处理应用的复杂度,但是由于Hadoop框架隐藏了底层的实现细节,却也使得用户很难理解这些应用在分布式集群中的运行时行为。这样所带来的后果在于,用户可以基于Hadoop简单而快速地编写处理海量数据的应用,但是对这些应用的性能进行分析却难以着手。
目前,分析Hadoop应用程序运行性能的主要手段是通过监控系统的资源利用情况(如CPU、内存、磁盘的利用率)或者通过查看Hadoop的系统日志来了解应用程序的运行时的状态。但是,这种方式只能够获取到Hadoop应用运行时系统的整体概况,无法动态获取应用程序运行时较为关键应用级的性能数据。另外,Hadoop框架支持在指定的任务中使用传统的Java性能分析工具,如HPROF[1],但这会带来较高的性能开销,因而通常只能用于少量的子任务中。随着分布式系统及大数据应用的不断发展,陆续也有一些分布式系统的跟踪框架被提出来,如Magpie[2],X-Trace[3]及Dapper[4]等。这类系统的设计目标是将追踪元数据作为请求在系统中进行传播,进而对性能事件进行追踪。但是,如果要使用这一类系统对Hadoop应用进行动态追踪,需要对Hadoop应用的源码及消息模式进行修改,难以直接在生产环境中加以使用。
动态获取Hadoop应用运行时的性能数据并进行性能分析比较复杂且难度较大。其原因主要如下:首先,为了应对大规模数据的分析与处理,基于Hadoop平台编写的大数据应用通常都运行在由很多台机器组成的分布式集群中,分布式集群中的多个节点需要协同进行工作。其次,一个应用在提交至Hadoop平台中运行时,为了充分地达到并行处理的效果,该作业会被分解为大量的Map与Reduce子任务,每个子任务都由单独的进程来完成。在Hadoop2.0之后引入了新的资源管理系统YARN,YARN通过将计算资源封装为容器的方式动态分配给子任务,底层的资源管理和分配对应用而言是透明的。此外,在对Hadoop应用进行性能分析时为了保证其可用性,该方法应该具备非侵入的特征,即不修改既有的Hadoop的部署环境和运行方式,且引入的性能开销不应该影响到应用程序的正常运行。
发明内容
本发明要解决的技术问题是提供一种非侵入式Hadoop应用性能分析装置和方法,本发明能够动态获取应用程序的运行时信息并重构出高层的应用运行时数据流模型和行为特性,帮助用户了解Hadoop应用程序的性能,为应用程序的性能调优指明方向。
为了解决上述技术问题,本发明提供一种非侵入式的Hadoop应用性能分析装置,包括依次信号相连的动态追踪模块,数据聚合模块和数据分析模块;
所述动态追踪模块,用于为子任务添加JVM代理程序,在子任务启动时通过二进制代码动态插桩的方式动态注入字节码,对子任务的性能事件进行动态追踪,并将性能事件记录在性能日志文件中;
所述数据聚合模块,用于将集群所有节点中由动态追踪模块所记录的性能日志文件进行汇总处理;
所述数据分析模块,用于对通过数据聚合模块所汇总处理后得到的性能事件进行分析,生成应用程序性能分析结果。
作为本发明的非侵入式的Hadoop应用性能分析装置的改进:所述数据聚合模块包括依次信号相连的数据转发模块、数据收集模块和数据存储模块;所述数据转发模块与动态追踪模块信号相连;
数据转发模块在集群的所有从节点中运行,用于将当前节点中由动态追踪模块所记录的性能日志文件转发到主节点中;
数据收集模块在集群的主节点中运行,用于将所有从节点中通过数据转发模块转发的性能日志文件汇聚到主节点中;
数据存储模块在集群的主节点中运行,用于对主节点中所有经数据收集模块汇聚的性能日志文件进行持久化处理,将性能事件结构化存储在数据库中。
备注说明:在分布式系统中,系统由许多台机器构成集群,集群中的每一台机器即为一个节点。Hadoop采用主从式结构,主节点负责管理和协调其它的所有从节点。数据转发模块运行在集群中所有的从节点中,数据收集模块在Hadoop集群的主节点中运行。
作为本发明的非侵入式的Hadoop应用性能分析装置的进一步改进:所述数据分析模块包括依次信号相连的查询统计模块和可视化模块;所述查询统计模块与数据存储模块信号相连;
查询统计模块,用于查询数据存储模块所结构化存储在数据库中原始的性能事件,生成统计信息;
可视化模块,根据查询统计模块所生成的性能事件统计信息生成可视化图表,还原应用程序在Hadoop集群中运行时的性能特性;
所述可视化图表包括:
时间轴维度,还原应用程序在Hadoop集群中运行时子任务的调度、子任务的并行度等信息;
数据分布维度,反映出应用程序运行过程中数据的流动、数据分布的均匀性等信息;
时间热点维度,还原应用程序中不同操作的耗时信息、识别热点操作。
本发明还同时提供了一种非侵入式Hadoop应用性能分析方法,包含以下步骤:
1)、启用性能分析(提交作业时添加控制参数启用性能分析):
用户在提交作业时通过添加相应的控制参数为应用程序启用性能分析;
2)、添加代理程序(代理程序动态注入字节码):
在分布式集群的所有节点中,通过动态追踪模块为子任务添加JVM代理程序,子任务的JVM代理程序在子任务启动时通过二进制代码动态插桩的方式动态注入字节码;
3)、动态追踪并记录(对子任务的性能事件进行动态追踪,生成性能日志文件):
在分布式集群的所有节点中,动态追踪模块对所有子任务的性能事件进行动态追踪,生成性能日志文件;
4)、汇总性能日志文件(汇总分散在集群中的性能日志):
数据聚合模块对分散在集群所有节点中的性能日志进行聚合,将所有从节点中的性能日志文件汇总到主节点中;
5)、获取应用性能分析结果(分析性能事件,获取应用性能分析结果):
数据分析模块分析通过数据聚合模块汇总的所有子任务的性能事件,获取应用性能分析结果。
作为本发明的Hadoop应用性能分析方法的改进:所述步骤2)中,使用Java标准API中提供的java.lang.instrument包为子任务添加JVM代理程序,JVM代理程序在JVM执行类加载操作时对字节码进行修改,向原始的Java类中的目标方法中注入字节码,注入的字节码会在目标方法调用时执行,从而动态追踪子任务运行时的性能事件。
作为本发明的Hadoop应用性能分析方法的进一步改进:所述步骤3)中,动态追踪模块为子任务添加的JVM代理程序会创建一个新的事件处理线程,在该线程中使用事件监听模式监听指定的性能事件,从而降低动态追踪的性能开销。
作为本发明的Hadoop应用性能分析方法的进一步改进:所述步骤4)中,主节点中的数据收集模块和所有从节点中的数据转发模块进行通信,通过网络传输的方式将所有从节点中的性能日志文件汇总到主节点中。
作为本发明的Hadoop应用性能分析方法的进一步改进:所述步骤4)中,主节点中的数据收集模块在对所有从节点中的性能日志文件进行汇总后,为了便于后续的查询和管理,使用数据存储模块将所有的性能事件在数据库中进行结构化存储。
作为本发明的Hadoop应用性能分析方法的进一步改进:所述步骤5)中,在查询统计模块对所有的性能数据进行统计分析的基础上,通过可视化模块生成可视化的图表,从时间轴、数据分布和时间热点这三个维度重构出高层的应用运行时数据流模型和行为特性。
本发明具有如下技术优势:
1.本发明在进行性能事件动态追踪时使用了一种非侵入的方式,通过二进制字节码动态插桩技术在任务运行时动态注入监听性能事件的字节码,无需修改Hadoop系统的源码,也无需修改已经部署的Hadoop集群环境。
2.本发明采用分布式架构,可以在集群所有节点中针对应用程序的所有子任务进行动态追踪,从而获取到更加全面的性能数据。
3.本发明利用采集的性能数据重构出高层的应用运行时数据流模型和行为特性,并通过可视化图表直观还原出应用程序的行为特性。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为本发明的非侵入式Hadoop应用性能分析装置的示意性框图。
图2为图1中数据存储模块123在结构化存储数据时使用的实体-关系模型。
图3为本发明的非侵入式Hadoop应用性能分析方法的流程图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此。
实施例1、一种非侵入式Hadoop应用性能分析装置,如图1、2所示,包括依次信号相连的动态追踪模块110、数据聚合模块120、数据分析模块130。
动态追踪模块110用于动态追踪所有子任务中发生的性能事件,并将性能事件记录在性能日志文件中。在动态追踪模块110中,针对Hadoop应用程序运行时如任务启动和结束、进入或退出关键的函数等关键性能事件制订了一系列事件触发规则,当这些规则描述的事件发生时,该规则相关联的如记录事件发生的时间、获取方法执行时间、获取函数运行时实参等动作就会被触发,相应的运行时信息被记录在性能日志中。性能日志中的每一条记录由三个字段构成:1)时间戳(Timestamp)记录了该条记录的获取时间;2)键(Key)字段保存当前记录对应的事件的描述,如所处的容器、类和方法;3)值(Value)字段则用于保存所追踪到的事件的详细信息,如当前操作花费的时间、处理的数据量的大小等。Hadoop框架是基于Java语言实现的,且在MapReduce应用提交运行时会为每一个Map或Reduce任务启动一个单独的JVM(Java Virtual Machine)进程,即为每一个子任务分配一个容器;一个JVM进程运行时会经历JVM启动、类加载、字节码解释执行等过程,通过二进制字节码动态插桩技术可以在运行时动态修改JVM加载的类的字节码。本实施例中动态追踪模块110采用二进制字节码动态插桩技术来实现动态追踪每一个子任务的性能事件。动态追踪模块110基于Java标准API中提供的java.lang.instrument包为运行子任务的JVM添加代理程序,JVM代理程序在JVM执行类加载操作时对字节码进行修改,向原始的Java类中的目标方法中注入处理事件触发操作的字节码。注入的字节码的主要功能就是将当前发生的性能事件记录在性能日志中。
数据聚合模块120用于汇总处理集群所有节点中的性能日志。数据聚合模块120包括依次信号相连的数据转发模块121、数据收集模块122和数据存储模块123。所述数据转发模块121在Hadoop集群的所有从节点中运行,与动态追踪模块110信号相连,负责将当前节点中通过动态追踪模块110所生成的性能日志文件转发到主节点中;数据收集模块122在Hadoop集群的主节点中运行,负责收集集群所有节点通过数据转发模块121转发至主节点的性能日志文件;数据存储模块123在Hadoop集群的主节点中运行,负责将数据收集模块122汇聚在主节点中所有的性能日志文件进行持久化处理,将性能事件结构化存储在数据库中。该数据库中包含四张表,对应的实体-关系模型如图2所示。其中Job表20中存储作业相关的信息,包括作业的编号job_id、作业的名称job_name、作业的描述信息job_desc以及提交时间summit_time;Container表21中存储了作业运行过程中运行所有子任务的容器相关的信息,包括容器的编号container_id、容器中运行的子任务的类型task_type、当前容器所属的作业的编号job_id、当前容器所在的节点的编号host_id;Event表22中存储了动态追踪模块110收集的所有子任务运行时性能事件相关的信息,包括性能事件的编号event_id、事件所在的容器的编号container_id、事件捕获时的时间戳timestamp、描述事件详细状态的键key和对应的值value;Host表23存储了当前集群中所有节点的编号host_id及其对应的IP地址host_ip。不同表之间通过数据库的外键约束加以关联,其中Container表和Job表通过job_id属性建立链接,Container表和Host表通过host_id属性建立链接,Event表和Container表则通过container_id建立链接。
数据分析模块130用于对性能事件进行分析,生成应用程序性能分析结果。数据分析模块130包括依次信号相连的查询统计模块131和可视化模块132。所述查询统计模块131与数据存储模块123信号相连,用于查询原始的性能事件,并生成统计信息。可视化模块132根据查询统计模块131生成的性能事件统计信息生成可视化图表,还原应用程序在Hadoop集群中运行时的性能特性。可视化模块132可以从三个维度还原应用程序的运行时细节:时间轴维度,还原应用程序在Hadoop集群中运行时子任务的调度、子任务的并行度等信息;数据分布维度,反映出应用程序运行过程中数据的流动、数据分布的均匀性等信息;时间热点维度,还原应用程序中不同操作的耗时信息,识别热点操作。
通过以上所述的非侵入式Hadoop应用性能分析装置可以实现本发明实施例的非侵入式Hadoop应用性能分析方法,流程如图3所示,具体包括以下步骤:
1、提启用性能分析(交作业时添加控制参数启用性能分析):用户在提交作业时通过添加相应的控制参数为应用程序启用性能分析。本发明实施例中非侵入式Hadoop应用性能分析装置中动态追踪模块110提供了一个tracker.jar包作为子任务运行时的代理程序,在提交作业时只需要添加参数:
-D mapreduce.child.java.opts=“-javaagent:tracker.jar=enable=True”
即可为应用程序开启非侵入式Hadoop应用性能分析装置进行性能分析。
2、添加代理程序(代理程序动态注入字节码):开启性能分析后,在分布式集群的所有节点中,动态追踪模块110会为子任务添加JVM代理程序,子任务的JVM代理程序在子任务启动时通过二进制代码动态插桩的方式动态注入用于性能追踪的字节码。
3、动态追踪并记录(对子任务的性能事件进行动态追踪,生成性能日志文件):在分布式集群的所有节点中,动态追踪模块110对所有子任务的性能事件进行动态追踪,在目标性能事件发生时将相应的性能事件记录在性能日志文件中。并且为了减少在一些频繁执行的操作上运用动态追踪技术造成主线程阻塞而导致的性能开销,动态追踪模块110为子任务添加的JVM代理程序会创建一个新的事件处理线程,在该线程中使用事件监听模式监听指定的性能事件,从而降低动态追踪的性能开销。
4、汇总性能日志文件(汇总分散在集群中的性能日志):当Hadoop应用的一个作业运行完成后,非侵入式Hadoop应用性能分析装置运行在主节点中的数据收集模块122与运行在所有从节点中的数据转发模块121进行通信,通过网络传输的方式将分散在不同节点中的性能日志文件进行汇聚。当集群所有节点中的性能日志文件通过数据收集模块122汇聚完成后,主节点中会存在大量零散的性能日志文件。此时主节点中的数据存储模块将123进一步解析汇总的性能日志文件,将解析的结果结构化存储在数据库中。
5、获取应用性能分析结果(分析性能事件,获取应用性能分析结果):数据分析模块130分析汇总的所有子任务的性能事件,获取应用性能分析结果。首先查询统计模块131从数据库中查询原始的性能事件,并生成统计信息;之后可视化模块132根据查询统计模块131所生成的性能事件统计信息生成可视化图表,从时间轴、数据分布和时间热点这三个维度重构出高层的应用运行时数据流模型和行为特性,从而帮助用户发现潜在的性能优化方向。
本发明实施例在对Hadoop应用进行性能事件追踪及性能分析时使用的是一种非侵入的方式,通过二进制字节码动态插桩技术在任务运行时动态注入监听性能事件的字节码,不需要修改Hadoop系统的源码,也无需修改已经部署的Hadoop集群环境;本发明实施例采用了分布式架构,可以在集群所有节点中针对应用程序的所有子任务进行动态追踪,从而获取到更加全面的性能数据,并且在作业完成后对分散的数据加以聚合,结构化存储在数据库中;本发明利用采集的性能数据重构出高层的应用运行时数据流模型和行为特性,并通过可视化图表直观还原出应用程序的行为特性。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的思想所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

Claims (9)

1.非侵入式的Hadoop应用性能分析装置,其特征是:包括依次信号相连的动态追踪模块(110),数据聚合模块(120)和数据分析模块(130);
所述动态追踪模块(110),用于为子任务添加JVM代理程序,在子任务启动时通过二进制代码动态插桩的方式动态注入字节码,对子任务的性能事件进行动态追踪,并将性能事件记录在性能日志文件中;
所述数据聚合模块(120),用于将集群所有节点中由动态追踪模块(110)所记录的性能日志文件进行汇总处理;
所述数据分析模块(130),用于对通过数据聚合模块(120)所汇总处理后得到的性能事件进行分析,生成应用程序性能分析结果。
2.根据权利要求1所述的非侵入式的Hadoop应用性能分析装置,其特征是:所述数据聚合模块(120)包括依次信号相连的数据转发模块(121)、数据收集模块(122)和数据存储模块(123);所述数据转发模块(121)与动态追踪模块(110)信号相连;
数据转发模块(121)在集群的所有从节点中运行,用于将当前节点中由动态追踪模块(110)所记录的性能日志文件转发到主节点中;
数据收集模块(122)在集群的主节点中运行,用于将所有从节点中通过数据转发模块(121)转发的性能日志文件汇聚到主节点中;
数据存储模块(123)在集群的主节点中运行,用于对主节点中所有经数据收集模块(122)汇聚的性能日志文件进行持久化处理,将性能事件结构化存储在数据库中。
3.根据权利要求2所述的非侵入式的Hadoop应用性能分析装置,其特征是:所述数据分析模块(130)包括依次信号相连的查询统计模块(131)和可视化模块(132);所述查询统计模块(131)与数据存储模块(123)信号相连;
查询统计模块(131),用于查询数据存储模块(123)所结构化存储在数据库中原始的性能事件,生成统计信息;
可视化模块(132),根据查询统计模块(131)所生成的性能事件统计信息生成可视化图表,还原应用程序在Hadoop集群中运行时的性能特性;
所述可视化图表包括:
时间轴维度,还原应用程序在Hadoop集群中运行时子任务的调度、子任务的并行度这些信息;
数据分布维度,反映出应用程序运行过程中数据的流动、数据分布的均匀性这些信息;
时间热点维度,还原应用程序中不同操作的耗时信息、识别热点操作。
4.非侵入式Hadoop应用性能分析方法,其特征是包含以下步骤:
1)、启用性能分析:
用户在提交作业时通过添加相应的控制参数为应用程序启用性能分析;
2)、添加代理程序:
在分布式集群的所有节点中,通过动态追踪模块(110)为子任务添加JVM代理程序,子任务的JVM代理程序在子任务启动时通过二进制代码动态插桩的方式动态注入字节码;
3)、动态追踪并记录:
在分布式集群的所有节点中,动态追踪模块(110)对所有子任务的性能事件进行动态追踪,生成性能日志文件;
4)、汇总性能日志文件:
数据聚合模块(120)对分散在集群所有节点中的性能日志进行聚合,将所有从节点中的性能日志文件汇总到主节点中;
5)、获取应用性能分析结果:
数据分析模块(130)分析通过数据聚合模块(120)汇总的所有子任务的性能事件,获取应用性能分析结果。
5.根据权利要求4所述的非侵入式的Hadoop应用性能分析方法,其特征是:所述步骤2)中,使用Java标准API中提供的java.lang.instrument包为子任务添加JVM代理程序,JVM代理程序在JVM执行类加载操作时对字节码进行修改,向原始的Java类中的目标方法中注入字节码,注入的字节码会在目标方法调用时执行,从而动态追踪子任务运行时的性能事件。
6.根据权利要求5所述的非侵入式的Hadoop应用性能分析方法,其特征是:所述步骤3)中,动态追踪模块(110)为子任务添加的JVM代理程序会创建一个新的事件处理线程,在该线程中使用事件监听模式监听指定的性能事件,从而降低动态追踪的性能开销。
7.根据权利要求6所述的非侵入式的Hadoop应用性能分析方法,其特征是:所述步骤4)中,主节点中的数据收集模块(122)和所有从节点中的数据转发模块(121)进行通信,通过网络传输的方式将所有从节点中的性能日志文件汇总到主节点中。
8.根据权利要求7所述的非侵入式的Hadoop应用性能分析方法,其特征是:所述步骤4)中,主节点中的数据收集模块(122)在对所有从节点中的性能日志文件进行汇总后,为了便于后续的查询和管理,使用数据存储模块(123)将所有的性能事件在数据库中进行结构化存储。
9.根据权利要求8所述的非侵入式的Hadoop应用性能分析方法,其特征是:所述步骤5)中,在查询统计模块(131)对所有的性能数据进行统计分析的基础上,通过可视化模块(132)生成可视化的图表,从时间轴、数据分布和时间热点这三个维度重构出高层的应用运行时数据流模型和行为特性。
CN201710255494.1A 2017-04-19 2017-04-19 非侵入式Hadoop应用性能分析装置和方法 Pending CN107423203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710255494.1A CN107423203A (zh) 2017-04-19 2017-04-19 非侵入式Hadoop应用性能分析装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710255494.1A CN107423203A (zh) 2017-04-19 2017-04-19 非侵入式Hadoop应用性能分析装置和方法

Publications (1)

Publication Number Publication Date
CN107423203A true CN107423203A (zh) 2017-12-01

Family

ID=60423928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710255494.1A Pending CN107423203A (zh) 2017-04-19 2017-04-19 非侵入式Hadoop应用性能分析装置和方法

Country Status (1)

Country Link
CN (1) CN107423203A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108466A (zh) * 2017-12-29 2018-06-01 咪咕文化科技有限公司 一种分布式系统日志查询分析方法及装置
CN108446224A (zh) * 2018-03-06 2018-08-24 福建天泉教育科技有限公司 移动端上应用程序的性能分析方法、存储介质
CN109992454A (zh) * 2017-12-31 2019-07-09 中国移动通信集团江西有限公司 故障定位的方法、装置和存储介质
WO2019134223A1 (zh) * 2018-01-08 2019-07-11 平安科技(深圳)有限公司 一种日志生成方法、装置、计算机设备及存储介质
CN110297763A (zh) * 2019-05-29 2019-10-01 联动优势电子商务有限公司 数据采集装置以及方法
CN110347406A (zh) * 2019-07-12 2019-10-18 四川虹美智能科技有限公司 一种采集应用的运行数据的方法及装置
CN111722951A (zh) * 2019-03-21 2020-09-29 北京京东尚科信息技术有限公司 一种异常处理方法及装置、存储介质
CN112306803A (zh) * 2020-10-29 2021-02-02 金蝶云科技有限公司 一种性能监控方法及相关设备
CN112612678A (zh) * 2020-12-29 2021-04-06 中孚安全技术有限公司 一种基于字节码技术的零侵入监控方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063330A (zh) * 2011-01-05 2011-05-18 北京航空航天大学 一种大规模并行程序性能数据采集方法
CN103645961A (zh) * 2013-11-20 2014-03-19 清华大学 计算密集型并行任务的异常检测方法及系统
US20140215443A1 (en) * 2013-01-28 2014-07-31 Rackspace Us, Inc. Methods and Systems of Distributed Tracing
US20150278069A1 (en) * 2014-03-31 2015-10-01 Nec Laboratories America, Inc. Dynamic Border Line Tracing for Tracking Message Flows Across Distributed Systems
CN105700998A (zh) * 2016-01-13 2016-06-22 浪潮(北京)电子信息产业有限公司 一种对并行程序的性能进行监测分析的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063330A (zh) * 2011-01-05 2011-05-18 北京航空航天大学 一种大规模并行程序性能数据采集方法
US20140215443A1 (en) * 2013-01-28 2014-07-31 Rackspace Us, Inc. Methods and Systems of Distributed Tracing
CN103645961A (zh) * 2013-11-20 2014-03-19 清华大学 计算密集型并行任务的异常检测方法及系统
US20150278069A1 (en) * 2014-03-31 2015-10-01 Nec Laboratories America, Inc. Dynamic Border Line Tracing for Tracking Message Flows Across Distributed Systems
CN105700998A (zh) * 2016-01-13 2016-06-22 浪潮(北京)电子信息产业有限公司 一种对并行程序的性能进行监测分析的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈诗然等: "多集群并行作业的性能监测及分析", 《计算机工程》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108466A (zh) * 2017-12-29 2018-06-01 咪咕文化科技有限公司 一种分布式系统日志查询分析方法及装置
CN109992454A (zh) * 2017-12-31 2019-07-09 中国移动通信集团江西有限公司 故障定位的方法、装置和存储介质
CN109992454B (zh) * 2017-12-31 2023-09-19 中国移动通信集团江西有限公司 故障定位的方法、装置和存储介质
WO2019134223A1 (zh) * 2018-01-08 2019-07-11 平安科技(深圳)有限公司 一种日志生成方法、装置、计算机设备及存储介质
CN108446224A (zh) * 2018-03-06 2018-08-24 福建天泉教育科技有限公司 移动端上应用程序的性能分析方法、存储介质
CN108446224B (zh) * 2018-03-06 2021-12-28 福建天泉教育科技有限公司 移动端上应用程序的性能分析方法、存储介质
CN111722951A (zh) * 2019-03-21 2020-09-29 北京京东尚科信息技术有限公司 一种异常处理方法及装置、存储介质
CN111722951B (zh) * 2019-03-21 2023-11-03 北京京东振世信息技术有限公司 一种异常处理方法及装置、存储介质
CN110297763A (zh) * 2019-05-29 2019-10-01 联动优势电子商务有限公司 数据采集装置以及方法
CN110347406A (zh) * 2019-07-12 2019-10-18 四川虹美智能科技有限公司 一种采集应用的运行数据的方法及装置
CN112306803A (zh) * 2020-10-29 2021-02-02 金蝶云科技有限公司 一种性能监控方法及相关设备
CN112612678A (zh) * 2020-12-29 2021-04-06 中孚安全技术有限公司 一种基于字节码技术的零侵入监控方法及系统

Similar Documents

Publication Publication Date Title
CN107423203A (zh) 非侵入式Hadoop应用性能分析装置和方法
CN107678790A (zh) 流计算方法、装置及系统
Dundar et al. A big data processing framework for self-healing internet of things applications
CN104919427B (zh) 用于处理数据的方法、计算系统和计算机可读存储介质
US20180129712A1 (en) Data provenance and data pedigree tracking
Satoh A framework for data processing at the edges of networks
Dayarathna et al. Automatic optimization of stream programs via source program operator graph transformations
WO2017201057A1 (en) Multidimensional application monitoring visualization and search
Nasiri et al. A survey of distributed stream processing systems for smart city data analytics
Rong et al. Complex statistical analysis of big data: implementation and application of apriori and FP-growth algorithm based on MapReduce
Gadepally et al. Hyperscaling internet graph analysis with d4m on the mit supercloud
CN105069029B (zh) 一种实时etl系统及方法
Kourtellis et al. Large-scale learning from data streams with apache samoa
Wood et al. Projecting performance data over simulation geometry using sosflow and alpine
Dai Designing an Accounting Information Management System Using Big Data and Cloud Technology
Kim-Hung et al. A scalable IoT framework to design logical data flow using virtual sensor
Markiewicz et al. Evaluation platform for ddm algorithms with the usage of non-uniform data distribution strategies
Wang et al. Data Factory: An Efficient Data Analysis Solution in the Era of Big Data
Indiono et al. Rule-based runtime monitoring of instance-spanning constraints in process-aware information systems
Bensien Scalability benchmarking of stream processing engines with Apache Beam
Magnusson Social network analysis utilizing big data technology
de Souza Ramos et al. Watershed: A high performance distributed stream processing system
Zhao et al. faaShark: An end-to-end network traffic analysis system atop serverless computing platforms
Cinque et al. A framework for on-line timing error detection in software systems
Ardimento et al. Temporal Convolutional Networks for Just-in-Time Software Defect Prediction.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171201