WO2014101520A1

WO2014101520A1 - 基于MapReduce实现分析函数的方法及系统

Info

Publication number: WO2014101520A1
Application number: PCT/CN2013/084860
Authority: WO
Inventors: 张书彬; 田万鹏; 肖品; 鲍春健; 郭玮
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2012-12-27
Filing date: 2013-10-09
Publication date: 2014-07-03
Also published as: US20150356162A1; CN103902592B; CN103902592A

Abstract

本公开提供了一种基于MapReduce实现分析函数的方法及系统。所述方法包括：表扫描算子从文件块获取数据行，将所述数据行发送至映射算子；所述映射算子接收所述数据行，确定分析函数的归约键、分割键和排序键，通过MapReduce框架将所述数据行发送至分析算子；所述分析算子接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子。本公开可以在MapReduce框架的分布式数据仓库中实现分析函数，从而解决在基于MapReduce框架的分布式数据仓库中无法使用分析函数进行数据分析处理的问题。

Description

基于 MapReduce实现分析函数的方法及系统技术领域

本公开涉及数据仓库领域，尤其涉及一种基于 MapReduce实现分析函数的方法及系统。背景技术

数据仓库（Data Warehouse )是按照数据结构来组织、存储和管理数据的仓库。随着计算机的推广，数据仓库已经广泛的应用于工作和生活中。目前，随着互联网及信息技术的快速发展，数据仓库不仅仅是存储和管理数据，且具备了较强的分析数据的能力。常用的数据库，例如 ORACLE, PostgreSQL 等，均提供了多个分析函数，可以根据用户需求对数据进行分析，向用户提供分析结果。分析函数用于计算基于数据组的某种聚集值，与聚集函数不同，分析函数对数据组进行处理后返回多行数据，而聚集函数对数据组进行处理后返回一行数据。

MapReduce是一种编程模型，用于大规模数据集的并行运算。目前，基于 MapReduce框架的分布式数据仓库（例如 Hive数据仓库 )无法进行实现分析函数进行数据处理，在数据库的使用过程中带来诸多不便。发明内容

本公开的实施例提供一种基于 MapReduce实现分析函数的方法及系统，能够解决基于 MapReduce框架的分布式数据库无法实现分析函数进行数据处理的问题。

为达到上述目的，本公开的实施例采用如下技术方案。

第一方面，本公开实施例提供了一种基于 MapReduce实现分析函数的方法，所述方法包括：表扫描算子从文件块获取数据行，将所述数据行发送至映射算子；所述映射算子接收所述数据行，确定分析函数的归约键（reduce key )、分割键 ( partition key )和排序键 ( sort key ), 通过 MapReduce框架将所述数据行发送至分析算子，所述分析算子属于所述 MapReduce 框架的 Reduce端；所述分析算子接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子。第二方面，本公开实施例还提供了一种基于 MapReduce实现分析函数的系统，所述系统包括扫描算子模块、映射算子模块和分析算子模块，其中：所述扫描算子模块被配置为从文件块获取数据行，将所述数据行发送至映射算子模块；所述映射算子模块被配置为接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子模块，所述分析算子模块属于所述 MapReduce框架的 Reduce端；所述分析算子模块被配置为接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子模块。

本公开实施例提供的基于 MapReduce实现分析函数的方法及系统，能够应用于基于 MapReduce框架的分布式数据库（例如腾讯分布式数据仓库、 Hive数据库等）以实现数据分析，增加基于 MapReduce框架的分布式数据库的功能，从而使得用户能够在基于 MapReduce框架的分布式数据库中进行数据分析。附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作筒单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1为根据本公开实施例一的基于 MapReduce实现分析函数的方法的流程示意图；

图 2为根据本公开实施例二的基于 MapReduce实现分析函数的方法的流程示意图；

图 3为根据本公开实施例二的分析算子緩沖区的结构示意图；图 4为根据本公开实施例二的分析器緩沖区的结构示意图；

图 5 ( a ) - ( (1 )和图 6 ( & ) - ( d )分别为根据本公开实施例二的窗口模式的示意图；

图 7为根据本公开实施例三的基于 MapReduce实现分析函数的系统的结构示意图；

图 8为图 7所示的分析算子模块 53的结构示意图。具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

实施例一

本公开实施例提供了一种基于 MapReduce实现分析函数的方法，适用于基于 MapReduce框架的分布式数据仓库进行数据分析，如图 1所示，所述方法包括以下步骤。

步骤 101、表扫描算子（TableScanOperator )从文件块获取数据行，将所述数据行发送至映射算子。

步骤 102、所述映射算子（ReduceSinkOperator )接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子，所述分析算子属于所述 MapReduce框架的 Reduce端。

步骤 103、所述分析算子（AnalysisOperator )接收所述数据行，对所述数据行进行分析得到分析结果 ,并将所述数据行和分析结果转发至后继算子。

其中，后继算子可以根据具体情况需要的操作进行确定，例如：聚合算子、过滤算子、或写文件算子等，但不仅限于此。

本公开实施例提供的基于 MapReduce实现分析函数的方法，能够应用于基于 MapReduce框架的分布式数据仓库（例如腾讯分布式数据仓库、 Hive 数据仓库等）进行数据分析分析函数，增加基于 MapReduce框架的分布式数据库的功能，从而使得在基于 MapReduce框架的分布式数据库中使用分析函数进行数据分析。实施例二

本公开实施例提供了一种基于 MapReduce实现分析函数的方法，适用于基于 MapReduce框架的分布式数据库进行数据分析，如图 2所示，所述方法包括以下步骤。

步骤 201、表扫描算子从文件块获取数据行，将所述数据行发送至映射算子。

值得说明的是，在本实施例提供的方法中，可以预设多种不同的分析函数对数据进行分析，常用的分析函数例如可以包括 LAG、 LEAD, RANK, DENSE—RANK、 ROW—NUMBER、 SUM, COUNT、 AVG、 MAX, MIN、 RATIO_TO_REPORT等。可选的，在本实施例提供的方法中，可以根据用户需要添加新的分析函数。

步骤 202、所述映射算子接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子，所述分析算子属于所述 MapReduce框架的 Reduce端。

例如，所述映射算子可以通过如下方法确定分析函数的归约键、分割键和排序键，具体可以包括：

( 1 ) 当所述分析函数包含分区子句和 /或排序子句时，可以将所述分析函数的分区子句中的列和 /或排序子句中的列作为归约键，或者

当所述分析函数没有排序子句但有 distinct关键字时，可以以 distinct列作为归约键，或者

当分析函数不含分区子句、排序子句，也不含 distinct关键字时，可以指定任意常量作为归约键；

( 2 )当所述分析函数包含分区子句时，可以将所述分析函数的分区子句中的列作为分割键，或者

当所述分析函数不含分区子句时，可以以与归约键相同的常量作为分割键。

( 3 )当所述分析函数含有排序子句时，可以以排序子句中的列作为排序键。

步骤 203、所述分析算子接收所述数据行，将所述数据行存储于分析算子緩沖区以供所有分析器使用。

为了实现数据共享，在分析算子（具体地，该分析算子形成的分析算子模块）中可以提供一个分析算子緩沖区 AnalysisBuffer, 该緩沖区具备以下特点： a.允许指定长度的数据保存在内存中； b.当长度超出限定值后，将原内存緩沖区中的一半内容溢出到硬盘； c允许用户按照索引访问其中的元素； d. 允许用户从头开始删除其中已转发的元素。

具体地，如图 3所示，分析算子緩沖区可以包括内存緩沖区和磁盘緩沖区（其可以位于图 4所示的磁盘中）。在所述分析算子緩沖区中，可以优先将接收的新数据行放入内存緩沖区；如果内存緩沖区已满，则可以将内存緩沖区中较旧的数据行存入所述磁盘緩沖区，以释放内存緩沖区的存储空间，然后可以将接收的新数据行 ^内^爰沖区。

步骤 204、所述分析算子解析出所述数据行的分区字段和排序字段，判断所述数据行是否属于当前分区，其中，所述当前分区是所述分析算子接收到的上一数据行所属的分区；若是，执行步骤 205; 若否，执行步骤 206。

步骤 205、所述分析算子调用分析函数对应的分析器对所述数据行进行分析，得到分析结果，将所述分析结果存储于分析器緩沖区。

值得说明的是，一个分析函数可以对应一个分析器，每个分析器可以对应一个分析器緩沖区，用于存储与每一数据行相关的分析结果、中间结果或总的聚合结果。如图 4所示，所述分析器緩沖区可以包括内存緩沖区和磁盘緩沖区（其可位于图 4所示的磁盘中 ),所述内存緩沖区可以包括输出緩沖区和输入緩沖区。

所述分析器緩沖区用于对分析结果进行緩沖和更新。具体地，当所述分析器緩沖区对分析结果进行緩沖时：可以将所述分析结果存储于所述输出緩沖区；如果所述输出緩沖区已满，则可以将所述输出緩沖区中的内^ "入所述磁盘緩沖区，以释放所述输出緩沖区的存储空间。当所述分析器緩沖区对分析结果进行更新时：如果待更新行存储于输出緩沖区，则可以直接根据所述输出緩沖区中的待更新行和接收到的新数据行对分析结果进行更新；如果待更新行存储于输入緩沖区，则可以直接根据所述输入緩沖区中的待更新行和接收到的新数据行对分析结果进行更新；如果待更新行存储于磁盘（即，磁盘緩沖器），则可以将所述输入緩沖区中的内储到所述磁盘，并将所述磁盘中的待更新行所在的緩沖块读入所述输入緩沖区，以使得根据所述输入緩沖区中的待更新行和接收到的新数据行对分析结果进行更新。

步骤 206、所述分析算子结束对所述当前分区的分析，将所述分析算子緩沖区中存储的当前分区的所有数据行、以及所述分析器緩沖区中存储的当前分区的所有分析结果汇总成新的数据行转发至后继算子。

值得说明的是，如果所述分析函数不需要累计，那么在所述调用分析函数对应的分析器对所述数据行进行分析，得到分析结果之后，可以直接将所述数据行和分析结果汇总转发至后继算子，无需对所述数据行和分析结果进行緩存。

为了便于理解，本实施例提供了 11 种常见的分析函数的示例性算法概述, 具体如下。

算法 1: LAG算法概述：

假设调用的分析函数为 lag(col, offset) over(...)。

LAG的分析器緩沖区中仅有一个行号计数器 p (初始值为 -1 )。当分析新的一行时，将 p加 1 , 如果 p>=offset, 则将 p所指向的行的该列设为 p-offset 行 col列的内容，并指示 p-offset行及之前的行的内容可以转发；否则，将当前行的结果设为 null, 所有行都不得转发。

算法 2: LEAD算法概述：

假设调用的分析函数为 lead(col, offset) over(...)。

LEAD的分析器緩沖区中有两个指针，指针 pi指向当前尚未处理的最小行，指针 p2指向当前行。当分析新的一行时，将指针 p2加 1 , 此时，如果 p2-pl>=offset,则将 pi所指向行的结果设为 p2所指行 col列的内容,且 pl++, 行号小于等于 pi的行均可转发。

算法 3: RANK算法概述：

RANK的分析器緩沖区中有当前序号 rank, 当前序号对应的值 value, 具有当前序号的行数 number。当分析新的一行时，如果新的一行的值与 value 相等，则将该行的 rank列设为 rank, 分析器緩沖区中的 number++; 否则，将 rank 歹 'J设为 rank+number , 同时将分析器緩沖区中的 rank 设为 rank+number, value设为新行的指定值， number设为 1。当前处理后的所有行均可转发。

算法 4: DENSE_RANK算法概述：

DENSE_RANK的分析器緩沖区中有当前序号 rank, 当前序号对应的值 value, 具有当前序号的行号 number。当分析新的一行时，如果新的一行的值与 value相等，则将该行的 rank列设为 rank, 分析器緩沖区中的 number++; 否则，将 rank列设为 rank+1 , 同时将分析器緩沖区中的 rank设为 rank+1 , value设为新行的指定值， number设为 1。当前处理后的行均可转发。

算法 5: ROW_NUMBER算法概述：

ROW_NUMBER的分析器緩沖区中只有一个 rownumber值（初始值为 -1 )。当分析新的一行的时候， ^！夺新行的 rownumber列设为 rownumber+1 , 同时将分析器緩沖区中的 rownumber设为 rownumber+1。当前处理后的行均可转发。算法 6: SUM算法概述：

在 SUM的分析器緩沖区中，保存一个变量，即当前总和 sum。当分析新的一行时，将 sum的值加上新行的指定表达式值（需非空）存入 sum即可。

在整个分区分析完成前不得转发。分区分析完成后，将 sum值作为每一行的计算结果即可。

算法 7: COUNT算法概述：

COUNT的分析器緩沖区中只有一个 count计数器。每分析一个新行，如果待分析列的值非空，就将该计数器加一。

在整个分区分析完成前不得转发。分区分析完成后，将 count值作为每一行的计算结果即可。

算法 8: AVG算法概述：

AVG的分析器緩沖区中有两个计数器值，一个是 sum (初始值为 0 ), — 个是 count(初始值为 0 )。当分析新的一行时，如果表达式为非空值， count++, sum设为 sum+新行的表达式值。

在整个分区分析完成前不得转发任一行。分区分析完成后，如果 count!

= 0, 将 sum / count值作为每一行的计算结果即可；否则，将 null作为每一行的分析结果。

算法 9: MAX算法概述：

MAX的分析器緩沖区中只有一个 max值。分析新行时，将新行的表达式（非空）与 max比较，如果比 max大则更新 max。在分析完分区时，将所有的行的指定列设为 max即可。

在整个分区分析完成前不得转发。

算法 10: MIN算法概述：

MIN的分析器緩沖区中只有一个 min值。分析新行时，将新行的表达式 (非空）与 min比较，如果比 min小则更新 min。在分析完分区时，将所有的行的指定列设为 min即可。

在整个分区分析完成前不得转发。

算法 11 : RATIO_TO_REPORT算法概述：

RATIO_TO_REPORT类的分析器緩沖区中只有一个 sum值。分析新行时，将新行的表达式（非空）与 sum相加设为 sum的值。在分析完分区时，用所有的行的指定列分别除以 sum设为该列的值即可，如果 sum为 0, 则均置为 null。

在整个分区分析完成前不得转发。值得说明的是，分析函数是基于一组记录（例如多个数据行）为每一行数据计算聚集值得到分析结果的，所基于的这一组记录称之为 "窗口" ( window )。对于每一行记录，都有一个窗口，用它来指定分析函数执行聚集运算的记录集。针对带窗口子句的情况,本实施例提供了如下 8种模式（即，窗口模式，具体地，设置窗口位置的模式）以供参考：

模式 1 , 在图 5 ( a ) 中示出：

该模式的代表语句为：

Rows between window.lag preceding and window.lead following 〃位于当前行之前 window.lag行和之后 window.lead行的范围内；

Range between window.lag preceding and window.lead following 〃比当前值小 (或大) window.lag和比当前值大（或小） window.lead的范围内。

模式 2, 在图 5 ( b ) 中示出：

该模式的代表语句为：

Rows between window.lag preceding and window.lead preceding 〃位于当前行之前 window.lag行和 window.lead行的范围内；

Range between window.lag preceding and window.lead preceding 〃比当前值小 (或大) window.lag和 window.lead的范围内。模式 3, 在图 5 ( c ) 中示出：

该模式的代表语句为：

Rows between window.lag following and window.lead following 〃位于当前行之后 window.lag行和 window.lead行的范围内；

Range between window.lag following and window.lead following 〃比当前值大 (或小) window.lag和 window.lead的范围内。模式 4, 在图 5 ( d ) 中示出：

该模式的代表语句为：

Rows between unbounded preceding and window.lead following 〃从最开始到当前行之后 window.lead行的范围内；

Range between unbounded preceding and window.lead following 〃从最开始到比当前值大（或小） window.lead的范围内。模式 5, 在图 6 ( a ) 中示出：

该模式的代表语句为：

Rows between window.lag preceding and unbounded following 〃从当前行之前 window.lag行到最后的范围内；

Range between window.lag preceding and unbounded following 〃从比当前值 d、（或大) window.lag到最后的范围内。模式 6, 在图 6 ( b ) 中示出：

该模式的代表语句为：

Rows between unbounded preceding and unbounded following 〃从开始到最后；

Range between unbounded preceding and unbounded following 〃从开始到最后。模式 7, 在图 6 ( c ) 中示出：

该模式的代表语句为：

Rows between unbounded preceding and window.lead preceding 〃从开始到 window.lead行之前的范围内；

Range between unbounded preceding and window.lead preceding 〃从开始到比当前值小 (或大) window.lead的范围内。模式 8, 在图 6 ( d ) 中示出：

该模式的代表语句为：

Rows between window.lag following and unbounded following 〃从当前行之后 window.lag行到最后的范围内；

Range between window.lag following and unbounded following 〃从比当前值大 (或小 )window.lag到最后的范围内。根据上述 8种模式，可以很容易的实现出相应的分析函数处理算法。本公开实施例提供的基于 MapReduce实现分析函数的方法，能够应用于基于 MapReduce框架的分布式数据库（例如腾讯分布式数据仓库、 Hive数据仓库等）以实现数据分析，增加基于 MapReduce框架的分布式数据库的功能，从而使得在基于 MapReduce框架的分布式数据库中进行数据分析。实施例三

本公开实施例提供了一种基于 MapReduce实现分析函数的系统，能够实现上述方法实施例。如图 6所示，所述系统可以包括扫描算子 51、映射算子 52和分析算子 53。所述扫描算子 51可以形成扫描算子模块或被包括在扫描算子模块中，在本实施例中，可互换地使用术语 "扫描算子" 和 "扫描算子模块"。所述映射算子 52可以形成映射算子模块或被包括在映射算子模块中，在本实施例中，可互换地使用术语 "映射算子"和 "映射算子模块"。所述分析算子 53 可以形成分析算子模块或被包括在分析算子模块中，在本实施例中，可互换地使用术语 "分析算子"和 "分析算子模块"。所述系统还可以包括分析算子緩沖区（图中未示出），它们与在上文中描述的分析算子緩沖区相同，因此在这里省略其详细描述。

所述扫描算子 51用于从文件块获取数据行,将所述数据行发送至映射算子 52;

所述映射算子 52用于接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子 53 , 所述分析算子 53属于所述 MapReduce框架的 Reduce端；

所述分析算子 53接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子。

可选的，所述映射算子 52可以具体用于当所述分析函数包含分区子句和为归约键,或者所述映射算子 52还可以用于当所述分析函数没有排序子句但有 distinct关键字时，以 distinct列作为归约键，或者所述映射算子 52还可以用于当分析函数不含分区子句、排序子句，也不含 distinct关键字时，指定任意常量作为归约键。

所述映射算子 52还可以用于当所述分析函数包含分区子句时，将所述分析函数的分区子句中的列作为分割键 ,或者所述映射算子 52还可以用于当所述分析函数不含分区子句时，以与归约键相同的常量作为分割键。

所述映射算子 52还可以用于当所述分析函数含有排序子句时，以排序子句中的列作为排序键。

进一步的，如图 7所示，所述分析算子 53可以包括：

存储模块 531 , 其可以用于接收所述数据行，将所述数据行存储于分析算子緩沖区以供所有分析器使用；

判断模块 532, 其可以用于解析出所述数据行的分区字段和排序字段，判断所述数据行是否属于当前分区，所述当前分区是所述分析算子接收到的上一数据行所属的分区，若是，则所述分析算子 53可以调用分析函数对应的分析器对所述数据行进行分析，得到分析结果，将所述分析结果存储于分析器緩沖区，若否，则所述分析算子 53可以结束对所述当前分区的分析，将所述分析算子緩沖区中存储的当前分区的所有数据行、以及所述分析器緩沖区中存储的当前分区的所有分析结果汇总成新的数据行转发至后继算子（即，算子模块）。所述分析器和分析器緩沖区与上文所述相同，它们可以位于根据本发明实施例三的系统中，也可以位于所述系统之外并且可操作地耦接到所述系统。

可选的，如果所述分析函数不需要累计，那么所述分析算子 53可以在得到分析结果之后，直接将所述数据行和分析结果汇总转发至后继算子（即，算子模块），无需对所述数据行和分析结果进行緩存。

本公开实施例提供的基于 MapReduce实现分析函数的系统，能够应用于基于 MapReduce框架的分布式数据库（例如腾讯分布式数据仓库、 Hive数据库等）以实现数据分析，增加基于 MapReduce框架的分布式数据库的功能，从而使得在基于 MapReduce框架的分布式数据库中实现分析函数进行数据分析。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本公开可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，硬盘或光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本公开各个实施例所述的方法。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

权利要求书

1、一种基于 MapReduce实现分析函数的方法，包括：

表扫描算子从文件块获取数据行，将所述数据行发送至映射算子；所述映射算子接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子，所述分析算子属于所述 MapReduce 架的 Reduce端；

所述分析算子接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子。

2、根据权利要求 1所述的方法，其中，所述确定分析函数的归约键、分割键和排序键，包括：

当所述分析函数包含分区子句和 /或排序子句时，将所述分析函数的分区子句中的列和 /或排序子句中的列作为归约键，或者

当所述分析函数没有排序子句但有 distinct关键字时，以 distinct列作为归约键，或者

当分析函数不含分区子句、排序子句，也不含 distinct关键字时，指定任意常量作为归约键；

当所述分析函数包含分区子句时，将所述分析函数的分区子句中的列作为分割键，或者

当所述分析函数不含分区子句时，以与归约键相同的常量作为分割键；当所述分析函数含有排序子句时，以排序子句中的列作为排序键。

3、根据权利要求 1或 2所述的方法，其中，所述分析算子接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子，包括：

所述分析算子接收所述数据行，将所述数据行存储于分析算子緩沖区以供所有分析器使用；

所述分析算子解析出所述数据行的分区字段和排序字段，判断所述数据行是否属于当前分区，所述当前分区是所述分析算子接收到的上一数据行所属的分区，

若是，则调用分析函数对应的分析器对所述数据行进行分析，得到分析结果，将所述分析结果存储于分析器緩沖区，若否，则结束对所述当前分区的分析，将所述分析算子緩沖区中存储的当前分区的所有数据行、以及所述分析器緩沖区中存储的当前分区的所有分析结果汇总成新的数据行转发至后继算子。

4、根据权利要求 3所述的方法，其中，如果所述分析函数不需要累计，那么在所述调用分析函数对应的分析器对所述数据行进行分析，得到分析结果之后，直接将所述数据行和分析结果汇总转发至后继算子，无需对所述数据行和分析结果进行緩存。

5、根据权利要求 3所述的方法，其中，所述分析算子緩沖区包括内存緩沖区和磁盘緩沖区，所述分析算子緩沖区优先将接收的新数据行放入内存緩沖区，如果内存緩沖区已满，则将内存緩沖区中较旧的数据行存入所述磁盘緩沖区，以释放内存緩沖区的存储空间。

6、根据权利要求 3所述的方法，其中，所述分析器緩沖区包括内存緩沖区和磁盘緩沖区，所述内存緩沖区包括输出緩沖区和输入緩沖区，所述分析器緩沖区用于对分析结果进行緩沖和更新；

所述分析器緩沖区对分析结果进行緩沖时，将所述分析结果存储于所述输出緩沖区，如果所述输出緩沖区已满，则将所述输出緩沖区中的内 ^"入所述磁盘緩沖区，以释放所述输出緩沖区的存储空间；

所述分析器緩沖区对分析结果进行更新时：

如果待更新行存储于输出緩沖区，则直接根据所述输出緩沖区中的待更新行和接收到的新数据行对分析结果进行更新，

如果待更新行存储于输入緩沖区，则直接根据所述输入緩沖区中的待更新行和接收到的新数据行对分析结果进行更新，

如果待更新行存储于磁盘緩沖区，则将所述输入緩沖区中的内容存储到所述磁盘緩沖区，并将所述磁盘緩沖区中的待更新行所在的緩沖块读入所述输入緩沖区，以使得根据所述输入緩沖区中的待更新行和接收到的新数据行对分析结果进行更新。

7、一种基于 MapReduce实现分析函数的系统，包括扫描算子模块、映射算子模块和分析算子模块，其中：

所述扫描算子被配置为从文件块获取数据行，将所述数据行发送至映射算子；

所述映射算子被配置为接收所述数据行，确定分析函数的归约键、分割键和排序键，通过 MapReduce框架将所述数据行发送至分析算子，所述分析算子属于所述 MapReduce框架的 Reduce端；

所述分析算子被配置为接收所述数据行，对所述数据行进行分析得到分析结果，并将所述数据行和分析结果转发至后继算子模块。

8、根据权利要求 7所述的系统，其中，所述映射算子模块被配置为：当所述分析函数包含分区子句和 /或排序子句时，将所述分析函数的分区子句中的列和 /或排序子句中的列作为归约键，或者

所述映射算子模块还被配置为：作为分割键，或者

当所述分析函数不含分区子句时，以与归约键相同的常量作为分割键；

所述映射算子还被配置为当所述分析函数含有排序子句时，以排序子句中的列作为排序键。

9、根据权利要求 7或 8所述的系统，其中，所述分析算子模块包括：存储模块，被配置为接收所述数据行，将所述数据行存储于分析算子緩沖区以供所有分析器使用；

判断模块，被配置为解析出所述数据行的分区字段和排序字段，判断所述数据行是否属于当前分区，所述当前分区是所述分析算子接收到的上一数据行所属的分区，

若是，则所述分析算子调用分析函数对应的分析器对所述数据行进行分析，得到分析结果，将所述分析结果存储于分析器緩沖区；

若否，则所述分析算子结束对所述当前分区的分析，将所述分析算子緩沖区中存储的当前分区的所有数据行、以及所述分析器緩沖区中存储的当前分区的所有分析结果汇总成新的数据行转发至后继算子模块。

10、根据权利要求 9所述的系统，其中，如果所述分析函数不需要累计，那么所述分析算子在得到分析结果之后，直接将所述数据行和分析结果汇总转发至后继算子，无需对所述数据行和分析结果进行緩存。