CN111027435B

CN111027435B - 一种基于梯度提升决策树的识别系统、装置和方法

Info

Publication number: CN111027435B
Application number: CN201911216442.9A
Authority: CN
Inventors: 宋伟; 张沕琳
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-12-02
Filing date: 2019-12-02
Publication date: 2022-12-02
Anticipated expiration: 2039-12-02
Also published as: CN111027435A

Abstract

本申请公开了一种基于梯度提升决策树的识别系统、装置和方法，包括：处理模块根据加载的梯度提升决策树模型中的模型参数，使用流水线对接收到的信号特征进行并行比较，得到多个总预测分数，发送至结果生成模块；结果生成模块根据接收到的多个总预测分数生成识别结果。在处理模块中使用流水线对接收到的信号特征进行并行比较，能够提升处理速度，降低硬件功耗和处理时间的开销。通过梯度提升决策树模型对信号特征进行比较，生成识别结果，可以灵活处理混合型信号数据，对异常点的鲁棒性强可以得到准确率高的识别结果。将处理分为四个阶段，使用控制器控制流水线中各阶段的运行，能够在FPGA中实现并行处理，提高处理速度，通用性强。

Description

一种基于梯度提升决策树的识别系统、装置和方法

技术领域

本申请涉及信息处理领域，尤其涉及一种基于梯度提升决策树的识别系统、装置和方法。

背景技术

梯度提升决策树(Gradient Boosting Decision Tree，GBDT)模型是一种通用的模式识别方法，常用于生物医疗电子及生物监测领域，如手势识别、睡眠分期、癫痫检测等场景。此外，在数据挖掘、内容推荐、机器视觉等其他领域也有广泛应用。

GBDT的模型使用通常分为两个环节：模型建立环节和预测分类环节。根据任务和获得的数据进行模型训练，得到一系列模型参数；使用训练好的模型对新获取的数据进行预测和分类。

通过将GBDT的预测分类环节应用于现场可编程门阵列(Field ProgrammableGate Array，FPGA)上，与部署在PC端或服务器端相比，可以显著降低系统的功耗，提高预测识别的实时性能，同时有利于可穿戴或可移动系统的设计。从而使GBDT能够支持更广泛的应用场景，增强其在低功耗、可穿戴等应用场景的适用性。

然而，由于GBDT模型包括多棵独立的决策树，导致GBDT模型应用在硬件上时的硬件功耗和处理时间的开销较大。

综上所述，需要提供一种能够在FPGA上应用，且硬件功耗和时间开销低的系统、装置和方法。

发明内容

为解决以上问题，本申请提出了一种基于梯度提升决策树的识别系统、装置和方法。

一方面，本申请提出一种基于梯度提升决策树的识别系统，包括：

处理模块，用于根据加载的梯度提升决策树模型中的模型参数，用流水线对接收到的信号特征进行并行比较，得到多个总预测分数，将得到的多个总预测分数发送至结果生成模块；

结果生成模块，用于根据接收到的多个所述总预测分数，生成识别结果。

优选地，还包括：

模型加载模块，用于将梯度提升决策树模型中的模型参数发送至处理模块；

预处理和特征提取模块，用于对信号数据进行处理，得到信号特征，发送至处理模块。

优选地，所述处理模块包括多个流水线，其中，每个所述流水线包括：

参数存储单元，用于保存多棵梯度提升决策树的模型参数，将所述模型参数发送至各比较单元；

特征存储单元，用于保存接收到的多个信号特征，发送至多个比较单元；

多个比较单元，用于从所述参数存储单元中加载一棵梯度提升决策树的模型参数，根据加载的所述模型参数，从所述特征存储单元中获取对应的信号特征，与所述模型参数进行比较，得到多个比较结果，发送至分数地址生成单元；

分数地址生成单元，用于根据多个比较结果，生成分数地址；

分数存储单元，用于加载模型参数，根据接收到的分数地址，确定预测分数；

加法单元，用于将所述预测分数与总和分数相加，得到新的总和分数，发送至总和寄存单元，直至多个比较单元将参数存储单元中保存的所有梯度提升决策树都加载、比较完成后，将所述最后一棵梯度提升决策树的预测分数与总和分数相加，得到总预测分数；

总和寄存单元，用于保存总和分数。

优选地，所述比较单元包括：

特征选择器，接收参数存储单元发送的模型参数中的参数特征序号，根据所述参数特征序号，从特征存储单元中选择对应的信号特征，发送至比较器；

比较器，接收参数存储单元发送的模型参数中的节点阈值和特征选择器发送的信号特征，对所述节点阈值和所述信号特征进行比较，得到比较结果。

优选地，所述流水线的数量与需要识别的类别数量一致，一个流水线用于识别一个类别。

优选地，各所述流水线还包括：控制器、第一寄存器、第二寄存器和第三寄存器，控制器依据时钟周期控制所述各寄存器，所述各寄存器控制比较单元、分数存储单元和加法单元对接收到的信号特征进行并行处理；

所述控制器依据时钟周期控制所述各寄存器的数据存储与发送；

所述第一寄存器用于存储所述模型参数，根据时钟周期发送所述模型参数至比较单元；

所述第二寄存器用于存储所述分数地址，根据时钟周期发送所述分数地址至分数存储单元；

所述第二寄存器用于存储所述预测分数，根据时钟周期发送所述预测分数至加法单元。

优选地，所述流水线中的比较单元的数量与单棵梯度提升决策树的节点数量一致。

第二方面，本申请提出一种基于梯度提升决策树的手势识别装置，包括：采集器接口、缓存器和所述的识别系统；

所述采集器接口，用于接收和发送信号数据；

所述缓存器，用于对所述接口模块发送的信号数据进行缓存，发送至所述识别系统。

优选地，还包括：存储接口和/或数据收发模块。

第三方面，本申请提出一种基于梯度提升决策树的识别方法，包括：

处理模块根据加载的梯度提升决策树模型中的模型参数，用流水线对接收到的信号特征进行并行比较，得到多个总预测分数，将得到的多个总预测分数发送至结果生成模块；

结果生成模块根据接收到的多个所述总预测分数，生成识别结果。

本申请的优点在于：在处理模块中使用流水线对接收到的信号特征进行并行比较，能够提升处理速度，降低硬件功耗和处理时间的开销。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选事实方案的目的，而并不认为是对本申请的限制。而且在整个附图中，用同样的参考符号表示相同的部件。在附图中：

图1是本申请提供的一种基于梯度提升决策树的识别系统的示意图；

图2是本申请提供的一种基于梯度提升决策树的识别系统的结构示意图

图3是本申请提供的一种基于梯度提升决策树的识别系统的对深度为3的树执行并行遍历的示意图；

图4是本申请提供的一种基于梯度提升决策树的识别系统的比较单元的示意图；

图5是本申请提供的一种基于梯度提升决策树的识别系统的流水线并行处理示意图；

图6是本申请提供的一种基于梯度提升决策树的识别系统的梯度提升决策树的空白节点示意图；

图7是本申请提供的一种基于梯度提升决策树的手势识别装置的示意图；

图8是本申请提供的另一种基于梯度提升决策树的手势识别装置的结构示意图；

图9是本申请提供的一种基于梯度提升决策树的识别方法的步骤示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

根据本申请的实施方式，提出一种基于梯度提升决策树的识别系统，如图1所示，包括：

处理模块101，用于根据加载的梯度提升决策树模型中的模型参数，用流水线对接收到的信号特征进行并行比较，得到多个总预测分数，将得到的多个总预测分数发送至结果生成模块；

结果生成模块102，用于根据接收到的多个所述总预测分数，生成识别结果。

本申请的实施方式，优选地，如图2所示，还包括：

如图2所示，处理模块包括多个流水线，其中，每个流水线包括：

多个比较单元，用于从参数存储单元中加载一棵梯度提升决策树的模型参数，根据加载的模型参数，从特征存储单元中获取对应的信号特征，与模型参数进行比较，得到多个比较结果，发送至分数地址生成单元；

加法单元，用于将预测分数与总和分数相加，得到新的总和分数，发送至总和寄存单元，直至多个比较单元将参数存储单元中保存的所有梯度提升决策树都加载、比较完成后，将最后一棵梯度提升决策树的预测分数与总和分数相加，得到总预测分数；

总和寄存单元，用于保存总和分数。

比较单元包括：

特征选择器，接收参数存储单元发送的模型参数中的参数特征序号，根据参数特征序号，从特征存储单元中选择对应的信号特征，发送至比较器；

比较器，接收参数存储单元发送的模型参数中的节点阈值和特征选择器发送的信号特征，对节点阈值和所述信号特征进行比较，得到比较结果。

模型参数包括：节点阈值、参数特征序号和预测分数。

参数存储单元用于保存和/或加载模型参数中的节点阈值和参数特征序号。

分数存储单元用于保存和/或加模型参数中的载预测分数，此预测分数与分数地址相对应。分数存储单元根据接收到的分数地址以及与分数地址相对应的预测分数，读出预测分数。

流水线的数量与需要识别的类别数量一致，一个流水线用于识别一个类别。

各所述流水线还包括：控制器、第一寄存器、第二寄存器和第三寄存器，控制器依据时钟周期控制所述各寄存器，所述各寄存器控制比较单元、分数存储单元和加法单元对接收到的信号特征进行并行处理；

各寄存器通过控制器根据时钟进行控制，每个周期往后运行一个阶段。

各寄存器通过控制器根据时钟进行控制，每个周期会根据、参数存储单元、特征存储单元、各比较单元、分数地址生成单元、加法单元以及总和寄存单元的处理情况更新一次。在这个过程中，每个周期会有一个梯度提升决策树完成处理，其预测分数在加法单元内完成累加，同时会有一个新的梯度提升决策树的参数从参数存储单元读入。由此，形成流水线的操作方式。

一个比较单元中，包括一个比较器。流水线中的比较单元的数量与单棵梯度提升决策树的节点数量一致。

信号特征中包括特征和与特征对应的特征序号，用于和参数特征序号对应。

以使用上述方法识别手势为例，总和分数为在一次手势识别过程中，一个流水线在当前时刻之前的所有预测分数的总和。以一个包括100棵树的流水线为例，那么总和分数就是这100棵树的预测分数的累加总和。因为每次计算1棵树的预测分数，则总和分数是在当前计算的树之前的所有树的预测分数的总和。在得到100棵树的预测分数的累加总和后，得到的结果就是总预测分数。

多个总预测分数中的每个总预测分数对应着一个类别。以手势为例，假设需要从10种手势中，通过肌电信号识别当前的手势，则处理模块中包括10个流水线，每个流水线得到一个总预测分数，处理模块一共会输出10个总预测分数至结果生成模块。

如图3所示，为使用梯度提升决策树，对深度为3的树执行并行遍历。其中，每个圆圈代表一个比较节点(子节点)，它执行信号特征与节点阈值的比较。每个方形节点都是一个叶节点，具有一个特定类别的预测分数。每一个叶节点的预测分数表示此特定类别的概率。在图n中，即为8种概率(预测分数)。该树集成了七个比较节点。使用来自所有七个节点的比较结果的不同组合生成真值表。一个8位的独热(One Hot)地址代码(分数地址)用于表示右侧列出的预测分数。比较器结果以0或1表示，分别表示到左子节点或右子节点的移动。预编码结果可用于输出预测分数。例如，输出地址为00010000时，将输出节点5的右子节点上的预测分数，其遍历路径为1-2-5。

单个树需要2ⁿ-1个比较模块(比较器)，其中n表示深度。

树的棵数和深度根据训练时的实际情况确定。

如图4所示，所有比较单元的得到的比较结果在一个时钟周期内加载在一起。特征存储单元保存经过特征提取后的所有信号特征。信号特征包括特征和特征序号。参数存储单元存储多个树中每个节点的节点阈值和与参数特征序号(在此节点需要进行对比的特征序号)。参数存储器将各节点的节点阈值直接输出给各比较器，并将与各节点阈值对应的各参数特征的序号发送给各特征选择器。各特征选择器从特征存储单元中选择对应的各特征，输入至各比较器中进行比较，得到各对应的比较结果。各比较单元将各比较结果输出到分数地址生成单元中。其中，每个比较单元都对应一个节点。

下面，以4棵树为例，进行进一步说明。

如图5所示，为4棵树的流水线并行遍历流程图。以一个流水线中包括4棵树为例，单棵树的预测分数的整个计算过程可分为四个阶段：1)加载阶段：流水线中的所有比较器从参数存储单元中加载模型参数；2)比较阶段：各比较器对信号特征和每个节点加载的节点阈值进行比较；3)获取阶段：根据比较结果获取预测分数；4)相加阶段：将预测分数与前一个过程得到的总和分数相加。第一寄存器用于分割加载阶段与比较阶段，第二寄存器用于分割比较阶段与获取阶段，第三寄存器用于分割获取阶段与相加阶段。采用控制器对流水线中的第一寄存器、第二寄存器和第三寄存器进行控制。在第一棵树进入比较阶段时，第二棵树进入加载阶段。当第二棵树进入比较阶段时，第三课树进入加载阶段，同时，第一棵树进入获取阶段。当第三棵树进入比较阶段时，第四课树进入加载阶段，此时，第二棵树进入获取阶段，第一棵树进入相加阶段。流水线中各棵树的计算过程以此类推。在为特征存储单元存储完信号特征之前，流水线不会启动。所有树将逐个操作。最后一个预测分数将在最后一棵树的操作完成后可用。通过建立一系列流水线，流水线的总数等于需要识别的类别的数量。这样，一个流水线专用于一个类别，并且在该流水线中只计算相应的树。因此，这些流水线以并行方式运行。

一个流水线包括多棵树(梯度提升决策树)，由于每个类别(需要识别的类别)的树的数量数是相同的，因此并行的流水线的总预测分数将同时输出。

分数存储单元每次输出给加法单元的预测分数为单棵树的分数。

每棵树的深度相同。

控制器，优选地，可以为有限状态机。

为例更好的理解，下面对其硬件工作方式进行详细的说明。

如图2所示，一个类别对应一个流水线。模型加载模块接收训练好的模型参数，根据所述模型参数，更新流水线中的参数存储单元和分数存储单元。预处理和特征提取模块，用于对信号数据进行处理，得到信号特征，发送至处理模块中的各流水线，使用梯度提升决策树算法进行计算。控制器控制树计数器，使参数存储单元开始工作，将与各节点对应的模型参数发送至第一寄存器，第一寄存器根据控制器的时钟周期，将接收到的模型参数中的节点阈值输出给各比较器，并将模型参数中与各节点阈值对应的各参数特征序号发送给各特征选择器。第一寄存器将模型参数发送至比较单元后，清除存储的模型参数，根据下一个时钟周期，接收并存储新的模型参数。各特征选择器从特征存储单元中选择对应的各信号特征，输入至各比较器中进行比较，得到各对应的比较结果。如图3中的节点比较结果所示，比较结果可以使用“0”和“1”表示。“×”表示不论此位置对应的节点的比较结果是0还是1，都可以划到真值表里的这一行。各比较结果输出到分数地址生成单元中，生成分数地址。第二寄存器接收并存储分数地址，根据控制器的时钟周期，将存储的分数地址发送至分数存储单元中，分数存储单元根据接收到的分数地址，获得与分数地址对应的预测分数。分数存储单元将预测分数发送至第三寄存器。第三寄存器接收并存储预测分数，根据控制器的时钟周期，将存储的预测分数发送至加法单元中。加法单元将接收到的每棵树的预测分数与存储在总和寄存单元中的总和分数(上一个过程得到的所有预测分数总和)相加，得到新的总和分数，发送至总和寄存单元，直到流水线中所有的树的预测分数全都相加完毕，各流水线得到与各类别对应的总预测分数。各流水线的总和寄存单元将总预测分数发送至结果生成模块中，生成识别结果。其中，空白表示空白节点。

为了避免GBDT模型的过度拟合，在训练过程中经常采用修剪。因此，GBDT模型中的树结构有时并不完整。有时，二叉树中的一些节点丢失了，如图6所示，在这种情况下，不规则树可能导致比较节点的不规则排列，以及生成不规则的分数地址，它会给硬件实现带来不规则的情况。为了解决这个问题，那些缺少树节点的位置将不会被删除。相反，一些空白节点将填充这些位置。使用空白节点填充不规则树，这些叶节点被空白节点替换，原来的子节点变为叶节点，它们的原始预测分数是叶节点。这些空白节点将生成“比较结果”，默认选择左子节点。在这种情况下，右半部分将无法到达。

本申请的实施方式通过将训练好的梯度提升决策树模型中的模型参数加载到处理模块，用流水线对接收到的信号特征进行并行比较，得到多个总预测分数；使用结果生成模块根据多个总预测分数生成识别结果，能够应用于生物医疗电子及生物监测领域，如手势识别、睡眠分期、癫痫检测等场景。此外，也能够应用于数据挖掘、内容推荐、机器视觉等其他领域。

根据本申请的实施方式，还提出一种基于梯度提升决策树的手势识别装置，如图7所示，包括：采集器接口201、缓存器202和识别系统203；

采集器接口，用于接收和发送信号数据；

缓存器，用于对接口模块发送的信号数据进行缓存，发送至识别系统。

其中，识别系统可以为一个安装了手势识别系统的模块或单元，或者为一个能够运行手势识别系统的处理器。

如图8所示，还包括：存储接口和/或数据收发模块。

采集器接口将接收采集到的用于识别手势的信号数据发送至缓存器。

优选地，信号数据可以为表面肌电信号。

缓存器对信号数据进行缓存，发送至识别系统进行手势识别。

缓存器还能够将缓存的信号数据发送至存储接口。

存储接口用于接入存储模块，将信号数据发送至存储模块保存；将训练好的模型发送至缓存器。缓存器将训练好的模型发送至识别系统进行加载。

存储模块包括TF卡、SD卡等。

采集器接口还能够将接收到的信号数据发送至数据收发模块。

如图8所示，数据收发模块用于对信号数据、训练好的模型和识别结果进行无线传输和/或接收。将信号数据发送至云或电脑等终端，进行离线训练；将识别结果发送至手机、电脑等终端，进行具体应用；接收训练好的模型，发送至识别系统。

数据收发模块包括：蓝牙模块、WIFI模块、NFC模块和/或红外模块等各种射频模块。

本申请的实施方式，优选地，应用于FPGA。

优选地，本申请的实施方式还包括滤波器，用于接收对采集器接口发送的信号数据进行滤波，发送至数据收发模块。

本申请的实施方式，优选地，依据表面肌电信号对手势进行识别。

预处理和特征提取模块，优选地，提取表面肌电信号与时域相关的特征，包括：平均绝对值(Mean absolute value，MAV)、简单平方积分(Simple square integral，SSI)、最小值(Minimum Value)、最大值(Maximum Value)、标准偏差(Standard Deviation)、平均振幅变化(Average Amplitude Change，AAC)、过零(Zero Crossing)、斜坡标志变更(SlopeSign Change)和威利森振幅(Willison amplitude)等。

在采集表面肌电信号时，可以采集多路表面肌电信号，并且对每路表面肌电信号提取多个与时域相关的特征。每个流水线都包括多棵树，用于计算各路表面肌电信号以及其对应的多个与时域相关的特征。

如图3所示，为使用梯度提升决策树，对深度为3的树执行并行遍历。其中，每个圆圈代表一个比较节点(子节点)，它执行信号特征与节点阈值的比较。以手势识别为例，每个方形节点都是一个叶节点，具有一个特定手势的预测分数。每一个叶节点的预测分数表示此特定手势的概率。在图n中，即为8种概率(预测分数)。该树集成了七个比较节点。使用来自所有七个节点的比较结果的不同组合生成真值表。一个8位的独热(One Hot)地址代码(分数地址)用于表示右侧列出的预测分数。比较器结果以0或1表示，分别表示到左子节点或右子节点的移动。预编码结果可用于输出预测分数。例如，输出地址为00010000时，将输出节点5的右子节点上的预测分数，其遍历路径为1-2-5。

根据本申请的实施方式，还提出一种基于梯度提升决策树的识别方法，如图9所示，包括：

S101，处理模块根据加载的梯度提升决策树模型中的模型参数，用流水线对接收到的信号特征进行并行比较，得到多个总预测分数，将得到的多个总预测分数发送至结果生成模块；

S102，结果生成模块根据接收到的多个所述总预测分数，生成识别结果。

处理模块包括多个流水线。

每个流水线包括四个阶段：加载阶段、比较阶段、获取阶段和相加阶段。

各流水线中的参数存储单元、特征存储单元、多个比较单元、分数地址生成单元、分数存储单元、加法单元和总和寄存单元，按照控制器的控制，依据时钟周期，在四个阶段中进行并行工作。

本申请的系统中，在处理模块中使用流水线对接收到的信号特征进行并行比较，能够提升处理速度，降低硬件功耗和处理时间的开销。本申请通过对单棵决策树内的节点进行并行遍历结构的设计，以及对多颗决策树的流水线遍历方法，能够更好的平衡硬件开销和时间开销，从而在保留模型拓展性的同时，进一步降低GBDT模型在FPGA上应用的功耗，以及优化延时等性能指标。这种流水线和并行处理的结构的设计可以更有效的节省资源开销，减少功耗水平，能够在低功耗可穿戴情境下使用，适用于移动场景，通用性强。通过将处理分为四个阶段，使用控制器控制流水线中各阶段的运行，能够在FPGA中实现并行处理，提高处理速度，通用性强，体积小巧。使用多种不同的使用相关特征，增加识别结果的准确度。通过增加空白节点，使各棵树中的比较节点数量相同，能够生成规则的分数地址，使用分数地址生成单元根据多个比较结果，生成分数地址，有利于在硬件中的实现。通过分数存储单元根据接收到的分数地址，确定预测分数，能够在时钟周期内快速得到预测分数。在手势识别装置中，通过梯度提升决策树模型对接收到的信号特征进行比较，生成识别结果，可以灵活处理混合型信号数据，对异常点的鲁棒性强，使用单一的信号数据也可以得到准确率高的识别结果，需要的检测设备少，成本低，能够在小型设备上应用，适用于移动场景。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于梯度提升决策树的识别系统，其特征在于，包括：

结果生成模块，用于根据接收到的多个所述总预测分数，生成识别结果；

所述处理模块包括多个流水线，其中，每个所述流水线包括：

加法单元，用于将所述预测分数与总和分数相加，得到新的总和分数，发送至总和寄存单元，直至多个比较单元将参数存储单元中保存的所有梯度提升决策树都加载、比较完成后，将最后一棵梯度提升决策树的预测分数与总和分数相加，得到总预测分数；

总和寄存单元，用于保存总和分数；

所述流水线中的比较单元的数量与单棵梯度提升决策树的节点数量一致。

2.如权利要求1所述的识别系统，其特征在于，还包括：

3.如权利要求1所述的识别系统，其特征在于，所述比较单元包括：

4.如权利要求1所述的识别系统，其特征在于，所述流水线的数量与需要识别的类别数量一致，一个流水线用于识别一个类别。

5.如权利要求1所述的识别系统，其特征在于，各所述流水线还包括：控制器、第一寄存器、第二寄存器和第三寄存器，控制器依据时钟周期控制所述各寄存器，所述各寄存器控制比较单元、分数存储单元和加法单元对接收到的信号特征进行并行处理；

6.一种基于梯度提升决策树的手势识别装置，其特征在于，包括：采集器接口、缓存器和权利要求1-5任一项所述的识别系统；

所述采集器接口，用于接收和发送信号数据；

所述缓存器，用于对接口模块发送的信号数据进行缓存，发送至所述识别系统。

7.如权利要求6所述的手势识别装置，其特征在于，还包括：存储接口和/或数据收发模块。