CN110888859B

CN110888859B - 一种基于组合深度神经网络的连接基数估计方法

Info

Publication number: CN110888859B
Application number: CN201911059922.9A
Authority: CN
Inventors: 陈岭; 黄河清
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2019-11-01
Filing date: 2019-11-01
Publication date: 2022-04-01
Anticipated expiration: 2039-11-01
Also published as: CN110888859A

Abstract

本发明公开了一种基于组合深度神经网络的连接基数估计方法，具体包括：1)提取查询执行日志中各查询的查询计划和连接基数真值，根据查询计划，提取选择操作和连接操作涉及的语义信息、结构信息和数据分布信息，并构建训练数据集；2)构建处理选择操作的选择模型、处理连接操作的连接模型和将特征表示映射为连接基数估计值的连接基数输出模型；3)根据查询计划，通过组合选择模型、连接模型和连接基数输出模型估计给定查询的连接基数。本发明利用深度学习，结合查询相关的丰富信息，能够更加准确地对查询的连接基数进行估计，在查询优化、数据库管理等领域具有广阔的应用前景。

Description

一种基于组合深度神经网络的连接基数估计方法

技术领域

本发明涉及连接基数估计领域，具体涉及一种基于组合深度神经网络的连接基数估计方法。

背景技术

连接基数估计是数据库领域一个基础但充满挑战的研究问题。查询计划中的连接操作以两张表或中间结果为输入，根据连接谓词处理得到返回的结果。连接基数表示连接操作返回结果的行数，连接基数估计根据连接谓词及数据分布信息对其进行估计。基于代价的查询优化器为从候选查询计划中选择最优的查询计划，需要依赖于基数估计对其执行代价进行估计。跨连接相关性，即连接中不同表的属性之间存在相关性，是连接基数估计的最大难点，在实际场景中，数据并不满足独立、均匀和包含原则等简化假设，跨连接相关性大量存在且难以事先获取。

基于概要的连接基数估计方法采用精简的概要表示原始数据分布，使用公式或算法推算，进而对连接基数进行估计。但是，该类方法的效果与消耗的资源正相关，不能以较低的代价得到较好的估计效果。

基于传统机器学习的连接基数估计方法通过传统机器学习模型对连接基数与相关影响因素之间的相关性进行建模，能够学习到单表属性相关性以及跨连接相关性，在估计与训练数据相似的查询时能够得到较好的结果，但是，该类方法都通过人工定义和提取查询特征，存在一定的信息丢失。

基于深度学习的连接基数估计方法通过深度神经网络自动构建连接基数相关影响因素的特征，避免人工特征定义和提取带来的信息丢失，能够学习到单表属性相关性以及跨连接相关性，但是，现有方法没有充分考虑查询计划的结构，并且连接相关的信息不足，导致连接数量增加时，效果显著退化。

发明内容

本发明要解决的技术问题是如何利用深度神经网络提高连接基数估计的准确性。

为解决上述技术问题，本发明提供了一种基于组合深度神经网络的连接基数估计方法，包括以下步骤：

操作信息提取，从查询执行日志中提取查询计划，对查询计划进行解析，获得选择操作和连接操作涉及的语义信息、结构信息和数据分布信息，以此构建训练样本集；

模型构建，构建由全连接层和激活函数组成的选择模型、连接模型以及连接基数输出模型，并利用训练样本对选择模型、连接模型以及连接基数输出模型进行训练，获得训练好的选择模型、连接模型以及连接基数输出模型；

连接基数估计，提取待估计的查询计划中所有选择操作和连接操作涉及的语义信息、结构信息和数据分布信息并输入至训练好的选择模型、连接模型以及连接基数输出模型进行估计，输出连接基数估计值。

本发明利用深度神经网络，结合查询相关的丰富信息，能够更加准确地对查询的连接基数进行估计。与现有方法相比，其优点在于：

1)为查询操作构建深度神经网络模型，支持根据查询计划的结构对模型进行组合，并充分考虑了各操作涉及的语义信息、结构信息和数据分布信息。

2)根据以连接操作为根节点的查询计划进行样本连接和结果聚合，以获取样本连接结果信息，能够有效处理跨连接相关性，进而提高方法的估计准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他附图。

图1是本发明基于组合深度神经网络的连接基数估计方法的总体流程图；

图2是本发明操作信息提取部分的流程图；

图3是本发明模型构建部分的流程图；

图4是本发明选择模型的网络结构示意图；

图5是本发明连接模型的网络结构示意图；

图6是本发明连接基数输出模型的网络结构示意图；

图7是本发明连接基数估计部分的流程图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

如图1～7所示，实施例提供的基于组合深度神经网络的连接基数估计方法包括操作信息提取、模型构建和连接基数估计三个部分，下面针对每个部分进行详细说明。

操作信息提取部分

操作信息提取部分主要提取查询计划中的选择操作与连接操作的相关信息，以构建训练数据集，如图2所示，具体包括以下步骤：

S101，提取查询执行日志，得到各查询的查询计划和连接基数真值card。

在此步骤中，提取查询执行日志，得到历史执行的各查询的查询计划和查询结果的连接基数真值card。

S102，对数据库中的每张连接表分别离线采样n个随机样本并存储。

S103，对查询计划进行解析，提取查询计划中所有选择操作涉及的表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample，该表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample组成选择操作涉及的语义信息、结构信息和数据分布信息；

具体地，对每一条查询对应的查询计划，从根节点开始自顶向下进行解析，若节点为选择操作，则提取该选择操作涉及的表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample，其中，选择谓词信息V^spred包括属性信息

运算符信息

操作数信息

和属性直方图信息

表信息v^tid是独热编码的特征向量，记数据库中所有表的集合T＝{t₁,t₂,…,t_g}，则表信息v^tid的维度为g。若选择操作所涉及的表为t_i，则v^tid的第i位为1，其余位置为0。

选择谓词信息V^spred是特征向量的集合，表示选择操作在一张表上的所有选择谓词特征。一个形如(col,op,val)的选择谓词，包含了属性名、运算符、操作数和属性直方图。本发明一并处理选择操作在一张表上的所有p个选择谓词，其中，第i个选择谓词包含的信息如下：

属性信息

是独热编码的特征向量，该特征向量以所有表中非主键数值类型属性的数量为维度，选择谓词所涉及的属性对应位置为1，其余位置为0。

运算符信息

是独热编码的特征向量，该特征向量以运算符数量为维度，选择谓词的运算符对应位置为1，其余位置为0。

操作数信息

是一个归一化的值，使用直方图对操作数val_i进行归一化得到，计算公式如下：

其中，b表示直方图的桶数，k表示直方图中第一个最大值大于操作数val_i的桶的序号，max_k和min_k分别表示直方图第k个桶的最大值和最小值，max表示属性的最大值。

属性直方图信息

是归一化的直方图边界值特征向量，对于包含b个桶的等频直方图，以一个(b+1)维向量记录由属性最大值和最小值进行归一化后的边界值。

将属性信息

运算符信息

操作数信息

和属性直方图信息

串接，得到选择谓词信息

然后得到选择谓词信息V^spred：

样本选择结果信息v^sample是一个n维的特征向量。对于S102中离线采样得到的n个随机样本，用选择操作在该表上的所有选择谓词判断每一个样本，若样本通过所有选择谓词，则为1，反之为0。

选择操作可能有多个对某张表的选择谓词(例如，where t.a>1 and t.b<10)，用所有对某张表的选择谓词判断样本(例如，sekect*from tsample where tsample.a>1 andtsample.b<10)。

S104，对查询计划进行解析，提取查询计划中所有连接操作涉及的连接谓词信息v^jid和历史连接谓词信息v^hjid。

在此步骤中，对每一条查询对应的查询计划，从根节点开始自顶向下进行解析，若节点为连接操作，则提取其涉及的连接谓词信息v^jid、历史连接谓词信息v^hjid。

连接谓词信息v^jid是独热编码的特征向量，记所有查询包含的所有连接谓词的集合J＝{j₁,j₂,…,j_m}，则v^jid的维度为m。若连接操作的连接谓词为j_i，则v^jid的第i位为1，其余位置为0。

历史连接谓词信息v^hjid是以连接谓词对应的连接操作为根节点的查询计划中，除该连接操作以外所有其余连接操作的连接谓词信息的按位或。

S105，利用S102中采集的样本获取查询计划中所有连接操作涉及的样本连接结果信息v^lsample和v^rsample。

在此步骤中，利用离线采样得到的n个随机样本获取查询计划中所有连接操作的样本连接结果信息v^lsample和v^rsample。

样本连接结果信息v^lsample和v^rsample是2个n维特征向量，分别根据连接谓词左右表得到，其中样本为得到样本选择结果信息时存储的n个随机样本。对于连接表t^left和连接表t^right的连接谓词j_i，根据以该连接谓词j_i对应的连接操作为根节点的查询计划进行样本连接和结果聚合，获得样本连接结果信息。样本连接结果信息v^lsample的获取过程为：

首先，遍历以连接谓词对应的连接操作为根节点的查询计划，得到涉及连接表t^left的所有连接谓词集合SJ；对于SJ中的每一个连接表t^left和表jt的连接谓词sj，用连接表t^left的样本

根据连接谓词sj连接表jt，得到连接谓词sj根据连接表t^left的基础样本连接结果信息br＝[br₁,br₂,…,br_k,…,br_n]，br_k表示在表jt中根据连接谓词sj能够成功与表t^left的样本

连接的元组数；

然后，对基础样本连接结果信息br和样本选择结果信息进行结果聚合，若|SJ|＝1，将基础样本连接结果信息br与表t^left的样本选择结果信息按位乘，作为连接谓词j_i的左样本连接结果信息

若|SJ|>1，将多个基础样本连接结果信息br按位乘，再与表t^left的样本选择结果信息按位乘，作为连接谓词j_i的左样本连接结果信息

组成样本连接结果信息v^lsample。

同样，根据表t^right得到连接谓词j_i的右样本连接结果信息

样本连接结果信息v^rsample的获取过程为：

首先，遍历以连接谓词对应的连接操作为根节点的查询计划，得到涉及连接表t^right的所有连接谓词集合SJ；对于SJ中的每一个连接表t^right和表jt的连接谓词sj，用连接表t^right的样本

根据连接谓词sj连接表jt，得到连接谓词sj根据连接表t^right的基础样本连接结果信息br＝[br₁,br₂,…,br_k,…,br_n]，br_k表示在表jt中根据连接谓词sj能够成功与表t^right的样本

连接的元组数；

然后，对基础样本连接结果信息br和样本选择结果信息进行结果聚合，若|SJ|＝1，将基础样本连接结果信息br与表t^right的样本选择结果信息按位乘，作为连接谓词j_i的右样本连接结果信息

若|SJ|>1，将多个基础样本连接结果信息br按位乘，再与表t^right的样本选择结果信息按位乘，作为连接谓词j_i的右样本连接结果信息

组成样本连接结果信息v^rsample。

连接操作涉及的连接谓词信息v^jid、历史连接谓词信息v^hjid以及样本连接结果信息v^lsample和v^rsample组成连接操作涉及的语义信息、结构信息和数据分布信息。

S106，将每个查询计划中所有选择操作涉及的表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample和连接操作涉及的连接谓词信息v^jid、历史连接谓词信息v^hjid以及样本连接结果信息v^lsample和v^rsample作为一个训练样本，构建训练数据集。

模型构建部分

模型构建部分主要是构建选择模型、连接模型以及连接基数输出模型，具体过程如下：

S201，构建由全连接层和激活函数组成的选择模型，并利用选择模型处理选择操作涉及的表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample经过选择模型处理得到选择操作特征表示z^sel。

如图4所示，选择模型包含5个全连接层，分别记为net_tid、net_sample、net_spred、net_spsum和net_tout，相连2个全连接层之间通过激活函数完成数据的映射，其中net_tid和net_sample分别处理表信息v^tid和样本选择结果信息v^sample，net_spred和net_spsum组成Deep Sets模块，处理选择谓词信息V^spred，得到的3个特征表示进行串接后输入给net_tout得到选择操作特征表示。

每一个特征向量

由net_spred处理得到的特征表示相加后经过net_spsum处理得到选择谓词信息V^spred的特征表示z^spred，计算公式如下：

其中W^spred和W^spsum分别表示net_spred和net_spsum的权重矩阵，b^spred和b^spsum分别表示net_spred和net_spsum的偏置项，σ表示非线性激活函数，本发明使用ReLU激活函数。

表信息的特征表示和样本选择结果信息的特征表示z^tid和z^sample分别由v^tid和v^sample经过net_tid和net_sample处理得到。将z^tid、z^spred和z^sample串接后输入给net_tout处理得到选择操作特征表示z^sel，计算公式如下：

其中W表示net_tout的权重矩阵，b表示net_tout的偏置项，σ表示非线性激活函数，本发明使用ReLU激活函数，

表示串接操作。

S202，构建由全连接层和激活函数组成的连接模型，并利用连接模型处理连接操作涉及的连接谓词信息v^jid、历史连接谓词信息v^hjid、样本连接结果信息v^lsample和v^rsample以及连接操作左右子节点对应模型输出的子节点信息z^lchild和z^rchild经过连接模型处理得到连接操作特征表示z^join。

如图5所示，连接模型包含6个全连接层，分别记为net_jid、net_lsample、net_rsample、net_lc、net_rc和net_jout，相连2个全连接层之间通过激活函数完成数据的映射，其中net_jid处理连接谓词信息v^jid和历史连接谓词信息v^hjid，net_lsample和net_rsample分别处理样本连接结果信息v^lsample和v^rsample，net_lc和net_rc分别处理左右子节点对应的选择模型或连接模型所输出的子节点信息z^lchild和z^rchild，得到的5个特征表示进行串接后输入给net_jout得到连接操作特征表示。

连接谓词信息和历史连接谓词信息的特征表示z^jid由v^jid和v^hjid串接后经过net_jid处理得到；样本连接结果信息的特征表示z^lsample和z^rsample分别由v^lsample和v^rsample经过net_lsample和net_rsample处理得到；子节点信息的特征表示z^lc和z^rc分别由z^lchild和z^rchild经过net_lc、net_rc处理得到。将z^jid、z^lsample、z^rsample、z^lc和z^rc串接后输入给net_jout处理得到连接操作特征表示z^join，计算公式如下：

其中W表示net_jout的权重矩阵，b表示net_jout的偏置项，σ表示非线性激活函数，本发明使用ReLU激活函数，

表示串接操作。

S203，构建由全连接层和激活函数组成的连接基数输出模型，并利用连接基数输出模型处理查询计划根节点连接操作对应连接模型的输出，得到连接基数估计值

如图6所示，连接基数输出模型包含2个全连接层，相连2个全连接层之间通过激活函数完成数据的映射，最终由sigmoid激活函数输出一个(0,1)之间的标量w^out，表示归一化的连接基数估计值

其反归一化公式如下：

其中，e表示以自然常数为底的指数函数，max和min分别表示所有查询中连接基数真值的最大值和最小值。

S204，对于训练样本集中的每一个训练样本，根据查询计划，组合选择模型、连接模型和连接基数输出模型，利用样本中操作涉及的信息和组合的模型计算得到查询的连接基数估计值，然后结合连接基数真值计算得到两者的偏差q-error；利用训练样本集中的所有训练样本来训练选择模型、连接模型和连接基数输出模型，通过最小化平均q-error的目标来调整网络参数。

在此步骤中，q-error为接基数输出模型输出的连接基数估计值和连接基数真值之间的偏差，本发明采用q-error度量连接基数真值card和连接基数估计值

之间的偏差，记为e_q-error，计算公式如下：

其中，card表示连接基数真值，

表示连接基数估计值。

损失函数为平均q-error，记为Loss_mean _q-error，计算公式如下：

其中，Q表示所有查询的集合，card表示连接基数真值，

表示连接基数估计值。

在训练前，将训练数据集按照固定的批量大小M进行分批，批次总数为N，具体计算公式为：

其中，N_all为训练数据集中样本总数。

如图3所示，从训练数据集中顺序选取索引为i的一批训练样本，再从这批训练样本中顺序选取索引为k的一个训练样本。根据该训练样本的查询计划，组合选择模型、连接模型和连接基数输出模型，除根节点以外的所有选择操作和连接操作对应模型的输出作为其后继连接操作对应连接模型的输入，根节点连接操作对应连接模型的输出作为连接基数输出模型的输入。利用组合的模型得到该训练样本的连接基数估计值，结合其真值得到q-error，进而得到一批训练样本的平均q-error并对选择模型、连接模型和连接基数输出模型的网络参数进行调整。

按照上述方式对选择模型、连接模型和连接基数输出模型进行训练，直至训练数据集的所有批次都参与训练，且达到指定的训练迭代次数，训练结束，得到优化的选择模型、连接模型和连接基数输出模型。

连接基数估计部分

连接基数估计部分主要是利用训练好的择模型、连接模型和连接基数输出模型估计连接基数。如图7所示，具体过程如下：

S301，给定需要估计连接基数的查询及其查询计划，通过操作信息提取部分获取查询计划中所有选择操作和连接操作涉及的语义信息、结构信息和数据分布信息。

S302，根据查询计划，组合训练好的选择模型、连接模型和连接基数输出模型。

S303，将S301提取的信息输入至S302组合的模型中，计算得到查询的连接基数估计值。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的最优选实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于组合深度神经网络的连接基数估计方法，包括以下步骤：

连接基数估计，提取待估计的查询计划中所有选择操作和连接操作涉及的语义信息、结构信息和数据分布信息并输入至训练好的选择模型、连接模型以及连接基数输出模型进行估计，输出连接基数估计值；

其中，模型构建包括以下步骤：

S201，构建由全连接层和激活函数组成的选择模型，并利用选择模型处理选择操作涉及的表信息v^tid、选择谓词信息V^spred和样本选择结果信息v^sample经过选择模型处理得到选择操作特征表示z^sel；

S202，构建由全连接层和激活函数组成的连接模型，并利用连接模型处理连接操作涉及的连接谓词信息v^jid、历史连接谓词信息v^hjid、样本连接结果信息v^lsample和v^rsample以及连接操作左右子节点对应模型输出的子节点信息z^lchild和z^rchild经过连接模型处理得到连接操作特征表示z^join；

S204，利用训练样本集中的所有训练样本来训练选择模型、连接模型和连接基数输出模型，通过最小化平均q-error的目标来调整网络参数，其中，q-error为接基数输出模型输出的连接基数估计值和连接基数真值之间的偏差。

2.如权利要求1所述的基于组合深度神经网络的连接基数估计方法，其特征在于，所述操作信息提取的过程为：

S101，提取查询执行日志，得到各查询的查询计划和连接基数真值card；

S102，对数据库中的每张连接表分别离线采样n个随机样本并存储；

S104，对查询计划进行解析，提取查询计划中所有连接操作涉及的连接谓词信息v^jid和历史连接谓词信息v^hjid；

S105，利用S102中采集的样本获取查询计划中所有连接操作涉及的样本连接结果信息v^lsample和v^rsample；

3.如权利要求2所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S103中，表信息v^tid是独热编码的特征向量，记数据库中所有表的集合T＝{t₁,t₂,…,t_g}，则表信息v^tid的维度为g；若选择操作所涉及的表为t_i，则v^tid的第i位为1，其余位置为0；

选择谓词信息V^spred是特征向量的集合，表示选择操作在一张表上的所有选择谓词特征，选择谓词信息V^spred包括属性信息

运算符信息

操作数信息

和属性直方图信息

样本选择结果信息v^sample是一个n维的特征向量，对于S102中离线采样得到的n个随机样本，用选择操作在该表上的所有选择谓词判断每一个样本，若样本通过所有选择谓词，则为1，反之为0。

4.如权利要求3所述的基于组合深度神经网络的连接基数估计方法，其特征在于，属性信息

是独热编码的特征向量，该特征向量以所有表中非主键数值类型属性的数量为维度，选择谓词所涉及的属性对应位置为1，其余位置为0；

运算符信息

是独热编码的特征向量，该特征向量以运算符数量为维度，选择谓词的运算符对应位置为1，其余位置为0；

操作数信息

其中，b表示直方图的桶数，k表示直方图中第一个最大值大于操作数val_i的桶的序号，max_k和min_k分别表示直方图第k个桶的最大值和最小值，max表示属性的最大值；

属性直方图信息

是归一化的直方图边界值特征向量，对于包含b个桶的等频直方图，以一个(b+1)维向量记录由属性最大值和最小值进行归一化后的边界值；

将属性信息

运算符信息

操作数信息

和属性直方图信息

串接，得到选择谓词信息

然后得到选择谓词信息V^spred：

5.如权利要求2所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S104中，连接谓词信息v^jid是独热编码的特征向量，记所有查询包含的所有连接谓词的集合J＝{j₁,j₂,…,j_m}，则v^jid的维度为m，若连接操作的连接谓词为j_i，则v^jid的第i位为1，其余位置为0；

6.如权利要求2所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S105中，样本连接结果信息v^lsample的获取过程为：

连接的元组数；

组成样本连接结果信息v^lsample。

7.如权利要求1所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S201中，选择模型包含5个全连接层，分别记为net_tid、net_sample、net_spred、net_spsum和net_tout，相连2个全连接层之间通过激活函数完成数据的映射，其中net_tid和net_sample分别处理表信息v^tid和样本选择结果信息v^sample，net_spred和net_spsum组成Deep Sets模块，处理选择谓词信息V^spred，得到的3个特征表示进行串接后输入给net_tout得到选择操作特征表示；

每一个特征向量

其中W^spred和W^spsum分别表示net_spred和net_spsum的权重矩阵，b^spred和b^spsum分别表示net_spred和net_spsum的偏置项，σ表示非线性激活函数，本发明使用ReLU激活函数；

表信息的特征表示和样本选择结果信息的特征表示z^tid和z^sample分别由v^tid和v^sample经过net_tid和net_sample处理得到；将z^tid、z^spred和z^sample串接后输入给net_tout处理得到选择操作特征表示z^sel，计算公式如下：

表示串接操作。

8.如权利要求1所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S202中，连接模型包含6个全连接层，分别记为net_jid、net_lsample、net_rsample、net_lc、net_rc和net_jout，相连2个全连接层之间通过激活函数完成数据的映射，其中net_jid处理连接谓词信息v^jid和历史连接谓词信息v^hjid，net_lsample和net_rsample分别处理样本连接结果信息v^lsample和v^rsample，net_lc和net_rc分别处理左右子节点对应的选择模型或连接模型所输出的子节点信息z^lchild和z^rchild，得到的5个特征表示进行串接后输入给net_jout得到连接操作特征表示；

连接谓词信息和历史连接谓词信息的特征表示z^jid由v^jid和v^hjid串接后经过net_jid处理得到；样本连接结果信息的特征表示z^lsample和z^rsample分别由v^lsample和v^rsample经过net_lsample和net_rsample处理得到；子节点信息的特征表示z^lc和z^rc分别由z^lchild和z^rchild经过net_lc、net_rc处理得到；将z^jid、z^lsample、z^rsample、z^lc和z^rc串接后输入给net_jout处理得到连接操作特征表示z^join，计算公式如下：

表示串接操作。

9.如权利要求1所述的基于组合深度神经网络的连接基数估计方法，其特征在于，S203中，连接基数输出模型包含2个全连接层，相连2个全连接层之间通过激活函数完成数据的映射，最终由sigmoid激活函数输出一个(0,1)之间的标量w^out，表示归一化的连接基数估计值

其反归一化公式如下：