CN115424663A

CN115424663A - 一种基于attention的双向表示模型的RNA修饰位点预测方法

Info

Publication number: CN115424663A
Application number: CN202211259709.4A
Authority: CN
Inventors: 王鸿磊; 刘辉; 张�林; 张雪松; 王栋; 黄涛
Original assignee: Xuzhou College of Industrial Technology
Current assignee: Xuzhou College of Industrial Technology
Priority date: 2022-10-14
Filing date: 2022-10-14
Publication date: 2022-12-02
Anticipated expiration: 2042-10-14
Also published as: CN115424663B

Abstract

本发明公开了一种基于attention的双向表示模型的RNA修饰位点预测方法，其涉及生物信息学RNA转录后修饰位点预测领域。包括：将包含N¹‑甲基腺苷修饰位点的RNA碱基序列为正样本和不包含N¹‑甲基腺苷修饰位点的RNA碱基序列为负样本，进行词嵌入编码；将编码后的序列分为两路，在一个序列和另一个反转序列首段添加分类符号并进行位置编码；将编码后的两个序列输入编码模块中采用训练权重共享原则反复训练；将两路训练好的序列分类符号相加后经过全连接神经网络层和二分类器，预测哪个序列里包含N¹‑甲基腺苷修饰位点。本发明能够描述复杂方面词的上下文关系，加强文本中重要词汇对情感分析的影响，从而准确预测RNA生物序列中是否包含N¹‑甲基腺苷修饰位点。

Description

一种基于attention的双向表示模型的RNA修饰位点预测方法

技术领域

本发明涉及生物信息学RNA转录后修饰位点预测领域，特别涉及一种基于attention的双向表示模型的RNA中N¹-甲基腺苷修饰位点预测方法。

背景技术

研究表明，通过转录后RNA修饰的表观转录组调控对于所有种类的RNA都是必不可少的，所以，准确识别RNA修饰对于理解其目的和调控机制至关重要。

传统的RNA修饰位点识别实验方法相对复杂、费时、费力。机器学习方法已经应用于RNA序列特征提取和分类的计算过程中，可以更有效地补充实验方法。近年来，卷积神经网络(Convolutional Neural Networks,CNN)和长时记忆(Long short-term memory,LSTM)由于在表征学习方面的强大功能，在修饰位点预测方面取得了显著的成就。

然而，卷积神经网络(CNN)可以从空间数据中学习局部响应，但不能学习序列相关性；长时记忆(LSTM)专门用于序列建模，可以同时访问上下文表示，但与CNN相比缺乏空间数据提取。由于以上原因，使用自然语言处理(Natural Language Processing,NLP)、其他深度学习(DeepLearn,DL)构建预测框架的动力十分强烈。

现有技术中，在构建预测框架时，使用注意力机制虽然可以关注到句子上下文的重要特征，但是单个注意力矩阵之间缺乏信息交互，难以描述复杂方面词的上下文关系；且没有充分联系上下文，加强文本中重要词汇对情感分析的影响。

发明内容

基于此，有必要针对上述技术问题，提供一种基于attention的双向表示模型的RNA修饰位点预测方法。

本发明实施例提供一种基于attention的双向表示模型的RNA修饰位点预测方法，包括：

将包含N¹-甲基腺苷修饰位点的人类物种RNA碱基序列为正样本和不包含N¹-甲基腺苷修饰位点的人类物种RNA碱基序列为负样本，进行word2vec词嵌入编码；

将经过word2vec词嵌入编码后的序列分为两路词嵌入编码序列；其中，在一个词嵌入编码序列首段添加分类符号并进行位置编码形成正向序列，对另一个词嵌入编码序列位置反转后并在其首段添加分类符号和进行位置编码形成反向序列；

将正向序列和反向序列均输入编码模块中进行训练，获得正向特征序列和反向特征序列；其中，所述编码模块包括3个依次串接的编码块；所述编码块包括：一个多头自注意力层和一个前向反馈全连接层，且每层之间通过残差连接和标准化层连接；

将正向特征序列的分类符号的值和反向特征序列的分类符号的值相加，后经过全连接神经网络层和二分类器，预测人类物种RNA碱基序列中是否包含N¹-甲基腺苷修饰位点。

进一步地，所述对RNA碱基序列进行word2vec词嵌入编码，具体包括：

利用大小为3个碱基的窗口，每次滑动1个碱基的形式，在每条样本序列上滑动，直到窗口碰到序列最末端时滑动结束，由此获得105种不同的子序列和唯一的整数序列组成的字典；

每条样本101个碱基，利用大小为3个碱基的窗口，每次滑动1个碱基的形式，在每条样本序列上滑动，直到窗口碰到序列最末端时滑动结束，由此得到99个由3个碱基组成的子序列，使用word2vec的CBOW模型编码RNA序列，因此，每个子序列被转换成表征语义的词向量，再利用得到的词向量将RNA碱基序列中长度为101bp转换成99*100的矩阵，其中，99为预处理时词的个数，100为词向量维度。

进一步地，所述编码模块包括：3个依次串联编码块。

进一步地，所述多头自注意力层是将多个自注意力的输出拼接融合而形成的；自注意力将序列的查询query与序列的键key之间先做矩阵相乘再做放缩，得到一个注意力得分，使用softmax函数对注意力得分做归一化处理，得到每个键的权重，将权重矩阵相乘序列的值得到交互注意力输出，自注意力对应的数学公式形式如下：

上式中，Q是查询向量、K是键向量、V是值向量，d_k为键向量K的维度大小，K^T为键向量的转置,即向量为列向量时，取了转置后就是行向量；当输入序列为X时，Q、K、V都是从同样的输入序列X线性变换而来的，通过以下等式表示：

Q＝XW^Q

K＝XW^K

V＝XW^V

上式中，X为n行向量组成，W为权重，W^Q代表查询向量Q的权重，W^K代表键向量K的权重，W^V代表值向量V的权重，三个权重最初随机初始化，最终值由网络自己学习得到；

多头自注意力层，则是将自注意力中的查询、键和值分别h次线性投影到dk、dk和dv维度上，其中dv为值向量V的维度大小；在每个查询、键和值的投影版本上，并行执行自注意力机制，产生dv维度的输出值；将以上h次自注意力的输出值拼接起来，再次投影到线性网络，产生最终值；即所述多头自注意力层对应的数学公式形式如下：

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

上式中，Concat为将多个自注意力的输出head_i拼接，i取值正整数，代表具体第i头数，W^O为多个自注意力拼接的权重，

R为代表集合实数集，实数集是包含所有有理数和无理数的集；d_k为键向量K的维度大小，此处d_k＝16；d_v为值向量V的维度大小，此处d_v＝16；d_model为输出维度，此处d_model＝128；

以上公式，使用h＝8个并行注意力层或头，对于其中的每一个，使用d_k＝d_v＝d_model/h＝16。

进一步地，所述前向反馈全连接层，包括：

两个线性变换组成，中间有一个Relu激活函数；即所述前向反馈全连接层对应的数学公式形式如下：

FFN(x)＝max(0,xW₁+b₁)W₂+b₂。

上式中，max()为ReLU激活函数；W₁、W₂、b₁和b₂均为前向反馈全连接层的参数。

进一步地，所述编码模块包括：

编码模块的输入和输出的维度d_model＝128，多头数h＝8，前向反馈网络维度d_ff＝512，均采用4倍的大小关系，dropout＝0.1。

进一步地，本发明实施例还包括：构建数据集，其具体包括：

数据集的长度是101bp，数据集包括正负数据集的RNA样本序列以及所对应的类别标签，确定训练集与测试集；

其中，训练集和测试集中含有N¹-甲基腺苷修饰位点的RNA作为正样本，没有N¹-甲基腺苷修饰位点的RNA作为负样本；

其中，所述数据集的样本序列是以共同基序A为中心，前后取值窗口大小为50bp，即每个m¹A正样本/负样本由101bp组成，在以共同基序A为中心前后取值窗口大小为50bp的样本序列中，当以共同基序A为中心前后的碱基序列没有50bp长时，不足的核苷酸使用‘-’字符填充；训练集包括593个正样本以及5930个负样本，测试集包括114个正样本以及1140个负样本。

进一步地，本发明实施例还包括：采用训练集对两个编码模块进行参数共享训练，其具体包括：

输入正向序列的编码模块所训练的参数用于输入反向序列的编码模块训练，并且输入反向序列的编码模块训练出的参数用于输入正向序列的编码模块训练。

进一步地，所述将正向特征序列的分类符号的值和反向特征序列的分类符号的值相加，后经过全连接神经网络层和两分类器，预测人类物种RNA碱基序列中是否包含N¹-甲基腺苷修饰位点，包括：

分类符号token随机初始化，并随着训练不断更新，将更新后的两路分类符号token相加以实现分类符号token上的信息汇聚；

将更新后的token相加后，再经过全连接神经网络层和sigmoid两分类器预测是否为甲基化位点。

本发明实施例提供的上述基于attention的双向表示模型的RNA修饰位点预测方法，与现有技术相比，其有益效果如下：

本发明将包含N1-甲基腺苷修饰位点的人类物种RNA碱基序列为正样本和不包含N1-甲基腺苷修饰位点的人类物种RNA碱基序列为负样本，将待预测的序列通过词嵌入编码形成向量后，并将其分为正向序列和反向序列，再在正向序列和反向序列前均添加分类符号和进行序列位置编码，然后将以上处理后的两个序列分别送入3个串联的编码块中，采用训练权重共享的原则，经过反复训练，最终，将两路训练好的序列的分类符号的值相加后经过全连接神经网络层和二分类器，以预测RNA碱基序列中是否包含N¹-甲基腺苷修饰位点。其中，考虑到编码模块权重共享的原则，输入正向序列的编码模块所训练的参数用于输入反向序列的编码模块训练，输入反向序列的编码模块训练出的参数用于输入正向序列的编码模块训练，提高模型泛化能力；还有分类符号token随着网络的训练会不断更新，将更新后的两路分类符号token相加以实现分类符号token上的信息汇聚。即本发明通过权重共享的形式训练编码模型以提高模型泛化能力、以及分类符号token随着网络的训练不断更新后再相加以实现分类符号信息聚合，其能够描述复杂方面词的上下文关系，从而能够准确预测甲基化位点。

附图说明

图1为一个实施例中提供的基于注意力机制的双向表示模型示意图；

图2为一个实施例中提供的注意力机制示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本发明实施例提供了一种基于attention的双向表示模型的RNA修饰位点预测方法，其具体包括：

1)收集正负样本数据集：获得人类物种RNA的N¹-甲基腺苷(N1–methyladenosine,m¹A)修饰位点数据集，数据集的长度是101bp(base pair)，数据集包括正负数据集的RNA样本序列以及所对应的类别标签，确定训练集与测试集。

1-1)训练集和测试集中含有N¹-甲基腺苷修饰位点的RNA作为正样本，不含有N¹-甲基腺苷修饰位点的RNA作为负样本；

1-2)数据集样本序列是以共同基序A为中心，前后取值窗口大小为50bp，即每个m¹A正样本/负样本由101bp(Base Pair,bp)组成，当以共同基序A为中心前后的碱基序列没有50bp长的时候，不足的核苷酸使用‘-’字符填充；训练集包括593个正样本以及5930个负样本，测试集包括114个正样本以及1140个负样本。如表1所示：

表1两个RNA修饰数据集的统计

2)特征编码：利用大小为3个碱基的窗口，每次滑动1个碱基的形式，在每条样本序列上滑动，直到窗口碰到序列最末端时滑动结束，由此会获得105种不同的子序列和唯一的整数序列组成的字典，每条样本101个碱基，利用大小为3个碱基的窗口在每条样本序列上滑动，得到99个由3个碱基组成的子序列，使用word2vec的CBOW模型编码RNA序列，因此，每个子序列会被转换成表征语义的词向量，再利用得到的词向量将数据集中长度为101bp被转换成99*100的矩阵，其中99为预处理时词的个数，100为词向量维度。即特征编码方法为word2vec特征提取方法，word2vec向量维度是100。

具体地，碱基序列先经过word2vec模型进行word2vec词嵌入编码，将样本中3个碱基转变成向量表示，由一维转为多维，例如本设计：每个样本101个碱基，利用大小为3个碱基的窗口在每条样本序列上滑动，会得到99个由3个碱基组成的子序列，即99*1，由于词向量维度是100维，因此，通过word2vec模型之后，99*1的子序列转变成99*100的矩阵，其中99为预处理时词的个数，100为词向量维度。word2vec模型作用是希望在高维空间捕捉词汇间的关系。

3)将经过word2vec词嵌入编码后的序列分为两路词嵌入编码序列；其中，在一个词嵌入编码序列首段添加分类符号token并进行位置编码，即从0开始进行编号，形成正向序列，对另一个词嵌入编码序列位置反转后并在其首段添加分类符号token和进行位置编码形成反向序列；其中，位置编码层在本模型中具有非常重要的作用，如果去掉这层，重新跑一遍生成模型，效果下降很明显，具体表现为容易生成重复的词。

4)正向序列和反向序列分别经过x次编码模块(Encoder)(x＝3)，编码块(EncoderBlock)包括多头注意力机制层(MultiheadAttention)、前向反馈全连接层(Feed Forward)组成，每层之间通过残差连接(Residual Connection)和标准化层(LayerNormalization)，残差连接用于防止网络退化，可以避免梯度消失的问题。标准化层用于对每一层的激活值进行归一化。如图1所示。

具体地，“正向+位置编码”和“反向+位置编码”的向量分别经过编码模块，编码模块包含3个编码块，编码块由一个多头自注意力层和一个前向反馈全连接层组成，以上每层之间通过残差连接(Residual Connection)和标准化层(Layer Normalization)，残差连接用于防止网络退化，可以避免梯度消失的问题。标准化层用于对每一层的激活值进行归一化。3个一模一样的Encoder Block串联在一起,共同组成完整的Encoder，因此剖析一个Encoder Block就可以对整个Encoder的内部结构有清晰的认识。

多头自注意力层由多个头的自注意力组成，自注意力将序列的查询(query)与序列的键(key)之间先做矩阵相乘(MatMul)再做放缩(Scale)，可以得到一个注意力得分，使用softmax函数对注意力得分做归一化处理，得到每个键的权重，将权重矩阵相乘序列的值得到交互注意力输出，如图2所示，自注意力对应的数学公式形式如下：

公式中Softmax的作用是对向量做归一化，那么就是对相似度的归一化，得到了一个归一化之后的权重矩阵，矩阵中，某个值的权重越大，表示相似度越高。Q是查询向量(query vector)、K是键向量(key vector)、V是值向量(Value Vector)，d_k为K的维度大小K^T为键向量的转置,即向量为列向量时，取了转置后就是行向量；以输入序列X为例，Q、K、V其实都是从同样的输入序列X线性变换而来的,可以理解成以下等式：

Q＝XW^Q

K＝XW^K

V＝XW^V

上式中，X为n行向量组成，W为权重(weight)的首字母，W^Q代表查询向量Q的权重，W^K代表键向量K的权重，W^V代表值向量V的权重，以上三个权重最初随机初始化，最终值由网络自己学习得到。向量X与W^Q经过矩阵乘法得到Q，同理的方法得到K，V。

多头自注意力层，则是将以上自注意力中的查询、键和值分别h次线性投影到dk、dk和dv维度上，其中dv为值向量V的维度大小，然后，在每个查询、键和值的投影版本上，并行执行自注意力机制，产生dv维度的输出值。将以上h次自注意力的输出值拼接起来,再次投影到线性网络，产生最终值，所述多头自注意力层对应的数学公式形式如下：

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

公式中Concat起到对多个自注意力的输出(head_i)拼接的作用，其中i取值正整数，代表具体第i头数，W^O为多个自注意力层拼接的权重，其中，

R为代表集合实数集。实数集是包含所有有理数和无理数的集合；d_k为键向量K的维度大小，本模型d_k＝16；d_v为值向量V的维度大小，本模型d_v＝16；d_model为本模型的输出维度，本模型d_model＝128。

以上公式,使用h＝8个并行注意力层或头。对于其中的每一个，我们使用d_k＝d_v＝d_model/h＝16。

多头self-attention层的作用：实验结果表明,Multi-head可以在更细致的层面上提取不同head的特征,总体计算量和单一head相同的情况下,提取特征的效果更佳。

前向反馈全连接层模块由两个线性变换组成,中间有一个Relu激活函数,对应的数学公式形式如下，其中max即代表了ReLU激活函数。

FFN(x)＝max(0,xW₁+b₁)W₂+b₂

公式中W₁、W₂、b₁和b₂分别为反馈全连接层的参数。

其中，模型输出维度d_model＝128，多头数h＝8，前向反馈网络维度d_ff＝512，均采用4倍的大小关系。还有dropout＝0.1，dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。

需要说明的是，前向反馈全连接层的作用:单纯的多头注意力机制并不足以提取到理想的特征,因此增加全连接层来提升网络的能力。

以上多头自注意力层(MultiheadAttention)和前向反馈全连接层(FeedForward)的每层之间通过残差连接(Residual Connection)和标准化层(LayerNormalization)连接，残差层的作用：用于防止网络退化，可以避免梯度消失的问题。标准化层的作用：用于对每一层的激活值进行归一化。

较佳地，每个样本将经过word2vec词嵌入编码后的序列分为两路词嵌入编码序列；其中，在一个词嵌入编码序列首段添加分类符号并进行位置编码形成正向序列，对另一个词嵌入编码序列位置反转后并在其首段添加分类符号和进行位置编码形成反向序列，将正向序列和反向序列分别放入2个相同结构的模型中训练，两个模型采用权重共享，提高模型泛化能力。具体地，正向序列和反向序列分别放入2个相同结构的编码模型训练过程中，两个模型采用权重共享，即两个编码模型训练的参数完全共享，完全一样，例如：图1中输入正向序列的模型所训练的参数用于输入反向序列的模型训练，其训练出的参数用于输入正向序列的模型训练，这样做可以提高模型泛化能力。

5)将正向特征序列的分类符号token和反向特征序列的分类符号token相加，后经过全连接神经网络层和两分类器，预测人类物种RNA碱基序列中是否包含N¹-甲基腺苷修饰位点。

具体地，分类符号token随机初始化，并随着网络的训练不断更新，它能够编码整个数据集的统计特性；该token对所有其他token上的信息做汇聚(分类符号信息聚合)，并且由于它本身不基于序列内容，因此可以避免对sequence中某个特定token的偏向性；该token使用固定的位置编码(如图1本设计token的位置编码为0)能够避免输出受到位置编码的干扰。正向序列和反向序列经过编码模块训练后，分类符号token会随着网络的训练不断更新，将正向序列和反向序列各自更新后的token相加，再经过全连接神经网络层和sigmoid两分类器实现是否为甲基化位点的分类。

需要说明的是，编码模块输入＝嵌入式编码输入+位置编码。

嵌入式编码输入是通过常规embedding层，将每一个词的向量维度从词向量维度映射到d_model，由于是相加关系，因此，这里的位置编码也是一个d_model维度的向量。

位置编码不是单一的一个数值，而是包含句子中特定位置信息的d维向量(非常像词向量)，这种编码没有整合进模型，而是用这个向量让每个词具有它在句子中的位置的信息。换句话说，通过注入词的顺序信息来增强模型输入。给定一个长度为m的输入序列，让s表示词在序列中的位置，

表示s位置对应的向量，

表示s位置向量里的第i个元素，d_model是编码模块的输入和输出的维度，也是位置编码的维度。

是生成位置向量

的函数，定义如下：

其中

把d_model维的向量两两一组，每组都是一个sin和一个cos，这两个函数共享同一个频率ω_k，一共有d_model/2组，由于我们从0开始编号，所以最后一组编号是d_model/2-1。sin和cos函数的波长(由ω_i决定)则从2π增长到2π*10000。

本发明实施例中，利用训练集，通过5折的方式验证模型的有效性：

表2训练集5折预测结果

考虑到测试集正负样本是1：10，属于不平衡样本集，因此，通过精确召回曲线下面积(AUPRC)比较性能，通过表2所示，基于attention的双向表示模型(Bi-directionalRepresentations fromAttention,BRA)的精确召回曲线下面积(AUPRC)远远高于通过BiLSTM分类模型(Bi-directional Long Short-Term Memory,BiLSTM)、CNN(Convolutional Neural Network,CNN)、BiLSTM+selfatt(BiLSTM Layer+selfAttentionLayer)、CNN+selfatt(Convolutional Neural Network Layer+selfAttention Layer)。

其他，精确度ACC等关键指标比较，基于attention的双向表示模型(Bi-directional Representations fromAttention,BRA)也高于其他已知的优秀的分类。

本发明实施例中，利用测试集验证模型的有效性：

表3独立数据集评价

考虑到测试集正负样本是1：10，属于不平衡样本集，因此，通过精确召回曲线下面积(AUPRC)比较性能，通过表3所示，基于attention的双向表示模型(Bi-directionalRepresentations from Attention,BRA)的精确召回曲线下面积(AUPRC)远远高于通过BiLSTM分类模型(Bi-directional Long Short-Term Memory,BiLSTM)、CNN(Convolutional Neural Network,CNN)、BiLSTM+selfatt(BiLSTM Layer+selfAttentionLayer)、CNN+selfatt(Convolutional Neural Network Layer+selfAttentionLayer)。

其他，精确度ACC等关键指标比较，基于attention的双向表示模型(Bi-directional Representations from Attention,BRA)也高于其他已知的优秀的分类。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，包括：

将正向序列和反向序列均输入编码模块中进行训练，获得正向特征序列和反向特征序列；其中，所述编码模块包括多个依次串接的编码块；所述编码块包括：一个多头自注意力层和一个前向反馈全连接层，且每层之间通过残差连接和标准化层连接；

2.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述对RNA碱基序列进行word2vec词嵌入编码，具体包括：

3.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述编码模块包括：3个依次串联的编码块。

4.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述多头自注意力层是将多个自注意力的输出拼接融合而形成的；自注意力将序列的查询query与序列的键key之间先做矩阵相乘再做放缩，得到一个注意力得分，使用softmax函数对注意力得分做归一化处理，得到每个键的权重，将权重矩阵相乘序列的值得到交互注意力输出，自注意力对应的数学公式形式如下：

Q＝XW^Q

K＝XW^K

V＝XW^V

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

5.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述前向反馈全连接层，包括：

FFN(x)＝max(0,xW₁+b₁)W₂+b₂

6.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述编码模块包括：

7.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，还包括：构建数据集，其具体包括：

8.如权利要求7所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，还包括：采用训练集对两个编码模块进行参数共享训练，其具体包括：

9.如权利要求1所述的基于attention的双向表示模型的RNA修饰位点预测方法，其特征在于，所述将正向特征序列的分类符号的值和反向特征序列的分类符号的值相加，后经过全连接神经网络层和两分类器，预测人类物种RNA碱基序列中是否包含N¹-甲基腺苷修饰位点，包括：

分类符号的值token随机初始化，并随着训练不断更新，将更新后的两路分类符号的值token相加以实现分类符号的值token上的信息汇聚；