CN113157941A

CN113157941A - 业务特征数据处理、文本生成方法、装置及电子设备

Info

Publication number: CN113157941A
Application number: CN202110377799.6A
Authority: CN
Inventors: 李怀松; 黄涛; 刘智欣; 张映; 武玥
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-04-08
Filing date: 2021-04-08
Publication date: 2021-07-23
Anticipated expiration: 2041-04-08
Also published as: CN113157941B

Abstract

本说明书实施例公开了一种业务特征数据处理、文本生成方法、装置及电子设备，具体方案包括：接收目标用户的业务特征数据，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径，对所述业务特征数据和目标推导路径进行编码以得到向量序列，利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

Description

业务特征数据处理、文本生成方法、装置及电子设备

技术领域

本说明书实施例涉及计算机技术领域，尤其涉及一种业务特征数据处理、文本生成方法、装置及电子设备。

背景技术

在一些业务场景下，用户同时作为业务参与者和受监管方。在业务提供方提供业务服务的过程中，可能要对用户进行评估，以提升业务安全性。

因此，如何采用技术手段生成更准确的用户描述文本，为业界普遍考虑的一个课题。

发明内容

有鉴于此，本说明书实施例提供了一种生成更准确的样本用户描述文本的业务特征数据处理、文本生成方法、装置及电子设备。

本说明书实施例采用下述技术方案：

本说明书实施例提供一种业务特征数据处理方法，包括：

获取样本用户的业务特征数据；

利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

对所述业务特征数据和目标推导路径进行编码以得到向量序列；

利用所述向量序列训练文本生成模型，以便利用所述文本生成模型对目标用户进行文本描述。

本说明书实施例还提供一种文本生成方法，包括：

接收目标用户的业务特征数据；

利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

本说明书实施例还提供一种文本生成方法，应用于区块链节点，包括：

接收用户描述请求，所述用户描述请求包含目标用户的业务特征数据；

根据所述用户描述请求从区块链中获取利用专家规则构建的推导路径；

利用所述业务特征数据运行所述推导路径以得到所述业务特征数据命中的目标推导路径；

本说明书实施例还提供一种业务特征数据处理装置，包括：

获取模块，获取样本用户的业务特征数据；

运行模块，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

编码模块，对所述业务特征数据和目标推导路径进行编码以得到向量序列；

训练模块，利用所述向量序列训练文本生成模型，以便利用所述文本生成模型对目标用户进行文本描述。

本说明书实施例还提供一种文本生成装置，包括：

接收模块，接收目标用户的业务特征数据；

第一运行模块，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

第二运行模块，利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

本说明书实施例还提供一种文本生成装置，应用于区块链节点，包括：

接收模块，接收用户描述请求，所述用户描述请求包含目标用户的业务特征数据；

获取模块，根据所述用户描述请求从区块链中获取利用专家规则构建的推导路径；

第一运行模块，利用所述业务特征数据运行所述推导路径以得到所述业务特征数据命中的目标推导路径；

本说明书实施例还提供一种电子设备，包括：

处理器；以及

被配置成存储计算机程序的存储器，所述计算机程序在被执行时使所述处理器执行以下操作：

获取样本用户的业务特征数据；

本说明书实施例还提供一种电子设备，包括：

处理器；以及

接收目标用户的业务特征数据；

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：

利用本说明书实施例提出的方案，专家规则是专家经验的总结，命中的目标推导路径能够根据业务特征数据预测用户行为属性，而且路径本身能够对预测结果提供一定的解释信息。因此通过将业务特征数据和目标推导路径进行融合得到的向量序列输入到文本生成模型中，不仅使模型更充分利用专家规则，还能根据目标推导路径增强模型对用户描述的可解释性。

附图说明

此处所说明的附图用来提供对本说明书实施例的进一步理解，构成本说明书实施例的一部分，本说明书的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书实施例提供的一种业务特征数据处理方法的流程图；

图2为本说明书实施例提出的一种文本生成方法的流程图；

图3为本说明书实施例提出的文本生成模型的一种算法框架图；

图4为本说明书实施例提供的一种业务特征数据处理装置的结构图；

图5为本说明书实施例提供的一种文本生成装置的结构图；

图6为本说明书实施例提供的一种基于区块链技术的文本生成方法的流程图；

图7为本说明书实施例提供的一种基于区块链技术的文本生成装置的结构图；

图8示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书实施例提供的一种业务特征数据处理方法的流程图，本方法实现对文本生成模型的训练。本方法具体方案阐述如下。

步骤101：获取样本用户的业务特征数据。

步骤103：利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径。

步骤105：对所述业务特征数据和目标推导路径进行编码以得到向量序列。

步骤107：利用所述向量序列训练文本生成模型，以便利用所述文本生成模型对目标用户进行文本描述。

在本说明书实施例中，业务特征数据是样本用户在参与业务过程中产生的与业务相关的数据信息，业务特征数据反映了用户在业务参与过程中的行为信息，并进一步反映了用户行为属性，例如是否属于对业务提供方带来风险的行为异常用户。本实施例中的业务特征数据是在指定业务场景中采集的，对业务场景不做具体限定，可以是转账业务场景、交易业务场景或其他业务场景。

举例来说，在涉及金额往来场景下，返款金额、返款次数、交易对手数等，均属于业务特征数据。当然不限于此。

其中，业务特征数据可以为至少一种业务特征的特征值，该特征值为纯数值类型，而可以没有文本型数据。因此，本说明书实施例的方案能够实现利用这些纯数值推导出相关结论。

在这种情况下，业务特征的特征值可以以表格的形式展示，这样可以按照所述至少一种业务特征在表格中的存储位置，从表格中依次提取对应的所述特征值，进而实现了获取样本用户的业务特征数据的目的。

在本说明书另外实施例中，业务特征数据中可以包含文本型数据，此时可以对文本型数据进行语义相关编码以得到各词所对应的语义编码向量，该予以编码向量作为向量序列的一部分。

在本说明书实施例中，专家规则可以是人工知识的总结，在根据业务特征数据对用户行为属性进行预估方面，准确性更高。具体地，专家规则是利用预设条件构建的，用于对业务特征数据进行数值比较等逻辑判断，因此可以表征为推导路径中的节点。对应不同类型业务特征数据所对应专家规则可以不同，则每一项业务特征数据可以对应至少一个专家规则。还可以是，某项业务特征数据缺少对应的专家规则。

例如，比较交易金额与预设金额阈值的大小关系、判断交易金额与样本用户通常使用银行账号进行交易的交易金额之间的大小关系、判断交易时间与样本用户通常使用银行账号进行交易的时间是否一致，在此不做限定。

在本说明书实施例中，每个推导路径可以包含一项或至少两项专家规则。当推导路径包含至少两项专家规则时，相邻专家规则之间可以是递进关系，前一个专家规则的结论为后一个专家规则的输入。还可以是，至少两项专家规则之间是并列关系，共同指向同一个结论，从而在同时命中时能够推导出结论。此时，在一个推导路径中可以包含递进关系和并列关系中的至少一种关系的专家规则。

例如，样本用户命中逻辑图谱中的目标推导路径包含两个并列的专家规则“返款交易笔数大于a”及“返款交易对手数大于b”，则命中的目标推导路径包含这两项专家规则。

对于样本用户，可以命中一条或至少两条目标推导路径。

在利用专家规则构建推导路径时，包括：将该专家规则的输入、专家规则及专家规则的输出构建完整的推导路径。

在本说明书实施例中，推导路径可以以逻辑图谱的形式进行沉淀存储，不仅有利于专家规则的管理，也有利于后续文本生成模型的利用。

在这种情况下，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径，可以包括：

获取包含至少一个推导路径的逻辑图谱；

利用所述业务特征数据运行所述逻辑图谱，以得到所述业务特征数据命中的所述逻辑图谱中的至少一个所述目标推导路径。

在本说明书实施例中，逻辑图谱可以事先存储在数据库中，有利于专家规则的管理，则获取包含至少一个推导路径的逻辑图谱，可以包括：

在获取到所述业务特征数据时，触发从数据库提取所述逻辑图谱。

在本说明书实施例中，向量序列作为训练文本生成模型的输入序列，是由业务特征数据和目标推导路径编码得到的，使得向量序列包含业务特征数据和目标推导路径分别对应的向量。

其中，业务特征数据为特征值，而推导路径属于逻辑信息，因此在进行编码时，两者可分别使用不同标记进行区分，并对该标记进行编码。

具体地，将所述业务特征数据和目标推导路径配置不同的类型标识；

在对所述业务特征数据和面板推导路径进行编码时，还对所述类型标识进行编码以得到所述向量序列。

通过类型标识，文本生成模型能够识别业务特征数据或目标推导路径等语义元素对应的编码向量，从而更有针对性地针对不同类型语义元素进行学习。

由于推导路径由专家规则构建得到，因此对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

对所述目标推导路径包含的所述专家规则配置节点标识，对所述专家规则在所述目标推导路径中的位置配置位置标识；

对所述节点标识和位置标识进行编码。

通过节点标识和位置标识，文本生成模型能够识别目标推导路径的路径顺序，从而更准确学习目标推导路径所体现的逻辑信息。

在一种实施例中，当目标推导路径包含至少两个专家规则时，对所述业务特征数据和目标推导路径进行编码以得到向量序列，还包括：

在所述至少两个所述专家规则之间配置起止标识；

还对所述起止标识进行编码。

其中起止标识表征前面的专家规则推导结束，后面的专家规则推导开始。这样，文本生成模型能够识别一条目标推导路径中的各专家规则的起止，从而识别各专家规则之间的逻辑关系，从而准确学习到该目标推导路径所反映的逻辑信息。

在本说明书实施例中，文本生成模型可以是基于注意力模型Attention Model构建的，因此实际是利用向量序列训练基于注意力模型构建的文本生成模型。

基于注意力模型构建的文本生成模型是要从向量序列中学习到每一个向量元素的重要程度，然后按重要程度将元素合并。这样，在对用户进行文本描述时，采用注意力模型的方式能够回溯用户行为属性和哪条推导路径相关，使得本方案具有更好的可解释性。同样地，采用注意力模型能够减少样本数量的影响，在小样本场景下也能获得很好的表现。

具体地，文本生成模型还包括第一层解码器和第二层解码器，则利用向量序列训练基于注意力模型构建的文本生成模型，包括：

利用向量序列的平均值、所述第二层解码器在第一时刻输出的文本信息和第二隐藏状态向量运行所述第一层解码器以得到第一隐藏状态向量；

利用所述第一隐藏状态向量和所述向量序列包含的对应第二时刻的向量元素运行注意力模型以得到所述注意力模型分配的权重系数，所述第二时刻为与所述第一时刻相邻的时序在后的时刻；

利用所述第一隐藏状态向量和所述权重系数运行第二层解码器以得到所述第二层解码器在所述第二时刻输出的文本信息和第二隐藏状态向量。

其中，第一隐藏状态向量和第二隐藏状态向量都是不断更新的。第一时刻可以指当前时刻的上一时刻，而第二时刻是指当前时刻，第一时刻输出的文本信息可以是指基于上一时刻的向量元素输出的文本信息，而第二时刻的向量元素则是当前时刻输入的向量元素。

向量序列中的编码向量分别对应目标特征数据和目标推导路径等语义元素，注意力模型用于从输入的向量序列中各个编码向量中提取出对当前时刻输出的文本信息更具有影响的编码向量。分配的权重系数用于表示向量序列中各语义编码向量所对应的业务特征数据或目标推导路径等语义元素对当前时刻待输出的文本信息的影响力。编码向量的权重系数越大，则其对当前时刻待输出的文本信息的影响就越大，该编码向量所对应的语义元素对当前时刻待输出的文本信息而言更为关键。相反地，该编码向量对应的权重系数越小，则会减弱该编码向量对应的语义元素对当前时刻待输出的文本信息的影响，说明该语义元素不那么关键。

第二层解码器进行文本的生成。第一层解码器和第二层解码器可以是LSTM模型，LSTM全称为长短期记忆网络(Long Short Term Memory networks)，是一种特殊的循环神经网络(Recurrent Neural Network，RNN)，能够学习到长期依赖关系。

在另外实施例中，文本生成模型还可以采用GRU或Transformer等解码器。其中，门控循环单元GRU(Gate Recurrent Unit)也是一种循环神经网络RNN，是LSTM网络的一种效果很好的变体。Transformer中抛弃了传统的CNN和RNN，整个网络结构完全是由Attention机制组成。更准确地讲，Transformer可以由自我注意机制self-Attention和前馈神经网络(Feed Forward Neural Network，FFNN)组成，一个基于Transformer的可训练的神经网络可以通过堆叠Transformer的形式进行搭建。

利用本说明书实施例生成文本生成模型，可用于对目标用户进行文本描述。

图2为本说明书实施例提出的一种文本生成方法的流程图。本方法具体阐述利用目标用户的业务特征数据对目标用户进行文本描述，具体方案如下。

步骤202：接收目标用户的业务特征数据；

步骤204：利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

步骤206：对所述业务特征数据和目标推导路径进行编码以得到向量序列；

步骤208：利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

在本说明书实施例中，业务特征数据为至少一种业务特征的特征值，所述特征值为纯数值类型。对业务特征数据的内容可参考上文，在此不再详述。

可选地，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径，包括：

获取包含至少一个推导路径的逻辑图谱；

可选地，获取包含至少一个推导路径的逻辑图谱，包括：

其中，对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

对所述节点标识和位置标识进行编码。

当所述目标推导路径包含至少两个专家规则时，对所述业务特征数据和目标推导路径进行编码以得到向量序列，还包括：

在所述至少两个所述专家规则之间配置起止标识；

还对所述起止标识进行编码。

另外，对业务特征数据和目标推导路径进行编码以得到向量序列，包括：

将所述业务特征数据和目标推导路径配置不同的类型标识；

在对所述业务特征数据和目标推导路径进行编码时，还对所述类型标识进行编码以得到所述向量序列。

在本说明书实施例中，利用所述向量序列训练文本生成模型，包括：

利用所述向量序列训练基于注意力模型构建的文本生成模型。

可选地，所述文本生成模型还包括第一层解码器和第二层解码器，则利用所述向量序列训练基于注意力模型构建的文本生成模型，包括：

利用所述向量序列的平均值、所述第二层解码器在第一时刻输出的文本信息和第二隐藏状态向量运行所述第一层解码器以得到第一隐藏状态向量；

利用所述第一隐藏状态向量和所述权重系数运行所述第二层解码器以得到所述第二层解码器在所述第二时刻输出的文本信息和第二隐藏状态向量。

图3为本说明书实施例提出的文本生成模型的一种算法框架图，本框架图是基于Encoder-Decoder框架，其中编码器Encoder包含：表格数据Table Data和逻辑图谱LogicGraph两部分输入，解码器Decoder采用的是双层LSTM，下面详细介绍各个部分。

其中，Table Data表征原始的目标特征数据的输入，以表格的形式展示。每列表示业务特征，如3天内的交易金额、交易笔数等。每一行是一个样本用户的业务特征对应的值，比如交易金额100万，交易笔数350笔等。原始的目标特征数据的特点可以是纯数值型，而没有文本型的数据，需要模型能从这些数值中推导出相关结论。

其中，业务特征对应的特征值v₁，v₂……，v_n作为标识token按照表格中业务特征的顺序放在的对应位置上，而position则是0到1表示的是表格中的列col0到coln，segment 0表示输入的是表格中的目标特征数据。

对于Logic Graph。在实际应用中，很多专家规则沉淀下来，如同时满足“返款交易笔数大于a，返款交易对手数大于b”时，有“客户的返款交易较多”这样的结论，而这个结论很有可能出现在生成的目标文本中，因此如何在文本生成模型中利用此知识，对提升模型的推导能力和生成的丰富性有很大帮助，本方案将这些专家规则以图谱的方式展示，便于管理和利用。

对于每一个样本用户，即一个样本用户满足一些专家规则时，会在逻辑图谱中命中对应的一条路径，如客户满足“返款交易笔数大于a，返款交易对手数大于b”时，在逻辑图谱中表示为：n1->n3->n9 and n2->n4->n9的目标推导路径，这些路径作为token按照一定顺序放置，position的1，2，3表示路径的从头到尾，0表示前面的路径结束，后面的路径开始，segment 1表示输入的是逻辑图谱中的推导路径。

将上述表格数据和目标推导路径对应的token、position、segment初始化编码后进行连接，输入到transformer中进行编码，这样能充分融合原始的表格数据和专家规则，形成z₁，...z_n为后面的解码提供丰富的信息。

本说明书实施例采用两层LSTM+动态attention的方式进行解码，来更好地利用专家规则和对表格数据及推导路径进行动态选择。

第一层LSTM输入包含3个部分：transformer出来的各个位置的向量[z₁,...z_n]的平均值

上一时刻的输出y_t-1，第二层LSTM的输出h_t-1 ²，输出h_t ¹可以作为attend模型和下一层LSTM的输入；

Attend模型接收h_t ¹对[z₁,...,z_n]进行attention，具体公式如下：

β_t＝softmax(b_t)

其中

W_zb，W_hb是文本生成模型学习的参数，z_i是transformer出来的编码向量，

是第一层LSMT的输出的隐藏状态向量，β_t计算的是attention的值，

是各个transformer的编码向量加上attention后的最后的向量值。

第二层LSTM进行目标文本的生成，输入是attend模型的输出，并联合h_t ¹，产生的h_t-1 ²和y_t可以作为下一个时刻第一层LSTM的输入。

图4为本说明书实施例提供的一种业务特征数据处理装置的结构图，本装置可以包括：

获取模块401，获取样本用户的业务特征数据；

运行模块402，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

编码模块403，对所述业务特征数据和目标推导路径进行编码以得到向量序列；

训练模块404，利用所述向量序列训练文本生成模型，以便利用所述文本生成模型对目标用户进行文本描述。

图5为本说明书实施例提供的一种文本生成装置的结构图，本装置包括：

接收模块501，接收目标用户的业务特征数据；

第一运行模块502，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径；

编码模块503，对所述业务特征数据和目标推导路径进行编码以得到向量序列；

第二运行模块504，利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

图6为本说明书实施例提供的一种基于区块链技术的文本生成方法的流程图，本方法的执行主体为任一区块链节点，本方法具体阐述如下。

步骤602：接收用户描述请求，所述用户描述请求包含目标用户的业务特征数据；

步骤604：根据所述用户描述请求从区块链中获取利用专家规则构建的推导路径；

步骤606：利用所述业务特征数据运行所述推导路径以得到所述业务特征数据命中的目标推导路径；

步骤608：对所述业务特征数据和目标推导路径进行编码以得到向量序列；

步骤610：利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

区块链技术，也被称之为分布式账本技术，是一种由若干台计算设备共同参与“记账”，共同维护一份完整的分布式数据库的新兴技术。区块链技术具有去中心化、公开透明、每台计算设备可以参与数据库记录、并且各计算设备之间可以快速的进行数据同步的特性。

从技术层面，区块链是一种按照时间顺序来将数据区块顺序相连组合而成的链式数据结构，并且以密码学方式保证数据区块不可篡改和不可伪造。

采用本说明书实施例的方案，各区块链节点之间可以共享基于专家规则的推导路径，提升用户行为属性描述效率和准确性。

图7为本说明书实施例提供的一种文本生成装置的结构图，本装置包括：

接收模块701，接收用户描述请求，所述用户描述请求包含目标用户的业务特征数据；

获取模块702，根据所述用户描述请求从区块链中获取利用专家规则构建的推导路径；

第一运行模块703，利用所述业务特征数据运行所述推导路径以得到所述业务特征数据命中的目标推导路径；

编码模块704，对所述业务特征数据和目标推导路径进行编码以得到向量序列；

第二运行模块705，利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。

基于同一个发明构思，本说明书实施例还提供了一种电子设备，包括：

处理器；以及

被配置成存储计算机程序的存储器，所述计算机程序在被执行时使所述处理器执行图1或图2或图6所示实施例的方法。

基于同一发明构思，本说明书实施例中还提供了一种计算机可读存储介质，包括与电子设备结合使用计算机程序，所述计算机程序可被处理器执行以完成图1或图2或图6所示实施例的方法。

图8示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(RandomAccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种业务特征数据处理方法，包括：

获取样本用户的业务特征数据；

2.如权利要求1所述的方法，所述业务特征数据为至少一种业务特征的特征值，所述特征值为纯数值类型。

3.如权利要求2所述的方法，获取样本用户的业务特征数据，包括：

按照所述至少一种业务特征在表格中的存储位置，从所述表格中依次提取对应的所述特征值。

4.如权利要求1所述的方法，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径，包括：

获取包含至少一个所述推导路径的逻辑图谱；

5.如权利要求4所述的方法，获取包含至少一个推导路径的逻辑图谱，包括：

6.如权利要求1所述的方法，对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

对所述节点标识和位置标识进行编码。

7.如权利要求6所述的方法，当所述目标推导路径包含至少两个专家规则时，对所述业务特征数据和目标推导路径进行编码以得到向量序列，还包括：

在所述至少两个所述专家规则之间配置起止标识；

还对所述起止标识进行编码。

8.如权利要求1所述的方法，对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

将所述业务特征数据和目标推导路径配置不同的类型标识；

9.如权利要求1所述的方法，利用所述向量序列训练文本生成模型，包括：

10.如权利要求9所述的方法，所述文本生成模型还包括第一层解码器和第二层解码器，则利用所述向量序列训练基于注意力模型构建的文本生成模型，包括：

11.一种文本生成方法，包括：

接收目标用户的业务特征数据；

12.如权利要求11所述的方法，所述业务特征数据为至少一种业务特征的特征值，所述特征值为纯数值类型。

13.如权利要求11所述的方法，利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径，包括：

获取包含至少一个推导路径的逻辑图谱；

14.如权利要求13所述的方法，获取包含至少一个推导路径的逻辑图谱，包括：

在接收到所述业务特征数据时，触发从数据库提取所述逻辑图谱。

15.如权利要求11所述的方法，对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

对所述节点标识和位置标识进行编码。

16.如权利要求15所述的方法，当所述目标推导路径包含至少两个专家规则时，对所述业务特征数据和目标推导路径进行编码以得到向量序列，还包括：

在所述至少两个所述专家规则之间配置起止标识；

还对所述起止标识进行编码。

17.如权利要求11所述的方法，对所述业务特征数据和目标推导路径进行编码以得到向量序列，包括：

将所述业务特征数据和目标推导路径配置不同的类型标识；

18.如权利要求11所述的方法，利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本，包括：

利用所述向量序列运行基于注意力模型构建的文本生成模型以生成对所述目标用户进行文本描述的目标文本。

19.如权利要求18所述的方法，所述文本生成模型还包括第一层解码器和第二层解码器，则利用所述向量序列运行基于注意力模型构建的文本生成模型以生成对所述目标用户进行文本描述的目标文本，包括：

利用所述第一隐藏状态向量和所述权重系数运行所述第二层解码器以得到所述第二层解码器在所述第二时刻输出的文本信息和第二隐藏状态向量；

根据所述第二时刻输出的文本信息生成对所述目标用户进行文本描述的目标文本。

20.一种文本生成方法，应用于区块链节点，包括：

21.一种业务特征数据处理装置，包括：

获取模块，获取样本用户的业务特征数据；

22.一种文本生成装置，包括：

接收模块，接收目标用户的业务特征数据；

23.一种文本生成装置，应用于区块链节点，包括：

24.一种电子设备，包括：

处理器；以及

获取样本用户的业务特征数据；

25.一种电子设备，包括：

处理器；以及

接收目标用户的业务特征数据；