CN110598845A

CN110598845A - 数据处理方法、装置、计算机设备和存储介质

Info

Publication number: CN110598845A
Application number: CN201910746149.7A
Authority: CN
Inventors: 黄严汉
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2019-08-13
Filing date: 2019-08-13
Publication date: 2019-12-20
Anticipated expiration: 2039-08-13
Also published as: CN110598845B

Abstract

本申请涉及机器学习领域，提供了一种数据处理方法、装置、计算机设备和存储介质。该方法包括：获取训练样本集合，各个训练样本都存在对应的训练样本标签；对各个训练样本进行向量化处理，得到对应的特征向量；将各个训练样本的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本的交叉特征；将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成对应的图像特征图；将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值；根据预测概率值和训练样本标签计算得到训练损失值；根据训练损失值对第三神经网络模型进行训练，最终得到已训练的第三神经网络模型。

Description

数据处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种数据处理方法、装置、计算机设备和存储介质。

背景技术

传统技术中，根据实际应用场景利用神经网络模型来对输入数据的行为进行预测，然而，传统的神经网络模型在进行数据处理时，直接将输入数据输入至神经网络模型，得到神经网络模型的输出结果，而不对输入数据进行任何处理，容易导致出现神经网络在进行数据处理时出现准确性低的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高数据处理准确率的数据处理方法、装置、计算机设备和存储介质。

一种数据处理方法，该方法包括：

获取训练样本集合，训练样本集合中各个训练样本都存在对应的训练样本标签；

对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，向量化处理用于将非结构化的训练样本转换为结构化的特征向量；

将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征；

将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图；

将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值；

根据预测概率值和对应的训练样本标签计算得到训练损失值；

根据训练损失值对第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，第三神经网络用于训练样本的网络行为预测。

在其中一个实施例中，对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，包括：对各个训练样本进行分词，得到分词后的词语；根据分词后的词语对应的词语属性，将分词后的词语分成对应的序列特征和非序列特征；对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对非序列特征和处理后的序列特征进行向量化处理，得到各个训练样本对应的特征向量。

在其中一个实施例中，将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到对应的交叉特征，包括：获取各个特征向量在预设维度上对应的目标子特征向量；获取各个特征向量在预设维度上对应的预设子特征向量；获取各个特征向量在预设维度上对应的预设卷积和权重；根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。

在其中一个实施例中，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图，包括：第二神经网络模型根据预设维度信息对交叉特征进行切分，得到多个子交叉特征；第二神经网络模型对各个子交叉特征进行特征组合，得到对应的目标交叉特征；第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵；第二神经网络模型对交叉特征矩阵进行矩阵内积计算，生成交叉特征对应的图像特征图。

在其中一个实施例中，训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种，训练样本标签为用户点击目标商品的真实点击概率。

一种数据处理装置，该装置包括：

训练样本获取模块，用于获取训练样本集合，训练样本集合中各个训练样本都存在对应的训练样本标签；

向量化处理模块，用于对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，向量化处理用于将非结构化的训练样本转换为结构化的特征向量；

第一神经网络处理模块，用于将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征；

第二神经网络处理模块，用于将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图；

第三神经网络处理模块，用于将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值；

损失值计算模块，用于根据预测概率值和对应的训练样本标签计算得到训练损失值；

第三神经网络训练模块，用于根据训练损失值对第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，第三神经网络用于训练样本的网络行为预测。

一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述数据处理方法、装置、计算机设备和存储介质，通过第一神经网络模型输出得到各个训练样本对应的交叉特征，输入至第二神经网络模型，通过第二神经网络模型对交叉特征进行内积计算得到对应的图像特征图，根据训练样本和图像特征图对第三神经网络模型进行训练。其中交叉特征是各个训练样本之间的共同特征或者相同特征组成的，因此将训练样本结合交叉特征一起对第三神经网络模型进行训练，提高第三神经网络模型进行网络行为预测的准确性。

附图说明

图1为一个实施例中数据处理方法的应用场景图；

图2为一个实施例中数据处理方法的流程示意图；

图3为一个实施例中训练样本向量化处理步骤的流程示意图；

图4为一个实施例中第一神经网络模型处理步骤的流程示意图；

图5为一个实施例中第二神经网络模型处理步骤的流程示意图；

图6为一个实施例中数据处理装置的结构框图；

图7为一个实施例中向量化处理模块的结构框图；

图8为一个实施例中第一神经网络处理模块的结构框图；

图9为一个实施例中第二神经网络处理模块的结构框图；

图10为一个实施例中计算机设备的内部结构图；

图11为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的数据处理方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

具体地，终端102将训练样本集合发送至服务器104，服务器104获取到训练样本集合，训练样本集合中各个训练样本都存在对应的训练样本标签；对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，向量化处理用于将非结构化的训练样本转换为结构化的特征向量；将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征；将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图；将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值；根据预测概率值和对应的训练样本标签计算得到训练损失值；根据训练损失值对第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型。进一步地，服务器104可将已训练的第三神经网络模型发送至终端102，供终端102对第三神经网络模型进行应用。

在一个实施例中，如图2所示，提供了一种数据处理方法，以该方法应用于图1中的终端或者服务器为例进行说明，包括以下步骤：

步骤202，获取训练样本集合，训练样本集合中各个训练样本都存在对应的训练样本标签。

其中，训练样本集合是用来训练第一神经网络模型的训练数据，可以根据业务需求或者应用场景采集相应的样本数据，训练样本集合中的各个训练样本都存在对应的训练样本标签，所谓训练样本标签是指训练样本对应的真实标签，可以通过人为对训练样本打上对应的训练样本标签，如，训练样本是用来进行分类的，则对应的真实标签可以是正样本或者负样本。

在一个实施例中，训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种，训练样本标签为用户点击目标商品的真实点击概率。

其中，用户行为信息是指与用户行为有关的信息，例如用户是否购买了某商品的购买行为，或者用户隔了多长时间购买了某商品的购买时间等等。所谓用户商品交互信息是指用户与商品进行交互产生的有关信息，例如用户购买了某商品几次、相隔多长时间进行购买等等。用户属性信息是指与用户基本信息有关的信息，例如用户收入、用户喜好程度等等，而商品属性信息是指与商品基本信息有关的信息，例如商品标价、商品成本价、商品利润等等。

而这里的训练样本标签是指用户对训练样本的真实点击概率，可通过统计各个训练样本对应的点击概率，将统计后的点击概率作为训练样本标签。

步骤204，对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，向量化处理用于将非结构化的训练样本转换为结构化的特征向量。

其中，由于训练样本很多是非结构化的数据，对于神经网络模型来说，非结构化的数据在进行数据处理时容易无法识别对应的特征，因此需要进行向量化处理，将非结构化的训练样本转换成结构化的特征向量，以便于神经网络模型进行数据处理。向量化处理是指将训练样本转换成对应的特征向量的处理过程。具体地，在获取到训练样本集合后，需要对训练样本集合进行加工处理，具体可以是对训练样本集合中的各个训练样本进行向量化处理，得到各个训练样本对应的特征向量。向量化处理具体可以是借助向量化处理应用对各个训练样本进行向量化处理，得到对应的特征向量。步骤206，将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征。

其中，这里的第一神经网络模型是指已训练好的神经网络模型，用于计算得到训练样本之间的交叉特征的。所谓交叉特征是指各个训练样本之间存在的共同或者相同的特征，将共同或者相同的特征作为交叉特征。具体地，将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征，输出交叉特征。

步骤208，将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图。

其中，这里的第二神经网络模型是已训练好的神经网络模型，用来生成图像特征图，图像特征图是对交叉特征进行内积计算得到的结果。为了能够反映交叉特征之间的向量交叉结果，因此需要将第一神经网络模型输出的交叉特征输入至第二神经网络模型，通过第二神经网络模型对交叉特征进行内积计算，得到与交叉特征对应的图像特征图。

步骤210，将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值。

其中，第三神经网络模型是用来预测训练样本网络行为对应的概率值的网络模型，网络行为可以是购买行为、喜爱程度等等。第三神经网络模型是未进行训练的，为了提高第三神经网络模型的预测概率值，将各个训练样本和图像特征图输入至第三神经网络模型中，通过第三神经网络模型根据训练样本和图像特征图进行特征提取、计算得到各个训练样本对应的预测概率值。

步骤212，根据预测概率值和对应的训练样本标签计算得到训练损失值。

具体地，在得到各个训练样本对应的预测概率值后，根据预测概率值和对应的训练样本标签计算得到训练损失值，其中训练损失值的计算方式可自定义，自定义可以是根据预测概率值和训练样本标签进行均值计算，将均值计算得到的结果作为训练损失值，或者是根据预测概率值和训练样本标签进行加权求和计算，将加权求和计算得到的结果作为训练损失值等等。

步骤214，根据训练损失值对第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，第三神经网络用于训练样本的网络行为预测。

具体地，在计算得到训练损失值后，根据训练损失值对第三神经网络模型进行训练，不断调整第三神经网络模型的模型参数，直至满足收敛条件，得到已训练好的第三神经网络模型。其中，收敛条件可自定义，自定义可以是当训练损失值不再发生变化时，可认为第三神经网络模型达到收敛，或者还可以是训练损失值达到最小时，则可认为第三神经网络模型达到收敛。

上述数据处理方法中，通过第一神经网络模型输出得到各个训练样本对应的交叉特征，输入至第二神经网络模型，通过第二神经网络模型对交叉特征进行内积计算得到对应的图像特征图，根据训练样本和图像特征图对第三神经网络模型进行训练。其中交叉特征是各个训练样本之间的共同特征或者相同特征组成的，因此将训练样本结合交叉特征一起对第三神经网络模型进行训练，提高第三神经网络模型进行网络行为预测的准确性。

在一个实施例中，如图3所示，对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，包括：

步骤302，对各个训练样本进行分词，得到分词后的词语。

其中，由于训练样本一般是以句子形式的评论或者文章，因此需要对训练样本进行分词，得到分词后的多个词语。具体的，在获取训练样本后，会对训练样本按照一定的规则进行分割，得到分词后的词语。其中，分割规则可根据词语在句子中的成分、词语的词性以及词语的搭配习惯进行分割。

步骤304，根据分词后的词语对应的词语属性，将分词后的词语分成对应的序列特征和非序列特征。

步骤306，对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对非序列特征和处理后的序列特征进行向量化处理，得到各个训练样本对应的特征向量。

其中，词语属性是指与词语相关的属性信息，可根据分词后的词语对应的词语属性将分词后的词语分成对应的序列特征和非序列特征，序列特征是与用户商品交互相关的特征，将用户商品交互相关的特征归为序列特征，如序列特征可以是用户对商品的点击、用户对商品的购买。而非序列特征是指与用户基本信息相关的特征，将与用户基本信息相关的特征归为非序列特征，如非序列特征可以是用户的年龄、用户的收入等等。

进一步地，当将分词后的词语分成对应的序列特征和非序列特征后，由于序列特征和非序列特征的处理方式不同，具体可以是，序列特征的处理方式是，对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，而非序列特征的处理方式则无需进行其他处理，直接将非序列特征和处理后的序列特征都进行向量化处理，得到各个训练样本对应的特征向量。

在一个实施例中，如图4所示，将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到对应的交叉特征，包括：

步骤402，获取各个特征向量在预设维度上对应的目标子特征向量。

步骤404，获取各个特征向量在预设维度上对应的预设子特征向量。

步骤406，获取各个特征向量在预设维度上对应的预设卷积和权重。

步骤408，根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。

其中，由于特征向量是多维的特征向量，而为了减少数据量的计算，因此无需对各维的子特征向量都进行计算，可直接只计算预设维度上的交叉特征。具体可以是，获取各个特征向量在预设维度上的目标子特征向量、预设子特征向量和预设卷积和权重，所谓目标子特征向量是指特征向量在预设维度上对应的子特征向量，其中预设维度可以是根据业务需求或者应用场景从特征向量的多个维度确定得到的。而预设子特征向量是指该预设维度预先设置的子特征向量，可作为目标子特征向量的参考子特征向量，可预先设置。而预设卷积和权重都是为该预设维度预先设置的卷积和权重，特征向量各个维度对应的预设卷积和权重都是不同的。

具体地，在获取到各个特征向量在预设维度上对应的目标子特征向量、预设子特征向量和预设卷积和权重，根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。其中，交叉特征的计算方式可自定义，自定义可以是根据目标子特征向量、预设子特征向量和预设卷积和权重进行加权求和计算，将加权求和计算得到的结果作为交叉特征，或者还可以是根据目标子特征向量、预设子特征向量和预设卷积和权重进行均值计算，将均值计算得到的结果作为交叉特征等等。

在一个实施例中，如图5所示，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图，包括：

步骤502，第二神经网络模型根据预设维度信息对交叉特征进行切分，得到多个子交叉特征。

其中，预设维度信息是指与预设维度相关的信息，第一神经网络模型将输出的交叉特征输入至第二神经网络模型后，第二神经网络模型获取预设维度信息，根据预设维度信息对交叉特征进行切分，得到预设维度上的各个子交叉特征。

步骤504，第二神经网络模型对各个子交叉特征进行特征组合，得到对应的目标交叉特征。

具体地，在得到预设维度上的各个子交叉特征后，第二神经网络模型对各个子交叉特征进行特征组合，得到目标交叉特征。其中，特征组合方式可自定义，自定义可以是对各个子交叉特征进行外积计算，将外积计算得到的结果作为目标交叉特征，或者自定义还可以是各个子交叉特征与预设交叉阶数进行计算，得到目标交叉特征。

步骤506，第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵。

步骤508，第二神经网络模型对交叉特征矩阵进行矩阵内积计算，生成交叉特征对应的图像特征图。

具体地，在得到各个训练样本对应的目标交叉特征后，根据各个目标交叉特征生成交叉特征矩阵，具体可以是将各个目标交叉特征按照预设阶数组成交叉特征矩阵。进一步地，在生成得到交叉特征矩阵后，第二神经网络模型对交叉特征矩阵进行矩阵内积计算，生成交叉特征对应的图像特征图。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种数据处理装置600，包括训练样本获取模块602、向量化处理模块604、第一神经网络处理模块606、第二神经网络处理模块608、第三神经网络处理模块610、损失值计算模块612和第三神经网络训练模块614，其中：

训练样本获取模块602，用于获取训练样本集合，训练样本集合中各个训练样本都存在对应的训练样本标签。

向量化处理模块604，用于对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，向量化处理用于将非结构化的训练样本转换为结构化的特征向量。

第一神经网络处理模块606，用于将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到各个训练样本对应的交叉特征。

第二神经网络处理模块608，用于将交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图。

第三神经网络处理模块610，用于将各个训练样本和图像特征图输入至第三神经网络模型，得到对应的预测概率值。

损失值计算模块612，用于根据预测概率值和对应的训练样本标签计算得到训练损失值。

第三神经网络训练模块614，用于根据训练损失值对第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，第三神经网络用于训练样本的网络行为预测。

在一个实施例中，如图7所示，向量化处理模块604包括：

训练样本分词单元604a，用于对各个训练样本进行分词，得到分词后的词语。

词语处理单元604b，用于根据分词后的词语对应的词语属性，将分词后的词语分成对应的序列特征和非序列特征。

特征向量生成单元604c，用于对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对非序列特征和处理后的序列特征进行向量化处理，得到各个训练样本对应的特征向量。

在一个实施例中，如图8所示，第一神经网络处理模块606包括：

目标子特征向量获取单元606a，用于获取各个特征向量在预设维度上对应的目标子特征向量。

预设子特征向量获取单元606b，用于获取各个特征向量在预设维度上对应的预设子特征向量。

权重获取单元606c，用于获取各个特征向量在预设维度上对应的预设卷积和权重。

交叉特征计算单元606d，用于根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。

在一个实施例中，如图9所示，第二神经网络处理模块608包括：

交叉特征切分单元608a，用于第二神经网络模型根据预设维度信息对交叉特征进行切分，得到多个子交叉特征。

子交叉特征组合单元608b，用于第二神经网络模型对各个子交叉特征进行特征组合，得到对应的目标交叉特征。

交叉特征矩阵生成单元608c，用于第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵。

交叉特征矩阵计算单元608d，用于第二神经网络模型对交叉特征矩阵进行矩阵内积计算，生成交叉特征对应的图像特征图。

关于数据处理装置的具体限定可以参见上文中对于数据处理方法的限定，在此不再赘述。上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储第一神经网络模型、第二神经网络模型和第三神经网络模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图10或图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

在一个实施例中，对各个训练样本进行向量化处理，得到各个训练样本对应的特征向量，包括：对各个训练样本进行分词，得到分词后的词语；根据分词后的词语对应的词语属性，将分词后的词语分成对应的序列特征和非序列特征；对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对非序列特征和处理后的序列特征进行向量化处理，得到各个训练样本对应的特征向量。

在一个实施例中，将各个训练样本对应的特征向量输入至第一神经网络模型，第一神经网络模型计算得到对应的交叉特征，包括：获取各个特征向量在预设维度上对应的目标子特征向量；获取各个特征向量在预设维度上对应的预设子特征向量；获取各个特征向量在预设维度上对应的预设卷积和权重；根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。

在一个实施例中，通过第二神经网络模型对交叉特征进行内积计算，生成交叉特征对应的图像特征图，包括：第二神经网络模型根据预设维度信息对交叉特征进行切分，得到多个子交叉特征；第二神经网络模型对各个子交叉特征进行特征组合，得到对应的目标交叉特征；第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵；第二神经网络模型对交叉特征矩阵进行矩阵内积计算，生成交叉特征对应的图像特征图。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种数据处理方法，所述方法包括：

获取训练样本集合，所述训练样本集合中各个训练样本都存在对应的训练样本标签；

对各个所述训练样本进行向量化处理，得到各个所述训练样本对应的特征向量，所述向量化处理用于将非结构化的所述训练样本转换为结构化的特征向量；

将所述各个所述训练样本对应的特征向量输入至第一神经网络模型，所述第一神经网络模型计算得到各个所述训练样本对应的交叉特征；

将所述交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对所述交叉特征进行内积计算，生成所述交叉特征对应的图像特征图；

将所述各个训练样本和所述图像特征图输入至第三神经网络模型，得到对应的预测概率值；

根据所述预测概率值和对应的训练样本标签计算得到训练损失值；

根据所述训练损失值对所述第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，所述第三神经网络用于训练样本的网络行为预测。

2.根据权利要求1所述的方法，其特征在于，所述对各个所述训练样本进行向量化处理，得到各个所述训练样本对应的特征向量，包括：

对各个所述训练样本进行分词，得到分词后的词语；

根据所述分词后的词语对应的词语属性，将所述分词后的词语分成对应的序列特征和非序列特征；

对所述序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对所述非序列特征和所述处理后的序列特征进行向量化处理，得到各个所述训练样本对应的特征向量。

3.根据权利要求1所述的方法，其特征在于，所述将所述各个所述训练样本对应的特征向量输入至第一神经网络模型，所述第一神经网络模型计算得到对应的交叉特征，包括：

获取各个所述特征向量在预设维度上对应的目标子特征向量；

获取各个所述特征向量在所述预设维度上对应的预设子特征向量；

获取各个所述特征向量在所述预设维度上对应的预设卷积和权重；

根据所述目标子特征向量、所述预设子特征向量和所述预设卷积和权重计算得到对应的交叉特征。

4.根据权利要求1所述的方法，其特征在于，所述通过第二神经网络模型对所述交叉特征进行内积计算，生成所述交叉特征对应的图像特征图，包括：

所述第二神经网络模型根据预设维度信息对交叉特征进行切分，得到多个子交叉特征；

所述第二神经网络模型对各个子交叉特征进行特征组合，得到对应的目标交叉特征；

所述第二神经网络模型根据各个所述目标交叉特征生成交叉特征矩阵；

所述第二神经网络模型对所述交叉特征矩阵进行矩阵内积计算，生成所述交叉特征对应的图像特征图。

5.根据权利要求1所述的方法，其特征在于，所述训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种，所述训练样本标签为用户点击目标商品的真实点击概率。

6.一种数据处理装置，其特征在于，所述装置包括：

训练样本获取模块，用于获取训练样本集合，所述训练样本集合中各个训练样本都存在对应的训练样本标签；

向量化处理模块，用于对各个所述训练样本进行向量化处理，得到各个所述训练样本对应的特征向量，所述向量化处理用于将非结构化的所述训练样本转换为结构化的特征向量；

第一神经网络处理模块，用于将所述各个所述训练样本对应的特征向量输入至第一神经网络模型，所述第一神经网络模型计算得到各个所述训练样本对应的交叉特征；

第二神经网络处理模块，用于将所述交叉特征作为第二神经网络模型的输入，通过第二神经网络模型对所述交叉特征进行内积计算，生成所述交叉特征对应的图像特征图；

第三神经网络处理模块，用于将所述各个训练样本和所述图像特征图输入至第三神经网络模型，得到对应的预测概率值；

损失值计算模块，用于根据所述预测概率值和对应的训练样本标签计算得到训练损失值；

第三神经网络训练模块，用于根据所述训练损失值对所述第三神经网络模型的模型参数进行调整，直至满足收敛条件，得到已训练的第三神经网络模型，所述第三神经网络用于训练样本的网络行为预测。

7.根据权利要求6所述的装置，其特征在于，所述向量化处理模块包括：

训练样本分词单元，用于对各个所述训练样本进行分词，得到分词后的词语；

词语处理单元，用于根据所述分词后的词语对应的词语属性，将所述分词后的词语分成对应的序列特征和非序列特征；

特征向量生成单元，用于对所述序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征，对所述非序列特征和所述处理后的序列特征进行向量化处理，得到各个所述训练样本对应的特征向量。

8.根据权利要求6所述的装置，其特征在于，所述第一神经网络处理模块包括：

目标子特征向量获取单元，用于获取各个所述特征向量在预设维度上对应的目标子特征向量；

预设子特征向量获取单元，用于获取各个所述特征向量在所述预设维度上对应的预设子特征向量；

权重获取单元，用于获取各个所述特征向量在所述预设维度上对应的预设卷积和权重；

交叉特征计算单元，用于根据所述目标子特征向量、所述预设子特征向量和所述预设卷积和权重计算得到对应的交叉特征。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。