CN113553433B

CN113553433B - 基于人工智能的产品分类方法、装置、介质及终端设备

Info

Publication number: CN113553433B
Application number: CN202111094159.0A
Authority: CN
Inventors: 于佳玉
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-09-17
Filing date: 2021-09-17
Publication date: 2022-01-07
Anticipated expiration: 2041-09-17
Also published as: CN113553433A

Abstract

本发明属于人工智能技术领域，尤其涉及一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备。所述方法包括：获取待分类产品的第一产品标签和第一产品描述文本；在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量；在所述产品分类模型的Bi‑GRU网络层中对所述第一产品描述文本进行处理，得到所述第一产品描述文本的特征向量；在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权，得到所述第一产品标签加权后的特征向量；在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理，得到所述待分类产品的分类结果。

Description

基于人工智能的产品分类方法、装置、介质及终端设备

技术领域

本发明属于人工智能技术领域，尤其涉及一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备。

背景技术

目前对产品进行分类的方法多使用结构化数据，或用CNN、RNN对文本信息进行直接建模，一些复杂的结构信息未被有效利用，导致产品分类结果准确率较低。

发明内容

有鉴于此，本发明实施例提供了一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备，以解决现有的产品分类方法的准确率较低的问题。

本发明实施例的第一方面提供了一种基于人工智能的产品分类方法，可以包括：

获取待分类产品的第一产品标签和第一产品描述文本；

在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量；

在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理，得到所述第一产品描述文本的特征向量；

在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权，得到所述第一产品标签加权后的特征向量；

在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理，得到所述待分类产品的分类结果。

在第一方面的一种具体实现方式中，所述产品分类模型的训练过程可以包括：

构建已分类产品的第二产品标签与产品类目之间的图结构；

在初始的产品分类模型的图卷积层中对所述图结构进行处理，得到所述第二产品标签的特征向量；

获取所述已分类产品的第二产品描述文本，并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理，得到所述第二产品描述文本的特征向量；

在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权，得到所述第二产品标签加权后的特征向量；

在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理，得到所述已分类产品的实际输出分类结果；

根据所述已分类产品的实际输出分类结果和预期输出分类结果，使用预设的损失函数对所述产品分类模型进行训练，得到已训练的产品分类模型。

在第一方面的一种具体实现方式中，所述在初始的产品分类模型的图卷积层中对所述图结构进行处理，得到所述第二产品标签的特征向量，可以包括：

分别确定所述第二产品标签与所述产品类目的初始特征向量；

根据所述图结构，对所述产品类目的初始特征向量进行更新，得到所述产品类目的更新特征向量；

根据所述图结构和所述产品类目的更新特征向量，对所述第二产品标签的初始特征向量进行更新，得到所述第二产品标签的更新特征向量。

在第一方面的一种具体实现方式中，所述根据所述图结构，对所述产品类目的初始特征向量进行更新，得到所述产品类目的更新特征向量，可以包括：

根据下式对所述产品类目的初始特征向量进行更新：

其中，

为在所述图结构中与所述产品类目连接的所有上级类目的集合，

为在所述图结构中与所述产品类目连接的所有下级类目的集合，W⁽¹⁾，W⁽²⁾，W⁽³⁾，b⁽¹⁾均为待训练的模型参数，RELU为预设的激活函数，c _i为所述产品类目的初始特征向量，

为所述产品类目的更新特征向量。

在第一方面的一种具体实现方式中，所述根据所述图结构和所述产品类目的更新特征向量，对所述第二产品标签的初始特征向量进行更新，得到所述第二产品标签的更新特征向量，可以包括：

根据下式对所述第二产品标签的初始特征向量进行更新：

其中，

为在所述图结构中与所述第二产品标签连接的所有产品类目的集合，W⁽⁴⁾，W⁽⁵⁾，b⁽²⁾均为待训练的模型参数，RELU为预设的激活函数，

为在所述图结构中所述产品类目与所述第二产品标签之间的边的权重，t _j为所述第二产品标签的初始特征向量，

为所述产品类目的更新特征向量，

为所述第二产品标签的更新特征向量。

在第一方面的一种具体实现方式中，所述在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理，得到所述第二产品描述文本的特征向量，可以包括：

分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出，以及经过反向GRU处理得到的反向GRU输出；

对所述正向GRU输出和所述反向GRU输出进行合并，得到双向合并输出；

对所述双向合并输出在时序上进行均值池化处理，得到所述第二产品描述文本的特征向量。

在第一方面的一种具体实现方式中，所述在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权，得到所述第二产品标签加权后的特征向量，可以包括：

根据下式计算所述第二产品标签加权后的特征向量：

其中，

为所述第二产品标签的特征向量，h为所述第二产品描述文本的特征向量，W⁽⁶⁾、b⁽³⁾和v均为待训练的模型参数，h^f为所述第二产品标签加权后的特征向量。

本发明实施例的第二方面提供了一种基于人工智能的产品分类装置，可以包括：

产品信息获取模块，用于获取待分类产品的第一产品标签和第一产品描述文本；

第一图卷积处理模块，用于在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量；

第一Bi-GRU处理模块，用于在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理，得到所述第一产品描述文本的特征向量；

第一注意力机制处理模块，用于在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权，得到所述第一产品标签加权后的特征向量；

第一全连接处理模块，用于在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理，得到所述待分类产品的分类结果。

在第二方面的一种具体实现方式中，所述产品分类装置还可以包括：

图结构构建模块，用于构建已分类产品的第二产品标签与产品类目之间的图结构；

第二图卷积处理模块，用于在初始的产品分类模型的图卷积层中对所述图结构进行处理，得到所述第二产品标签的特征向量；

第二Bi-GRU处理模块，用于获取所述已分类产品的第二产品描述文本，并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理，得到所述第二产品描述文本的特征向量；

第二注意力机制处理模块，用于在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权，得到所述第二产品标签加权后的特征向量；

第二全连接处理模块，用于在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理，得到所述已分类产品的实际输出分类结果；

模型训练模块，用于根据所述已分类产品的实际输出分类结果和预期输出分类结果，使用预设的损失函数对所述产品分类模型进行训练，得到已训练的产品分类模型。

在第二方面的一种具体实现方式中，所述第二图卷积处理模块可以包括：

初始特征向量确定单元，用于分别确定所述第二产品标签与所述产品类目的初始特征向量；

第一更新单元，用于根据所述图结构，对所述产品类目的初始特征向量进行更新，得到所述产品类目的更新特征向量；

第二更新单元，用于根据所述图结构和所述产品类目的更新特征向量，对所述第二产品标签的初始特征向量进行更新，得到所述第二产品标签的更新特征向量。

在第二方面的一种具体实现方式中，所述第一更新单元具体用于根据下式对所述产品类目的初始特征向量进行更新：

其中，

为所述产品类目的更新特征向量。

在第二方面的一种具体实现方式中，所述第二更新单元具体用于根据下式对所述第二产品标签的初始特征向量进行更新：

其中，

为所述产品类目的更新特征向量，

为所述第二产品标签的更新特征向量。

在第二方面的一种具体实现方式中，所述第二Bi-GRU处理模块可以包括：

双向处理单元，用于分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出，以及经过反向GRU处理得到的反向GRU输出；

双向合并单元，用于对所述正向GRU输出和所述反向GRU输出进行合并，得到双向合并输出；

均值池化单元，用于对所述双向合并输出在时序上进行均值池化处理，得到所述第二产品描述文本的特征向量。

在第二方面的一种具体实现方式中，所述第二注意力机制处理模块具体用于根据下式计算所述第二产品标签加权后的特征向量：

其中，

本发明实施例的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述任一种基于人工智能的产品分类方法的步骤。

本发明实施例的第四方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一种基于人工智能的产品分类方法的步骤。

本发明实施例的第五方面提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述任一种基于人工智能的产品分类方法的步骤。

本发明实施例与现有技术相比存在的有益效果是：本发明实施例获取待分类产品的第一产品标签和第一产品描述文本；在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量；在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理，得到所述第一产品描述文本的特征向量；在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权，得到所述第一产品标签加权后的特征向量；在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理，得到所述待分类产品的分类结果。通过本发明实施例，可以通过图卷积来提取更为复杂的结构信息，而且使用产品描述文本对产品标签进行注意力机制加权，能够将重要的产品标签赋予更大的权重，增强了产品标签的特征表达，极大提高了产品分类结果的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为产品分类模型的训练过程的一个实施例流程图；

图2为产品标签与产品类目之间的图结构的示意图；

图3为在初始的产品分类模型的图卷积层中对图结构进行处理，得到产品标签的特征向量的示意流程图；

图4为本发明实施例中一种基于人工智能的产品分类方法的一个实施例流程图；

图5为本发明实施例中一种基于人工智能的产品分类装置的一个实施例结构图；

图6为本发明实施例中一种终端设备的示意框图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能（Artificial Intelligence，AI）是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本发明实施例的执行主体可以为基于人工智能的终端设备，用于执行本发明实施例中的产品分类方法。

在本发明实施例中，可以首先获取待分类产品的产品标签和产品描述文本，分别将其记为第一产品标签和第一产品描述文本，然后将其输入到已训练的产品分类模型中进行处理，最终得到待分类产品的分类结果。其中，产品分类模型在训练的过程中提取产品类目和产品标签的结构信息，并采用产品描述文本对产品标签构建注意力机制提升产品标签的特征表达，能够极大提高产品分类结果的准确率。

如图1所示，产品分类模型的训练过程具体可以包括如下步骤：

步骤S101、构建已分类产品的第二产品标签与产品类目之间的图结构。

具体地，终端设备可以获取预先构建好的标准产品分级目录结构，如财产保险—损失保险—家庭财产保险—特殊风险保险，其中，财产保险是最顶层的产品类目，损失保险为财产保险下一层级的产品类目，家庭财产保险为损失保险下一层级的产品类目，以此类推。

在本发明实施例中，终端设备可以将产品分级目录结构转化为产品分级类目图。其中，各个层级的产品类目均作为产品分级类目图中的一个节点，下一层级与上一层级之间存在一条由下一层级指向上一层级的边。

在得到产品分级类目图之后，终端设备可以在其基础上进一步构建已分类产品的产品标签（将其记为第二产品标签）与产品类目之间的图结构。每个产品类目所对应的产品标签已预先确定，例如，可以由相关人员根据经验为其打上各种产品标签，需要注意的是，一个产品类目可以对应多个产品标签，一个产品标签也可以对应多个产品类目。在本发明实施例中，产品标签可以包括但不限于：家庭、老年、自驾游人士等。

终端设备在建立产品标签与产品类目之间的图结构的过程中，可以将产品标签作为节点，将产品标签与其对应的产品类目进行连接，即产品类目与其对应的产品标签之间存在一条由产品类目指向对应的产品标签的边，最终形成的产品标签与产品类目之间的图结构如图2所示。其中，最外层的圆圈代表产品标签，其它的圆圈代表产品类目，圆圈的大小代表产品类目的层级高低，圆圈越大，产品类目的层级越高，反之，圆圈越小，产品类目的层级越小。

产品类目与产品标签之间的边的权重可以根据下式进行计算：

其中，i为产品类目的序号，c _i即为第i个产品类目，j为产品标签的序号，t _j即为第j个产品标签，A_i,j为c _i与t _j之间的边的权重，n(t _j∣c _i)为在产品类目为c _i的产品中产品标签t _j出现的次数，该产品标签在该产品类目中出现的次数越多越重要，权重也越大。n(c _i)是产品类目为c _i的产品数目，N是总产品数目，该产品类目的产品占总产品比例越多，则对应的权重越小，从而可以增强数量较少的产品类目的表达。

优选地，终端设备在计算得到各条边的权重之后，还可以根据下式对其进行归一化处理：

其中，

即为归一化处理后的权重。

步骤S102、在初始的产品分类模型的图卷积层中对图结构进行处理，得到第二产品标签的特征向量。

如图3所示，步骤S102具体可以包括如下过程：

步骤S1021、分别确定第二产品标签与产品类目的初始特征向量。

对任意一个产品类目而言，可以首先获取该产品类目对应的产品类目描述文本，对产品类目描述文本进行分词处理，得到与产品类目描述文本对应的词语集合。

分词处理是指将文本切分成一个一个单独的词语，在本发明实施例中，可以根据通用词典对文本进行切分，保证分出的词语都是正常词汇，如词语不在词典内则分出单字。当前后方向都可以成词时，例如“ABC”，会根据统计词频的大小划分，如“AB”词频高则分出“AB/C”，如“BC”词频高则分出“A/BC”。对于产品类目描述文本而言，经过分词处理后，可以将切分出来的词语组成与该产品类目描述文本对应的词语集合。

然后，在预设的词语向量数据库中分别查询词语集合中的各个词语的词语向量。

所述词语向量数据库为记录词语与词语向量之间的对应关系的数据库。所述词语向量可以是根据word2vec模型训练词语所得到对应的词语向量。word2vec模型用中心词作为预测其周围的词或用周围的词预测中心词，通过神经网络模型训练，将词的向量表达从高维的one-hot形式转化为蕴含语义信息的低维度向量表达。具体地，如“庆祝”的one-hot向量假设定为[1,0,0,0,……,0]，“大会”的one-hot向量为[0,1,0,0,……,0]，“闭幕”的向量[0,0,1,0,……,0]，以最大化“顺利”一词的输出概率为训练目标进行模型训练，模型经过训练会生成隐藏层的系数矩阵W，每个词的one-hot向量和系数矩阵的乘积为该词的词语向量，最后的形式将是类似于“庆祝[-0.28, 0.34,-0.02,……,0.92]”这样的一个多维向量。

在得到各个词语的词语向量之后，可以对其进行均值池化，池化后输出的向量即为产品类目的初始特征向量。

产品标签的初始特征向量的确定过程与产品类目的特征向量的确定过程类似，区别在于使用的是产品标签的本身文本，此处不再赘述。

在得到初始特征向量之后，还可以根据图结构对其进行更新，在本发明实施例中，可以先更新产品类目的特征向量，再更新产品标签的特征向量。

步骤S1022、根据图结构，对产品类目的初始特征向量进行更新，得到产品类目的更新特征向量。

对于任意一个产品类目而言，可以由其上一层级的产品类目和下一层级的产品类目对其特征向量进行更新。具体地，可以根据下式对该产品类目的初始特征向量进行更新：

其中，

为在图结构中与该产品类目连接的所有上级类目的集合，

为该集合中的元素个数，

为在图结构中与该产品类目连接的所有下级类目的集合，

为该集合中的元素个数，W⁽¹⁾，W⁽²⁾，W⁽³⁾，b⁽¹⁾均为待训练的模型参数，RELU为预设的激活函数，c _i为该产品类目的初始特征向量，

为该产品类目的更新特征向量。

步骤S1023、根据图结构和产品类目的更新特征向量，对第二产品标签的初始特征向量进行更新，得到第二产品标签的更新特征向量。

对于任意一个第二产品标签而言，可以由与其相连接的产品类目对其特征向量进行更新。具体地，可以根据下式对该第二产品标签的初始特征向量进行更新：

其中，

为在图结构中与该第二产品标签连接的所有产品类目的集合，

为该集合中的元素个数，W⁽⁴⁾，W⁽⁵⁾，b⁽²⁾均为待训练的模型参数，t _j为该第二产品标签的初始特征向量，

为该第二产品标签的更新特征向量。

步骤S103、获取已分类产品的第二产品描述文本，并在产品分类模型的Bi-GRU网络层中对第二产品描述文本进行处理，得到第二产品描述文本的特征向量。

对任一已分类产品而言，终端设备可以首先获取该产品对应的产品描述文本，将其记为第二产品描述文本，对该第二产品描述文本进行分词处理，可以得到对应的词序列{w₁,...,w_k,...,w_K}，然后将词序列依次输入到Bi-GRU网络层中进行处理。其中，k为词语的序号，w_k为第k个词语，K为词序列中的词语总数。

Bi-GRU是一种改进的GRU(Gated Recurrent Unit，门控循环单元)网络，通过连接两个GRU网络(正向GRU和反向GRU)形成的一个双向结构，在GRU的基础上能够更加充分的获取序列数据的上下文信息。与GRU不同之处在于，Bi-GRU输出两个合并的GRU输出，正向GRU输出和反向GRU输出。

在本发明实施例中，可以分别计算该第二产品描述文本经过正向GRU处理得到的正向GRU输出，以及经过反向GRU处理得到的反向GRU输出。

对词序列中的任意词语w_k而言，正向GRU处理后的输出如下所示：

反向GRU处理后的输出如下所示：

其中，

为正向GRU处理，

为正向GRU输出，

为反向GRU处理，

为反向GRU输出。

然后，对正向GRU输出和反向GRU输出进行合并，得到双向合并输出，即：

最后，可以根据下式对双向合并输出在时序上进行均值池化处理，即对各个词语对应的双向合并输出求均值，得到该第二产品描述文本的特征向量：

其中，h即为该第二产品描述文本的特征向量。

步骤S104、在产品分类模型的注意力层中使用第二产品描述文本的特征向量对第二产品标签的特征向量进行注意力机制加权，得到第二产品标签加权后的特征向量。

具体地，可以根据下式计算第二产品标签加权后的特征向量：

其中，W⁽⁶⁾、b⁽³⁾和v均为待训练的模型参数，h^f为第二产品标签加权后的特征向量。

步骤S105、在产品分类模型的全连接层中对第二产品标签加权后的特征向量进行处理，得到已分类产品的实际输出分类结果。

在本发明实施例中，可以将已分类产品的其他结构化特征如价格、产品名称等与h^f、h进行拼接，然后将拼接后的特征向量经过全连接层处理，得到实际输出分类结果。

步骤S106、根据已分类产品的实际输出分类结果和预期输出分类结果，使用预设的损失函数对产品分类模型进行训练，得到已训练的产品分类模型。

在模型训练的过程中，可以以产品最细分一级的产品类目作为预期输出分类结果，使用交叉熵损失函数对模型进行训练，直至满足预设的收敛条件为止，从而得到已训练的产品分类模型。

在产品分类模型训练好之后，终端设备可以使用产品分类模型对待分类产品进行分类，具体可以包括如图4所示的步骤：

步骤S401、获取待分类产品的第一产品标签和第一产品描述文本。

步骤S402、在已训练的产品分类模型的图卷积层中确定第一产品标签的特征向量。

由于在步骤S102中已更新得到各个产品标签的特征向量，此处仅需在其中查询与第一产品标签对应的特征向量即可。

步骤S403、在产品分类模型的Bi-GRU网络层中对第一产品描述文本进行处理，得到第一产品描述文本的特征向量。

步骤S404、在产品分类模型的注意力层中使用第一产品描述文本的特征向量对第一产品标签的特征向量进行注意力机制加权，得到第一产品标签加权后的特征向量。

步骤S405、在产品分类模型的全连接层中对第一产品标签加权后的特征向量进行处理，得到待分类产品的分类结果。

全连接层最终输出的是待分类产品属于各个产品类目的概率，可以选择概率最大的产品类目作为待分类产品的分类结果。

需要注意的是，步骤S403至步骤S405的过程与步骤S103至步骤S105的过程类似，具体可参照前述训练过程中的对应描述，此处不再赘述。

通过本发明实施例，构建了产品类目与产品标签的图结构，通常一个产品标签关联多个产品类目，一个产品类目具有多个产品标签，标签在产品层级中的共享信息能够在图结构中被表达出来。因此，通过图卷积方法对邻居节点进行聚合，来提取产品类目、标签、产品和标签之间较复杂的结构信息，能够使得模型在判断产品类别的时候更加准确。而且，由于产品标签通常来自产品描述，而注意力机制网络通过产品描述文本信息加强了产品标签向量的特征表达，能够将重要的产品标签赋予更大的权重，提升模型性能，极大提高了产品分类结果的准确率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

对应于上文实施例所述的一种基于人工智能的产品分类方法，图5示出了本发明实施例提供的一种基于人工智能的产品分类装置的一个实施例结构图。

本发明实施例中，一种基于人工智能的产品分类装置可以包括：

产品信息获取模块501，用于获取待分类产品的第一产品标签和第一产品描述文本；

第一图卷积处理模块502，用于在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量；

第一Bi-GRU处理模块503，用于在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理，得到所述第一产品描述文本的特征向量；

第一注意力机制处理模块504，用于在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权，得到所述第一产品标签加权后的特征向量；

第一全连接处理模块505，用于在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理，得到所述待分类产品的分类结果。

在本发明实施例的一种具体实现方式中，所述产品分类装置还可以包括：

在本发明实施例的一种具体实现方式中，所述第二图卷积处理模块可以包括：

在本发明实施例的一种具体实现方式中，所述第一更新单元具体用于根据下式对所述产品类目的初始特征向量进行更新：

其中，

为所述产品类目的更新特征向量。

在本发明实施例的一种具体实现方式中，所述第二更新单元具体用于根据下式对所述第二产品标签的初始特征向量进行更新：

其中，

为所述产品类目的更新特征向量，

为所述第二产品标签的更新特征向量。

在本发明实施例的一种具体实现方式中，所述第二Bi-GRU处理模块可以包括：

在本发明实施例的一种具体实现方式中，所述第二注意力机制处理模块具体用于根据下式计算所述第二产品标签加权后的特征向量：

其中，

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置，模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

图6示出了本发明实施例提供的一种终端设备的示意框图，为了便于说明，仅示出了与本发明实施例相关的部分。

在本实施例中，所述终端设备6可以是桌上型计算机、笔记本、掌上电脑等计算设备。该终端设备6可包括：处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62，例如执行上述的基于人工智能的产品分类方法的计算机可读指令。所述处理器60执行所述计算机可读指令62时实现上述各个基于人工智能的产品分类方法实施例中的步骤，例如图4所示的步骤S401至S405。或者，所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能，例如图5所示模块501至505的功能。

示例性的，所述计算机可读指令62可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器61中，并由所述处理器60执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机可读指令62在所述终端设备6中的执行过程。

所述处理器60可以是中央处理单元（Central Processing Unit，CPU），还可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述终端设备6的内部存储单元，例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备，例如所述终端设备6上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。进一步地，所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述终端设备6所需的其它指令和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干计算机可读指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储计算机可读指令的介质。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。