CN113553433B - 基于人工智能的产品分类方法、装置、介质及终端设备 - Google Patents
基于人工智能的产品分类方法、装置、介质及终端设备 Download PDFInfo
- Publication number
- CN113553433B CN113553433B CN202111094159.0A CN202111094159A CN113553433B CN 113553433 B CN113553433 B CN 113553433B CN 202111094159 A CN202111094159 A CN 202111094159A CN 113553433 B CN113553433 B CN 113553433B
- Authority
- CN
- China
- Prior art keywords
- product
- feature vector
- label
- category
- description text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于人工智能技术领域,尤其涉及一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备。所述方法包括:获取待分类产品的第一产品标签和第一产品描述文本;在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;在所述产品分类模型的Bi‑GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果。
Description
技术领域
本发明属于人工智能技术领域,尤其涉及一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备。
背景技术
目前对产品进行分类的方法多使用结构化数据,或用CNN、RNN对文本信息进行直接建模,一些复杂的结构信息未被有效利用,导致产品分类结果准确率较低。
发明内容
有鉴于此,本发明实施例提供了一种基于人工智能的产品分类方法、装置、计算机可读存储介质及终端设备,以解决现有的产品分类方法的准确率较低的问题。
本发明实施例的第一方面提供了一种基于人工智能的产品分类方法,可以包括:
获取待分类产品的第一产品标签和第一产品描述文本;
在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;
在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;
在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;
在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果。
在第一方面的一种具体实现方式中,所述产品分类模型的训练过程可以包括:
构建已分类产品的第二产品标签与产品类目之间的图结构;
在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量;
获取所述已分类产品的第二产品描述文本,并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量;
在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量;
在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理,得到所述已分类产品的实际输出分类结果;
根据所述已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对所述产品分类模型进行训练,得到已训练的产品分类模型。
在第一方面的一种具体实现方式中,所述在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量,可以包括:
分别确定所述第二产品标签与所述产品类目的初始特征向量;
根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量;
根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量。
在第一方面的一种具体实现方式中,所述根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量,可以包括:
根据下式对所述产品类目的初始特征向量进行更新:
其中,为在所述图结构中与所述产品类目连接的所有上级类目的集合,为在所述图结构中与所述产品类目连接的所有下级类目的集合,W(1),W(2),W(3),b(1)均为待训练的模型参数,RELU为预设的激活函数,c i 为所述产品类目的初始特征向量,为所述产品类目的更新特征向量。
在第一方面的一种具体实现方式中,所述根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量,可以包括:
根据下式对所述第二产品标签的初始特征向量进行更新:
其中,为在所述图结构中与所述第二产品标签连接的所有产品类目的集合,W(4),W(5),b(2)均为待训练的模型参数,RELU为预设的激活函数,为在所述图结构中所述产品类目与所述第二产品标签之间的边的权重,t j 为所述第二产品标签的初始特征向量,为所述产品类目的更新特征向量,为所述第二产品标签的更新特征向量。
在第一方面的一种具体实现方式中,所述在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量,可以包括:
分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出,以及经过反向GRU处理得到的反向GRU输出;
对所述正向GRU输出和所述反向GRU输出进行合并,得到双向合并输出;
对所述双向合并输出在时序上进行均值池化处理,得到所述第二产品描述文本的特征向量。
在第一方面的一种具体实现方式中,所述在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量,可以包括:
根据下式计算所述第二产品标签加权后的特征向量:
本发明实施例的第二方面提供了一种基于人工智能的产品分类装置,可以包括:
产品信息获取模块,用于获取待分类产品的第一产品标签和第一产品描述文本;
第一图卷积处理模块,用于在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;
第一Bi-GRU处理模块,用于在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;
第一注意力机制处理模块,用于在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;
第一全连接处理模块,用于在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果。
在第二方面的一种具体实现方式中,所述产品分类装置还可以包括:
图结构构建模块,用于构建已分类产品的第二产品标签与产品类目之间的图结构;
第二图卷积处理模块,用于在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量;
第二Bi-GRU处理模块,用于获取所述已分类产品的第二产品描述文本,并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量;
第二注意力机制处理模块,用于在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量;
第二全连接处理模块,用于在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理,得到所述已分类产品的实际输出分类结果;
模型训练模块,用于根据所述已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对所述产品分类模型进行训练,得到已训练的产品分类模型。
在第二方面的一种具体实现方式中,所述第二图卷积处理模块可以包括:
初始特征向量确定单元,用于分别确定所述第二产品标签与所述产品类目的初始特征向量;
第一更新单元,用于根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量;
第二更新单元,用于根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量。
在第二方面的一种具体实现方式中,所述第一更新单元具体用于根据下式对所述产品类目的初始特征向量进行更新:
其中,为在所述图结构中与所述产品类目连接的所有上级类目的集合,为在所述图结构中与所述产品类目连接的所有下级类目的集合,W(1),W(2),W(3),b(1)均为待训练的模型参数,RELU为预设的激活函数,c i 为所述产品类目的初始特征向量,为所述产品类目的更新特征向量。
在第二方面的一种具体实现方式中,所述第二更新单元具体用于根据下式对所述第二产品标签的初始特征向量进行更新:
其中,为在所述图结构中与所述第二产品标签连接的所有产品类目的集合,W(4),W(5),b(2)均为待训练的模型参数,RELU为预设的激活函数,为在所述图结构中所述产品类目与所述第二产品标签之间的边的权重,t j 为所述第二产品标签的初始特征向量,为所述产品类目的更新特征向量,为所述第二产品标签的更新特征向量。
在第二方面的一种具体实现方式中,所述第二Bi-GRU处理模块可以包括:
双向处理单元,用于分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出,以及经过反向GRU处理得到的反向GRU输出;
双向合并单元,用于对所述正向GRU输出和所述反向GRU输出进行合并,得到双向合并输出;
均值池化单元,用于对所述双向合并输出在时序上进行均值池化处理,得到所述第二产品描述文本的特征向量。
在第二方面的一种具体实现方式中,所述第二注意力机制处理模块具体用于根据下式计算所述第二产品标签加权后的特征向量:
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种基于人工智能的产品分类方法的步骤。
本发明实施例的第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种基于人工智能的产品分类方法的步骤。
本发明实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述任一种基于人工智能的产品分类方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例获取待分类产品的第一产品标签和第一产品描述文本;在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果。通过本发明实施例,可以通过图卷积来提取更为复杂的结构信息,而且使用产品描述文本对产品标签进行注意力机制加权,能够将重要的产品标签赋予更大的权重,增强了产品标签的特征表达,极大提高了产品分类结果的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为产品分类模型的训练过程的一个实施例流程图;
图2为产品标签与产品类目之间的图结构的示意图;
图3为在初始的产品分类模型的图卷积层中对图结构进行处理,得到产品标签的特征向量的示意流程图;
图4为本发明实施例中一种基于人工智能的产品分类方法的一个实施例流程图;
图5为本发明实施例中一种基于人工智能的产品分类装置的一个实施例结构图;
图6为本发明实施例中一种终端设备的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本发明实施例的执行主体可以为基于人工智能的终端设备,用于执行本发明实施例中的产品分类方法。
在本发明实施例中,可以首先获取待分类产品的产品标签和产品描述文本,分别将其记为第一产品标签和第一产品描述文本,然后将其输入到已训练的产品分类模型中进行处理,最终得到待分类产品的分类结果。其中,产品分类模型在训练的过程中提取产品类目和产品标签的结构信息,并采用产品描述文本对产品标签构建注意力机制提升产品标签的特征表达,能够极大提高产品分类结果的准确率。
如图1所示,产品分类模型的训练过程具体可以包括如下步骤:
步骤S101、构建已分类产品的第二产品标签与产品类目之间的图结构。
具体地,终端设备可以获取预先构建好的标准产品分级目录结构,如财产保险—损失保险—家庭财产保险—特殊风险保险,其中,财产保险是最顶层的产品类目,损失保险为财产保险下一层级的产品类目,家庭财产保险为损失保险下一层级的产品类目,以此类推。
在本发明实施例中,终端设备可以将产品分级目录结构转化为产品分级类目图。其中,各个层级的产品类目均作为产品分级类目图中的一个节点,下一层级与上一层级之间存在一条由下一层级指向上一层级的边。
在得到产品分级类目图之后,终端设备可以在其基础上进一步构建已分类产品的产品标签(将其记为第二产品标签)与产品类目之间的图结构。每个产品类目所对应的产品标签已预先确定,例如,可以由相关人员根据经验为其打上各种产品标签,需要注意的是,一个产品类目可以对应多个产品标签,一个产品标签也可以对应多个产品类目。在本发明实施例中,产品标签可以包括但不限于:家庭、老年、自驾游人士等。
终端设备在建立产品标签与产品类目之间的图结构的过程中,可以将产品标签作为节点,将产品标签与其对应的产品类目进行连接,即产品类目与其对应的产品标签之间存在一条由产品类目指向对应的产品标签的边,最终形成的产品标签与产品类目之间的图结构如图2所示。其中,最外层的圆圈代表产品标签,其它的圆圈代表产品类目,圆圈的大小代表产品类目的层级高低,圆圈越大,产品类目的层级越高,反之,圆圈越小,产品类目的层级越小。
产品类目与产品标签之间的边的权重可以根据下式进行计算:
其中,i为产品类目的序号,c i 即为第i个产品类目,j为产品标签的序号,t j 即为第j个产品标签,A i,j 为c i 与t j 之间的边的权重,n(t j ∣c i )为在产品类目为c i 的产品中产品标签t j 出现的次数,该产品标签在该产品类目中出现的次数越多越重要,权重也越大。n(c i )是产品类目为c i 的产品数目,N是总产品数目,该产品类目的产品占总产品比例越多,则对应的权重越小,从而可以增强数量较少的产品类目的表达。
优选地,终端设备在计算得到各条边的权重之后,还可以根据下式对其进行归一化处理:
步骤S102、在初始的产品分类模型的图卷积层中对图结构进行处理,得到第二产品标签的特征向量。
如图3所示,步骤S102具体可以包括如下过程:
步骤S1021、分别确定第二产品标签与产品类目的初始特征向量。
对任意一个产品类目而言,可以首先获取该产品类目对应的产品类目描述文本,对产品类目描述文本进行分词处理,得到与产品类目描述文本对应的词语集合。
分词处理是指将文本切分成一个一个单独的词语,在本发明实施例中,可以根据通用词典对文本进行切分,保证分出的词语都是正常词汇,如词语不在词典内则分出单字。当前后方向都可以成词时,例如“ABC”,会根据统计词频的大小划分,如“AB”词频高则分出“AB/C”,如“BC”词频高则分出“A/BC”。对于产品类目描述文本而言,经过分词处理后,可以将切分出来的词语组成与该产品类目描述文本对应的词语集合。
然后,在预设的词语向量数据库中分别查询词语集合中的各个词语的词语向量。
所述词语向量数据库为记录词语与词语向量之间的对应关系的数据库。所述词语向量可以是根据word2vec模型训练词语所得到对应的词语向量。word2vec模型用中心词作为预测其周围的词或用周围的词预测中心词,通过神经网络模型训练,将词的向量表达从高维的one-hot形式转化为蕴含语义信息的低维度向量表达。具体地,如“庆祝”的one-hot向量假设定为[1,0,0,0,……,0],“大会”的one-hot向量为[0,1,0,0,……,0],“闭幕”的向量[0,0,1,0,……,0],以最大化“顺利”一词的输出概率为训练目标进行模型训练,模型经过训练会生成隐藏层的系数矩阵W,每个词的one-hot向量和系数矩阵的乘积为该词的词语向量,最后的形式将是类似于“庆祝[-0.28, 0.34,-0.02,……,0.92]”这样的一个多维向量。
在得到各个词语的词语向量之后,可以对其进行均值池化,池化后输出的向量即为产品类目的初始特征向量。
产品标签的初始特征向量的确定过程与产品类目的特征向量的确定过程类似,区别在于使用的是产品标签的本身文本,此处不再赘述。
在得到初始特征向量之后,还可以根据图结构对其进行更新,在本发明实施例中,可以先更新产品类目的特征向量,再更新产品标签的特征向量。
步骤S1022、根据图结构,对产品类目的初始特征向量进行更新,得到产品类目的更新特征向量。
对于任意一个产品类目而言,可以由其上一层级的产品类目和下一层级的产品类目对其特征向量进行更新。具体地,可以根据下式对该产品类目的初始特征向量进行更新:
其中,为在图结构中与该产品类目连接的所有上级类目的集合,为该集合中的元素个数,为在图结构中与该产品类目连接的所有下级类目的集合,为该集合中的元素个数,W(1),W(2),W(3),b(1)均为待训练的模型参数,RELU为预设的激活函数,c i 为该产品类目的初始特征向量,为该产品类目的更新特征向量。
步骤S1023、根据图结构和产品类目的更新特征向量,对第二产品标签的初始特征向量进行更新,得到第二产品标签的更新特征向量。
对于任意一个第二产品标签而言,可以由与其相连接的产品类目对其特征向量进行更新。具体地,可以根据下式对该第二产品标签的初始特征向量进行更新:
其中,为在图结构中与该第二产品标签连接的所有产品类目的集合,为该集合中的元素个数,W(4),W(5),b(2)均为待训练的模型参数,t j 为该第二产品标签的初始特征向量,为该第二产品标签的更新特征向量。
步骤S103、获取已分类产品的第二产品描述文本,并在产品分类模型的Bi-GRU网络层中对第二产品描述文本进行处理,得到第二产品描述文本的特征向量。
对任一已分类产品而言,终端设备可以首先获取该产品对应的产品描述文本,将其记为第二产品描述文本,对该第二产品描述文本进行分词处理,可以得到对应的词序列{w1,...,wk,...,wK},然后将词序列依次输入到Bi-GRU网络层中进行处理。其中,k为词语的序号,wk为第k个词语,K为词序列中的词语总数。
Bi-GRU是一种改进的GRU(Gated Recurrent Unit,门控循环单元)网络,通过连接两个GRU网络(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息。与GRU不同之处在于,Bi-GRU输出两个合并的GRU输出,正向GRU输出和反向GRU输出。
在本发明实施例中,可以分别计算该第二产品描述文本经过正向GRU处理得到的正向GRU输出,以及经过反向GRU处理得到的反向GRU输出。
对词序列中的任意词语wk而言,正向GRU处理后的输出如下所示:
反向GRU处理后的输出如下所示:
然后,对正向GRU输出和反向GRU输出进行合并,得到双向合并输出,即:
最后,可以根据下式对双向合并输出在时序上进行均值池化处理,即对各个词语对应的双向合并输出求均值,得到该第二产品描述文本的特征向量:
其中,h即为该第二产品描述文本的特征向量。
步骤S104、在产品分类模型的注意力层中使用第二产品描述文本的特征向量对第二产品标签的特征向量进行注意力机制加权,得到第二产品标签加权后的特征向量。
具体地,可以根据下式计算第二产品标签加权后的特征向量:
其中,W(6)、b(3)和v均为待训练的模型参数,hf为第二产品标签加权后的特征向量。
步骤S105、在产品分类模型的全连接层中对第二产品标签加权后的特征向量进行处理,得到已分类产品的实际输出分类结果。
在本发明实施例中,可以将已分类产品的其他结构化特征如价格、产品名称等与hf、h进行拼接,然后将拼接后的特征向量经过全连接层处理,得到实际输出分类结果。
步骤S106、根据已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对产品分类模型进行训练,得到已训练的产品分类模型。
在模型训练的过程中,可以以产品最细分一级的产品类目作为预期输出分类结果,使用交叉熵损失函数对模型进行训练,直至满足预设的收敛条件为止,从而得到已训练的产品分类模型。
在产品分类模型训练好之后,终端设备可以使用产品分类模型对待分类产品进行分类,具体可以包括如图4所示的步骤:
步骤S401、获取待分类产品的第一产品标签和第一产品描述文本。
步骤S402、在已训练的产品分类模型的图卷积层中确定第一产品标签的特征向量。
由于在步骤S102中已更新得到各个产品标签的特征向量,此处仅需在其中查询与第一产品标签对应的特征向量即可。
步骤S403、在产品分类模型的Bi-GRU网络层中对第一产品描述文本进行处理,得到第一产品描述文本的特征向量。
步骤S404、在产品分类模型的注意力层中使用第一产品描述文本的特征向量对第一产品标签的特征向量进行注意力机制加权,得到第一产品标签加权后的特征向量。
步骤S405、在产品分类模型的全连接层中对第一产品标签加权后的特征向量进行处理,得到待分类产品的分类结果。
全连接层最终输出的是待分类产品属于各个产品类目的概率,可以选择概率最大的产品类目作为待分类产品的分类结果。
需要注意的是,步骤S403至步骤S405的过程与步骤S103至步骤S105的过程类似,具体可参照前述训练过程中的对应描述,此处不再赘述。
通过本发明实施例,构建了产品类目与产品标签的图结构,通常一个产品标签关联多个产品类目,一个产品类目具有多个产品标签,标签在产品层级中的共享信息能够在图结构中被表达出来。因此,通过图卷积方法对邻居节点进行聚合,来提取产品类目、标签、产品和标签之间较复杂的结构信息,能够使得模型在判断产品类别的时候更加准确。而且,由于产品标签通常来自产品描述,而注意力机制网络通过产品描述文本信息加强了产品标签向量的特征表达,能够将重要的产品标签赋予更大的权重,提升模型性能,极大提高了产品分类结果的准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种基于人工智能的产品分类方法,图5示出了本发明实施例提供的一种基于人工智能的产品分类装置的一个实施例结构图。
本发明实施例中,一种基于人工智能的产品分类装置可以包括:
产品信息获取模块501,用于获取待分类产品的第一产品标签和第一产品描述文本;
第一图卷积处理模块502,用于在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;
第一Bi-GRU处理模块503,用于在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;
第一注意力机制处理模块504,用于在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;
第一全连接处理模块505,用于在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果。
在本发明实施例的一种具体实现方式中,所述产品分类装置还可以包括:
图结构构建模块,用于构建已分类产品的第二产品标签与产品类目之间的图结构;
第二图卷积处理模块,用于在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量;
第二Bi-GRU处理模块,用于获取所述已分类产品的第二产品描述文本,并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量;
第二注意力机制处理模块,用于在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量;
第二全连接处理模块,用于在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理,得到所述已分类产品的实际输出分类结果;
模型训练模块,用于根据所述已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对所述产品分类模型进行训练,得到已训练的产品分类模型。
在本发明实施例的一种具体实现方式中,所述第二图卷积处理模块可以包括:
初始特征向量确定单元,用于分别确定所述第二产品标签与所述产品类目的初始特征向量;
第一更新单元,用于根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量;
第二更新单元,用于根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量。
在本发明实施例的一种具体实现方式中,所述第一更新单元具体用于根据下式对所述产品类目的初始特征向量进行更新:
其中,为在所述图结构中与所述产品类目连接的所有上级类目的集合,为在所述图结构中与所述产品类目连接的所有下级类目的集合,W(1),W(2),W(3),b(1)均为待训练的模型参数,RELU为预设的激活函数,c i 为所述产品类目的初始特征向量,为所述产品类目的更新特征向量。
在本发明实施例的一种具体实现方式中,所述第二更新单元具体用于根据下式对所述第二产品标签的初始特征向量进行更新:
其中,为在所述图结构中与所述第二产品标签连接的所有产品类目的集合,W(4),W(5),b(2)均为待训练的模型参数,RELU为预设的激活函数,为在所述图结构中所述产品类目与所述第二产品标签之间的边的权重,t j 为所述第二产品标签的初始特征向量,为所述产品类目的更新特征向量,为所述第二产品标签的更新特征向量。
在本发明实施例的一种具体实现方式中,所述第二Bi-GRU处理模块可以包括:
双向处理单元,用于分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出,以及经过反向GRU处理得到的反向GRU输出;
双向合并单元,用于对所述正向GRU输出和所述反向GRU输出进行合并,得到双向合并输出;
均值池化单元,用于对所述双向合并输出在时序上进行均值池化处理,得到所述第二产品描述文本的特征向量。
在本发明实施例的一种具体实现方式中,所述第二注意力机制处理模块具体用于根据下式计算所述第二产品标签加权后的特征向量:
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图6示出了本发明实施例提供的一种终端设备的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述终端设备6可以是桌上型计算机、笔记本、掌上电脑等计算设备。该终端设备6可包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62,例如执行上述的基于人工智能的产品分类方法的计算机可读指令。所述处理器60执行所述计算机可读指令62时实现上述各个基于人工智能的产品分类方法实施例中的步骤,例如图4所示的步骤S401至S405。或者,所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块501至505的功能。
示例性的,所述计算机可读指令62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令62在所述终端设备6中的执行过程。
所述处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述终端设备6所需的其它指令和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种基于人工智能的产品分类方法,其特征在于,包括:
获取待分类产品的第一产品标签和第一产品描述文本;
在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;
在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;
在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;
在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果;
所述产品分类模型的训练过程包括:
其中,i为产品类目的序号,c i 为第i个产品类目,j为产品标签的序号,t j 为第j个产品标签,A i,j 为c i 与t j 之间的边的权重,n(t j ∣c i )为在产品类目为c i 的产品中产品标签t j 出现的次数, n(c i )是产品类目为c i 的产品数目,N是总产品数目;
在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量;
获取所述已分类产品的第二产品描述文本,并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量;
在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量;
在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理,得到所述已分类产品的实际输出分类结果;
根据所述已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对所述产品分类模型进行训练,得到已训练的产品分类模型;
所述在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量,包括:
分别确定所述第二产品标签与所述产品类目的初始特征向量;
根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量;
根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量;
所述根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量,包括:
根据下式对所述产品类目的初始特征向量进行更新:
3.根据权利要求1所述的基于人工智能的产品分类方法,其特征在于,所述在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量,包括:
分别计算所述第二产品描述文本经过正向GRU处理得到的正向GRU输出,以及经过反向GRU处理得到的反向GRU输出;
对所述正向GRU输出和所述反向GRU输出进行合并,得到双向合并输出;
对所述双向合并输出在时序上进行均值池化处理,得到所述第二产品描述文本的特征向量。
5.一种基于人工智能的产品分类装置,其特征在于,包括:
产品信息获取模块,用于获取待分类产品的第一产品标签和第一产品描述文本;
第一图卷积处理模块,用于在已训练的产品分类模型的图卷积层中确定所述第一产品标签的特征向量;
第一Bi-GRU处理模块,用于在所述产品分类模型的Bi-GRU网络层中对所述第一产品描述文本进行处理,得到所述第一产品描述文本的特征向量;
第一注意力机制处理模块,用于在所述产品分类模型的注意力层中使用所述第一产品描述文本的特征向量对所述第一产品标签的特征向量进行注意力机制加权,得到所述第一产品标签加权后的特征向量;
第一全连接处理模块,用于在所述产品分类模型的全连接层中对所述第一产品标签加权后的特征向量进行处理,得到所述待分类产品的分类结果;
所述产品分类装置还包括:
其中,i为产品类目的序号,c i 为第i个产品类目,j为产品标签的序号,t j 为第j个产品标签,A i,j 为c i 与t j 之间的边的权重,n(t j ∣c i )为在产品类目为c i 的产品中产品标签t j 出现的次数, n(c i )是产品类目为c i 的产品数目,N是总产品数目;
第二卷积处理模块,用于在初始的产品分类模型的图卷积层中对所述图结构进行处理,得到所述第二产品标签的特征向量;
第二Bi-GRU处理模块,用于获取所述已分类产品的第二产品描述文本,并在所述产品分类模型的Bi-GRU网络层中对所述第二产品描述文本进行处理,得到所述第二产品描述文本的特征向量;
第二注意力机制处理模块,用于在所述产品分类模型的注意力层中使用所述第二产品描述文本的特征向量对所述第二产品标签的特征向量进行注意力机制加权,得到所述第二产品标签加权后的特征向量;
第二全连接处理模块,用于在所述产品分类模型的全连接层中对所述第二产品标签加权后的特征向量进行处理,得到所述已分类产品的实际输出分类结果;
模型训练模量,用于根据所述已分类产品的实际输出分类结果和预期输出分类结果,使用预设的损失函数对所述产品分类模型进行训练,得到已训练的产品分类模型;
所述第二卷积处理模块包括:
初始特征向量确定单元,用于分别确定所述第二产品标签与所述产品类目的初始特征向量;
第一更新单元,用于根据所述图结构,对所述产品类目的初始特征向量进行更新,得到所述产品类目的更新特征向量;
第二更新单元,用于根据所述图结构和所述产品类目的更新特征向量,对所述第二产品标签的初始特征向量进行更新,得到所述第二产品标签的更新特征向量;
所述第一更新单元具体根据下式对所述产品类目的初始特征向量进行更新:
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的基于人工智能的产品分类方法的步骤。
7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至4中任一项所述的基于人工智能的产品分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094159.0A CN113553433B (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的产品分类方法、装置、介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094159.0A CN113553433B (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的产品分类方法、装置、介质及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113553433A CN113553433A (zh) | 2021-10-26 |
CN113553433B true CN113553433B (zh) | 2022-01-07 |
Family
ID=78134651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111094159.0A Active CN113553433B (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的产品分类方法、装置、介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113553433B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781407A (zh) * | 2019-10-21 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 用户标签生成方法、装置及计算机可读存储介质 |
CN112667782A (zh) * | 2021-01-04 | 2021-04-16 | 上海明略人工智能(集团)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN113220886A (zh) * | 2021-05-31 | 2021-08-06 | 马上消费金融股份有限公司 | 文本分类方法、文本分类模型训练方法及相关设备 |
CN113344060A (zh) * | 2021-05-31 | 2021-09-03 | 哈尔滨工业大学 | 文本分类模型训练方法、诉讼状分类方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190361986A9 (en) * | 2015-02-12 | 2019-11-28 | Scott Spaulding | Method for displaying dynamic media with text bubble emulation |
US11537852B2 (en) * | 2020-02-13 | 2022-12-27 | International Business Machines Corporation | Evolving graph convolutional networks for dynamic graphs |
CN112069321B (zh) * | 2020-11-11 | 2021-02-12 | 震坤行网络技术(南京)有限公司 | 用于文本层级分类的方法、电子设备和存储介质 |
CN113254648B (zh) * | 2021-06-22 | 2021-10-22 | 暨南大学 | 一种基于多层次图池化的文本情感分析方法 |
-
2021
- 2021-09-17 CN CN202111094159.0A patent/CN113553433B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781407A (zh) * | 2019-10-21 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 用户标签生成方法、装置及计算机可读存储介质 |
CN112667782A (zh) * | 2021-01-04 | 2021-04-16 | 上海明略人工智能(集团)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN113220886A (zh) * | 2021-05-31 | 2021-08-06 | 马上消费金融股份有限公司 | 文本分类方法、文本分类模型训练方法及相关设备 |
CN113344060A (zh) * | 2021-05-31 | 2021-09-03 | 哈尔滨工业大学 | 文本分类模型训练方法、诉讼状分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113553433A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109960800B (zh) | 基于主动学习的弱监督文本分类方法及装置 | |
CN109284406B (zh) | 基于差异循环神经网络的意图识别方法 | |
CN111191526B (zh) | 行人属性识别网络训练方法、系统、介质及终端 | |
WO2021022521A1 (zh) | 数据处理的方法、训练神经网络模型的方法及设备 | |
CN110532417B (zh) | 基于深度哈希的图像检索方法、装置及终端设备 | |
CN109948149B (zh) | 一种文本分类方法及装置 | |
WO2022126810A1 (zh) | 文本聚类方法 | |
CN105022754B (zh) | 基于社交网络的对象分类方法及装置 | |
Zhang et al. | A high-order possibilistic $ C $-means algorithm for clustering incomplete multimedia data | |
CN110046634B (zh) | 聚类结果的解释方法和装置 | |
Naz et al. | Intelligent routing between capsules empowered with deep extreme machine learning technique | |
CN110297888B (zh) | 一种基于前缀树与循环神经网络的领域分类方法 | |
CN112308115B (zh) | 一种多标签图像深度学习分类方法及设备 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
CN112380344A (zh) | 文本分类的方法、话题生成的方法、装置、设备及介质 | |
CN114661933A (zh) | 基于胎儿先心病超声图像—诊断报告的跨模态检索方法 | |
CN112529638B (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
CN113378938B (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN113806580A (zh) | 基于层次语义结构的跨模态哈希检索方法 | |
CN111178196B (zh) | 一种细胞分类的方法、装置及设备 | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN113987188B (zh) | 一种短文本分类方法、装置及电子设备 | |
CN115456043A (zh) | 分类模型处理、意图识别方法、装置和计算机设备 | |
CN112489689B (zh) | 基于多尺度差异对抗的跨数据库语音情感识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |