CN113139558A - 确定物品的多级分类标签的方法和装置 - Google Patents

确定物品的多级分类标签的方法和装置 Download PDF

Info

Publication number
CN113139558A
CN113139558A CN202010047471.3A CN202010047471A CN113139558A CN 113139558 A CN113139558 A CN 113139558A CN 202010047471 A CN202010047471 A CN 202010047471A CN 113139558 A CN113139558 A CN 113139558A
Authority
CN
China
Prior art keywords
classification
sample
level
layer
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010047471.3A
Other languages
English (en)
Other versions
CN113139558B (zh
Inventor
徐文峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202010047471.3A priority Critical patent/CN113139558B/zh
Publication of CN113139558A publication Critical patent/CN113139558A/zh
Application granted granted Critical
Publication of CN113139558B publication Critical patent/CN113139558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明公开了确定物品的多级分类标签的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签;对样本物品和样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;获取目标物品,利用多级文本分类模型确定目标物品对应的多级目标分类标签。该实施方式利用样本物品和样本物品的各级样本分类标签构建得到多级文本分类模型,能够充分挖掘类别间的隐藏信息,然后基于构建的多级文本分类模型确定物品的多级分类标签,提高物品分类的准确性。

Description

确定物品的多级分类标签的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种确定物品的多级分类标签的方法和装置。
背景技术
多级分类是指类别本身存在层级的一种多分类问题,例如,生物分为动物和植物,动物又分为脊索动物和无脊索动物,植物又分为苔藓植物和蕨类植物等。物品的多级分类属于多级分类问题的一种,准确提供物品的多级分类标签,能够提高物品出入库的效率,也能够给用户带来良好的购物体验。
对于物品的多级分类问题,目前解决思路有两种:采用常规机器学习模型,假设类别间毫无关联,不考虑类别之间的亲疏关系;采用传统级联模型,即构建子分类器,首先需要确定一级分类,再使用相应分类器确定二级分类,以此类推。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:常规机器学习模型在解决多级分类问题时,由于不能充分挖掘类间的隐藏信息,分类效果比较差;传统级联模型中,当各级别分类拥有较多的子类且分类层级较深时,需要构建数量庞大的子分类器,对模型开发的影响是灾难性的。
发明内容
有鉴于此,本发明实施例提供一种确定物品的多级分类标签的方法和装置,能够充分挖掘类别间的隐藏信息,提高物品分类的准确性。
为实现上述目的,根据本发明实施例的第一方面,提供了一种确定物品的多级分类标签的方法。
本发明实施例的一种确定物品的多级分类标签的方法,包括:获取样本物品,根据预先定义的物品级别分类标准,获取所述样本物品对应的各级样本分类标签;对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;获取目标物品,利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签。
可选地,所述多级文本分类模型包括:输入层、表示层、特征提取层、特征整合层和输出层;所述输入层用于输入经过预处理的文本数据,所述预处理包括分词处理、去停用词处理或文本清洗处理;所述表示层由词向量模型构成,用于将所述输入层的文本数据转化为文本矩阵;所述特征提取层由预设个数的TextCNN模型构成,用于提取所述文本矩阵中至少一个特征向量,所述预设个数是根据所述预先定义的物品级别分类标准设置的;所述特征整合层用于对所述至少一个特征向量进行整合处理,得到整合后的特征向量;所述输出层由神经网络模型和归一化指数函数构成,用于根据所述整合后的特征向量,计算所述多级文本分类模型的输出。
可选地,所述对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型,包括:获取所述样本物品的样本文本数据,对所述样本文本数据进行预处理;利用预处理后的所述样本文本数据,训练所述词向量模型,将所述词向量模型作为所述多级文本分类模型的表示层;根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练;联合训练所述表示层、所述特征提取层和所述输出层,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的多级样本分类标签。
可选地,所述根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练,包括:将所述表示层依次与所述特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的所述TextCNN模型对应的级别分类标签。
可选地,所述利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签,包括:获取所述目标物品的目标文本数据,将所述目标文本数据输入至所述多级文本分类模型中,输出所述目标物品对应的多级目标分类标签,所述多级目标分类标签是所述目标物品的最后一个级别的分类标签。
为实现上述目的,根据本发明实施例的第二方面,提供了一种确定物品的多级分类标签的装置。
本发明实施例的一种确定物品的多级分类标签的装置,包括:获取模块,用于获取样本物品,根据预先定义的物品级别分类标准,获取所述样本物品对应的各级样本分类标签;训练模块,用于对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;确定模块,用于获取目标物品,利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签。
可选地,所述多级文本分类模型包括:输入层、表示层、特征提取层、特征整合层和输出层;所述输入层用于输入经过预处理的文本数据,所述预处理包括分词处理、去停用词处理或文本清洗处理;所述表示层由词向量模型构成,用于将所述输入层的文本数据转化为文本矩阵;所述特征提取层由预设个数的TextCNN模型构成,用于提取所述文本矩阵中至少一个特征向量,所述预设个数是根据所述预先定义的物品级别分类标准设置的;所述特征整合层用于对所述至少一个特征向量进行整合处理,得到整合后的特征向量;所述输出层由神经网络模型和归一化指数函数构成,用于根据所述整合后的特征向量,计算所述多级文本分类模型的输出。
可选地,所述训练模块还用于:获取所述样本物品的样本文本数据,对所述样本文本数据进行预处理;利用预处理后的所述样本文本数据,训练所述词向量模型,将所述词向量模型作为所述多级文本分类模型的表示层;根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练;联合训练所述表示层、所述特征提取层和所述输出层,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的多级样本分类标签。
可选地,所述训练模块还用于:将所述表示层依次与所述特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的所述TextCNN模型对应的级别分类标签。
可选地,所述确定模块还用于:获取所述目标物品的目标文本数据,将所述目标文本数据输入至所述多级文本分类模型中,输出所述目标物品对应的多级目标分类标签,所述多级目标分类标签是所述目标物品的最后一个级别的分类标签。
为实现上述目的,根据本发明实施例的第三方面,提供了一种电子设备。
本发明实施例的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例的确定物品的多级分类标签的方法。
为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例的确定物品的多级分类标签的方法。
上述发明中的一个实施例具有如下优点或有益效果:利用样本物品和样本物品的各级样本分类标签构建得到多级文本分类模型,能够充分挖掘类别间的隐藏信息,然后基于构建的多级文本分类模型确定物品的多级分类标签,提高物品分类的准确性。此外,本发明实施例的多级文本分类模型中的特征提取层由多个专用于文本分类的TextCNN模型构成,相当于是由多个子分类器构成,针对多级分类问题上单独构建特征提取器,模型简单且更好的体现多级分类之间的亲疏关系,并且采用TextCNN模型能够提升模型的整体效果,而且增加特征整合层,相当于特征在上层进行了融合,使得下层输出层能够学习各特征之间的关联关系,充分挖掘类间的隐藏信息。因此,本发明实施例的多级文本分类模型的模型简单和结构合理,并且利用本发明实施例的多级文本分类模型确定物品的多级分类标签的准确率高。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的确定物品的多级分类标签的方法的主要步骤的示意图;
图2是预先定义的物品三级分类标准的示意图;
图3是根据本发明实施例的多级文本分类模型的网络结构示意图;
图4是根据本发明实施例的多级文本分类模型的训练过程的主要步骤示意图;
图5是根据本发明实施例的确定物品的多级分类标签的方法的主要过程的示意图;
图6是根据本发明实施例的确定物品的多级分类标签的装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的确定物品的多级分类标签的方法的主要步骤的示意图。如图1所示,作为一个可参考实施例,确定物品的多级分类标签的方法的主要步骤可以包括:
步骤S101:获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签;
步骤S102:对样本物品和样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;
步骤S103:获取目标物品,利用多级文本分类模型确定目标物品对应的多级目标分类标签。
其中,步骤S101中的预先定义的物品级别分类标准是指预先设置好物品的分类标准,也就是预先确定物品的分类范围。假设,预先定义的物品级别分类标准为某购物平台上物品的三级分类标准,图2是预先定义的物品三级分类标准的示意图。从图2可以看出,预先定义的物品三级分类标准中,一级分类包括:食品和图书,二级分类包括:食品-酒类、食品-生鲜、图书-儿童和图书-成人,三级分类包括:食品-酒类-白酒、食品-酒类-啤酒、食品-生鲜-壳类、食品-生鲜-鱼类、图书-儿童-绘本、图书-儿童-漫画、图书-成人-文艺和图书-成人-科教。
此外,步骤S101中的各级样本分类标签是指样本物品在各个级别的分类目标值,比如说样本物品为武昌鱼,则在图2所示的物品三级分类标准中,该样本物品的一级分类为食品,二级分类为食品-生鲜,三级分类为食品-生鲜-鱼类。
还有,步骤S103中的多级目标分类标签是指目标物品的最后一个级别的分类目标值,比如说目标物品为武昌鱼,则在图2所示的物品三级分类标准中,该目标物品的多级分类标签为食品-生鲜-鱼类。若预先定义的物品分类标准有四级,则多级目标分类标签是指目标物品的四级分类的目标值。
从上述步骤S101至步骤S103可以看出,本发明实施例的确定物品的多级分类标签的方法中,首先利用训练样本数据构建多级文本分类模型,然后借助构建的多级文本分类模型确定目标物品的多级分类标签。本发明实施例的训练样本数据包括样本物品和样本物品对应的各级样本分类标签。因此,在构建多级文本分类模型前,需要获取样本物品和样本物品对应的各级样本分类标签。
假设,在构建多级文本分类模型之前,已经取得以下8条训练样本数据,如表1所示。可以看出,表1所示的训练样本数据是依据图2所示的物品三级分类标准得到的。在表1中,具有8个样本物品,每个样本物品的三级分类标签可以是人工确定的,而物品的一级分类标签和二级分类标签可以看作是三级分类标签的衍生。本发明技术方案是使用表1所示的训练样本数据,构建多级文本分类模型,使得当给定一个新物品时,能够直接通过物品的名称,预测物品的多级分类标签。当然,实际构建多级文本分类模型的训练样本数据的数据量是重组的,表1仅是为了便于理解,提供的示例。
表1训练样本数据
Figure BDA0002369934170000071
可以得知,本发明实施例的确定物品的多级分类标签的方法中主要部分是多级文本分类模型的构建。图3是根据本发明实施例的多级文本分类模型的网络结构示意图,可以看出,本发明实施例的多级文本分类模型可以包括:输入层、表示层、特征提取层、特征整合层和输出层。接下来,详细描述训练得到的多级文本分类模型的各个部分。
(1)输入层可以用于输入经过预处理的文本数据,预处理可以包括分词处理、去停用词处理或文本清洗处理。其中,文本数据的形式为(单)词序列,以五粮液52度为例,预处理后的文本数据为五粮液、52、度。其中,分词处理是一种常用自然语言处理技术,用于将句子切分为以词为基本单位的序列;去停用词是一种常用自然语言处理技术,用于去除句子中与句子含义关联性较小的词,例如助词、代词、介词等。
(2)表示层由词向量模型构成,可以用于将输入层的文本数据转化为文本矩阵。其中,词向量模型可以包括词嵌入矩阵(别名为词查找表)和词典,词嵌入矩阵的行(或列)为单词所对应的数值向量,记为词向量,词典记录了每个单词在词嵌入矩阵的行(或列)上的索引。由于自然语言是不能被计算机直接识别的,在给计算机处理之前,首先需要将词利用合适的模型转换为数值向量,该数值向量称为词向量。本发明实施例的文本数据的转换过程可以是:利用词向量模型,将文本数据中的单词转换为行向量,再按顺序将行向量组合为矩阵形式,其中,文本数据的矩阵形式记为文本数据的矩阵表示或文本矩阵。由于文本数据转换为文本矩阵属于成熟的技术手段,此处不做详细描述。词嵌入矩阵或词查找表记录了词与词向量的对应关系,词嵌入矩阵或查找表的行(或列)为词所对应的数值向量。
(3)特征提取层由预设个数的TextCNN模型(即,一种专门用于解决单级文本分类问题的卷积神经网络模型,是一种深度学习模型,分为卷积层、池化层、全连接层、Softmax层)构成,可以用于提取文本矩阵中至少一个特征向量。值得注意的是,本发明实施例中TextCNN模型的个数是根据预先定义的物品级别分类标准设置的,比如图2所示的物品三级分类标准,那么特征提取层TextCNN模型的个数为3。另外,TextCNN模型是一种成熟的神经网络模型,具有典型结构和多种变种结构,本发明实施例中不限定具体的TextCNN模型结构。
还有,本发明实施例中每个TextCNN模型对应不同的分类级别,在具体实施例中,3个TextCNN模型分别对应于一级分类、二级分类和三级分类。TextCNN模型之间不存在依赖关系,并且每个TextCNN模型的输入相同,均为文本矩阵,但是每个TextCNN模型的输出的数值向量,即特征向量,是不同的。具体地,特征向量的维度与每个TextCNN模型对应分类级别中的类别数量相同。比如说,针对图2所示的物品三级分类标准,在特征向量层中具有3个TextCNN模型,并且在具体实施例中,TextCNN1模型对应一级分类,类别数量为2,TextCNN2模型对应二级分类,类别数量为4,TextCNN3模型对应三级分类,类别数量为8。因此,TextCNN1、TextCNN2、TextCNN3模型输出特征向量的维度分别为2、4、8。
(4)特征整合层可以用于对至少一个特征向量进行整合处理,得到整合后的特征向量。也就是说,特征整合层负责整合处理特征提取层中TextCNN模型输出的特征向量,负责将特征提取层中的多个特征向量进行拼接,组成新的特征向量。本发明实施例中的拼接方法可以为特征向量按顺序首尾相接,并且整合后特征向量的维度等于整合前特征向量的维度之和,以上述示例为例,整合特征向量的维度为14。
(5)输出层由神经网络模型和归一化指数函数构成,可以用于根据整合后的特征向量,计算多级文本分类模型的输出。
其中,神经网络模型称为BP神经网络模型(即,一种经典的浅层神经网络模型,具有层级结构,由输入层、多个隐藏层和输出层组成,信号前向传播,训练误差反向传播),是一种成熟的神经网络模型,具有典型结构和多种变种结构,本发明技术方案不限定具体的BP神经网络模型结构,BP神经网络的作用是将整合后的特征向量映射成与终极类别概率相关的数值。BP神经网络的输入为整合后的特征向量,连接方式为全连接(即,在神经网络系统中,一种上下层神经元的连接方式,当下层神经元使用上层全部神经元作为输入时,此时的连接方式为全连接);BP神经网络的输出为数值向量,向量的维度与多级分类标签的类别数量相同,也就是与最后一级类别的标签数量相同。举例来说,最后一级类别为3级分类,类别数量为8,因此,BP神经网络的输出向量维度为8。
归一化指数函数称为softmax(即,一种数值向量的概率化方法,概率化后向量中全部元素之和为1,每个元素的取值在0到1之间)层,它的作用是将BP神经网络的输出向量概率化,softmax层输出向量所有元素加和为1,softmax层输出向量的维度与最终极分类的类别数量相同,softmax层输出向量中的元素代表对应最后一级分类标签的概率值。比如,softmax层的输出向量维度为8,每个元素对应于3级分类中各标签的概率值。
在softmax层输出最后一级分类标签的概率值之后,将概率最大值对应的分类标签作为多级文本分类模型的输出值。
本发明实施例中的多级文本分类模型中:特征提取层由多个专用于文本分类的TextCNN模型构成,相当于是由多个子分类器构成,针对多级分类问题上单独构建特征提取器,模型简单且更好的体现多级分类之间的亲疏关系,并且采用TextCNN模型能够提升模型的整体效果;增加特征整合层,相当于特征在上层进行了融合,使得下层输出层能够学习各特征之间的关联关系,充分挖掘类间的隐藏信息。综合上述,本发明实施例的多级文本分类模型的神经网络结构,模型简单、结构合理、且准确率高。
上文详细描述了本发明实施例训练的多级文本分类模型的结构,接下来说明本发明实施例中多级文本分类模型的训练过程。本发明实施例对样本物品和样本物品对应的各级样本分类标签进行训练,得到多级文本分类模型,图4是根据本发明实施例的多级文本分类模型的训练过程的主要步骤示意图。图4所示,多级文本分类模型的训练过程的主要步骤:
步骤S401:获取样本物品的样本文本数据,对样本文本数据进行预处理;
步骤S402:利用预处理后的样本文本数据,训练词向量模型,将词向量模型作为多级文本分类模型的表示层;
步骤S403:根据样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对表示层与特征提取层进行联合训练;
步骤S404:联合训练表示层、特征提取层和输出层,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的多级样本分类标签。
在步骤S401中,训练样本预处理,需要对样本物品的样本文本数据进行预处理,在上文介绍输入层时已经解释过预处理,此处不再累述。
在步骤S402中,使用预处理后的样本文本数据,训练Word2Vec模型,即词向量模型,将词向量模型作为多级文本分类模型的表示层,Word2Vec是一种利用BP神经网络构建的词向量的方法,基于Word2Vec构建的词向量之间能够更好的体现词与词之间的相关关系,当两个词词义较为接近时,它们所对应的向量的相似性也较大。
在训练表示层之后,步骤S403联合训练表示层与特征提取层,即采用多任务学习的训练方式对表示层与特征提取层进行联合训练,具体方法为:将表示层依次与特征提取层中的每一个TextCNN模型进行联合训练,当与特征提取层的TextCNN模型进行联合训练时,表示层在Word2Vec模型的基础上进行训练,以后表示层与TextCNN模型进行联合训练,表示层均在之前训练的基础上进行。
其中,表示层模型与TextCNN模型联合训练时,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的TextCNN模型对应的级别分类标签。举例来说,表示层与TextCNN1模型联合训练时,输出为一级分类标签,表示层与TextCNN2模型联合训练时,输出为二级分类标签,依此类推。
然后,联合训练表示层、特征提取层及输出层。其中,表示层、特征提取层在之前训练的基础上进行训练,并且联合训练时,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的多级样本分类标签,也就是最后一级分类标签。
本发明实施例中在得到多级文本目标分类模型之后,可以利用该多级文本目标分类模型,确定目标物品的多级分类标签。所以,作为本发明实施例的一个可参考实施例,利用多级文本分类模型确定目标物品对应的多级目标分类标签,可以包括:获取目标物品的目标文本数据,将目标文本数据输入至多级文本分类模型中,输出目标物品对应的多级目标分类标签,多级目标分类标签是目标物品的最后一个级别的分类标签。
图5是根据本发明实施例的确定物品的多级分类标签的方法的主要过程的示意图。如图5所示,确定物品的多级分类标签的方法的主要过程可以包括:
步骤S501:获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签;
步骤S502:获取样本物品的样本文本数据,对样本文本数据进行预处理;
步骤S503:利用预处理后的样本文本数据,训练词向量模型,将词向量模型作为多级文本分类模型的表示层;
步骤S504:根据样本物品对应的各级样本分类标签,将表示层依次与特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的TextCNN模型对应的级别分类标签,其中特征提取层中TextCNN模型的个数是根据预先定义的物品级别分类标准设置;
步骤S505:联合训练表示层、特征提取层和输出层,以得到多级文本分类模型,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的多级样本分类标签;
步骤S506:获取目标物品的目标文本数据,将目标文本数据输入至多级文本分类模型中,输出目标物品对应的多级目标分类标签,多级目标分类标签是所述目标物品的最后一个级别的分类标签。
根据本发明实施例的确定物品的多级分类标签的技术方案可以看出,利用样本物品和样本物品的各级样本分类标签构建得到多级文本分类模型,能够充分挖掘类别间的隐藏信息,然后基于构建的多级文本分类模型确定物品的多级分类标签,提高物品分类的准确性。此外,本发明实施例的多级文本分类模型中的特征提取层由多个专用于文本分类的TextCNN模型构成,相当于是由多个子分类器构成,针对多级分类问题上单独构建特征提取器,模型简单且更好的体现多级分类之间的亲疏关系,并且采用TextCNN模型能够提升模型的整体效果,而且增加特征整合层,相当于特征在上层进行了融合,使得下层输出层能够学习各特征之间的关联关系,充分挖掘类间的隐藏信息。因此,本发明实施例的多级文本分类模型的模型简单和结构合理,并且利用本发明实施例的多级文本分类模型确定物品的多级分类标签的准确率高。
图6是根据本发明实施例的确定物品的多级分类标签的装置的主要模块的示意图。如图6所示,本发明实施例的确定物品的多级分类标签的装置600主要包括以下模块:获取模块601、训练模块602和确定模块603。
其中,获取模块601可用于获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签;训练模块602可用于对样本物品和样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;确定模块603可用于获取目标物品,利用多级文本分类模型确定目标物品对应的多级目标分类标签。
本发明实施例中,训练的多级文本分类模型可以包括:输入层、表示层、特征提取层、特征整合层和输出层;输入层可以用于输入经过预处理的文本数据,其中预处理可以包括分词处理、去停用词处理或文本清洗处理;表示层由词向量模型构成,可以用于将输入层的文本数据转化为文本矩阵;特征提取层由预设个数的TextCNN模型构成,可以用于提取文本矩阵中至少一个特征向量;特征整合层可以用于对至少一个特征向量进行整合处理,得到整合后的特征向量;输出层由神经网络模型和归一化指数函数构成,可以用于根据整合后的特征向量,计算多级文本分类模型的输出。此外,TextCNN模型的预设个数是根据预先定义的物品级别分类标准设置的。
本发明实施例中,训练模块602还可用于:获取样本物品的样本文本数据,对样本文本数据进行预处理;利用预处理后的样本文本数据,训练词向量模型,将词向量模型作为多级文本分类模型的表示层;根据样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对表示层与特征提取层进行联合训练;联合训练表示层、特征提取层和输出层,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的多级样本分类标签。
本发明实施例中,训练模块602还可用于:将表示层依次与特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的样本文本数据,输出数据为各级样本分类标签中的TextCNN模型对应的级别分类标签。
本发明实施例中,确定模块603还可用于:获取目标物品的目标文本数据,将目标文本数据输入至多级文本分类模型中,输出目标物品对应的多级目标分类标签,多级目标分类标签是目标物品的最后一个级别的分类标签。
从以上描述可以看出,本发明实施例的确定物品的多级分类标签的装置利用样本物品和样本物品的各级样本分类标签构建得到多级文本分类模型,能够充分挖掘类别间的隐藏信息,然后基于构建的多级文本分类模型确定物品的多级分类标签,提高物品分类的准确性。此外,本发明实施例的多级文本分类模型中的特征提取层由多个专用于文本分类的TextCNN模型构成,相当于是由多个子分类器构成,针对多级分类问题上单独构建特征提取器,模型简单且更好的体现多级分类之间的亲疏关系,并且采用TextCNN模型能够提升模型的整体效果,而且增加特征整合层,相当于特征在上层进行了融合,使得下层输出层能够学习各特征之间的关联关系,充分挖掘类间的隐藏信息。因此,本发明实施例的多级文本分类模型的模型简单和结构合理,并且利用本发明实施例的多级文本分类模型确定物品的多级分类标签的准确率高。
图7示出了可以应用本发明实施例的确定物品的多级分类标签的方法或确定物品的多级分类标签的装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的确定物品的多级分类标签的方法一般由服务器705执行,相应地,确定物品的多级分类标签的装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、训练模块和确定模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取样本物品,根据预先定义的物品级别分类标准,获取样本物品对应的各级样本分类标签;对样本物品和样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;获取目标物品,利用多级文本分类模型确定目标物品对应的多级目标分类标签。
根据本发明实施例的技术方案,利用样本物品和样本物品的各级样本分类标签构建得到多级文本分类模型,能够充分挖掘类别间的隐藏信息,然后基于构建的多级文本分类模型确定物品的多级分类标签,提高物品分类的准确性。此外,本发明实施例的多级文本分类模型中的特征提取层由多个专用于文本分类的TextCNN模型构成,相当于是由多个子分类器构成,针对多级分类问题上单独构建特征提取器,模型简单且更好的体现多级分类之间的亲疏关系,并且采用TextCNN模型能够提升模型的整体效果,而且增加特征整合层,相当于特征在上层进行了融合,使得下层输出层能够学习各特征之间的关联关系,充分挖掘类间的隐藏信息。因此,本发明实施例的多级文本分类模型的模型简单和结构合理,并且利用本发明实施例的多级文本分类模型确定物品的多级分类标签的准确率高。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种确定物品的多级分类标签的方法,其特征在于,包括:
获取样本物品,根据预先定义的物品级别分类标准,获取所述样本物品对应的各级样本分类标签;
对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;
获取目标物品,利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签。
2.根据权利要求1所述的方法,其特征在于,所述多级文本分类模型包括:输入层、表示层、特征提取层、特征整合层和输出层;
所述输入层用于输入经过预处理的文本数据,所述预处理包括分词处理、去停用词处理或文本清洗处理;
所述表示层由词向量模型构成,用于将所述输入层的文本数据转化为文本矩阵;
所述特征提取层由预设个数的TextCNN模型构成,用于提取所述文本矩阵中至少一个特征向量,所述预设个数是根据所述预先定义的物品级别分类标准设置的;
所述特征整合层用于对所述至少一个特征向量进行整合处理,得到整合后的特征向量;
所述输出层由神经网络模型和归一化指数函数构成,用于根据所述整合后的特征向量,计算所述多级文本分类模型的输出。
3.根据权利要求2所述的方法,其特征在于,所述对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型,包括:
获取所述样本物品的样本文本数据,对所述样本文本数据进行预处理;
利用预处理后的所述样本文本数据,训练所述词向量模型,将所述词向量模型作为所述多级文本分类模型的表示层;
根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练;
联合训练所述表示层、所述特征提取层和所述输出层,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的多级样本分类标签。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练,包括:
将所述表示层依次与所述特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的所述TextCNN模型对应的级别分类标签。
5.根据权利要求1所述的方法,其特征在于,所述利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签,包括:
获取所述目标物品的目标文本数据,将所述目标文本数据输入至所述多级文本分类模型中,输出所述目标物品对应的多级目标分类标签,所述多级目标分类标签是所述目标物品的最后一个级别的分类标签。
6.一种确定物品的多级分类标签的装置,其特征在于,包括:
获取模块,用于获取样本物品,根据预先定义的物品级别分类标准,获取所述样本物品对应的各级样本分类标签;
训练模块,用于对所述样本物品和所述样本物品对应的各级样本分类标签进行训练,以得到多级文本分类模型;
确定模块,用于获取目标物品,利用所述多级文本分类模型确定所述目标物品对应的多级目标分类标签。
7.根据权利要求6所述的装置,其特征在于,所述多级文本分类模型包括:输入层、表示层、特征提取层、特征整合层和输出层;
所述输入层用于输入经过预处理的文本数据,所述预处理包括分词处理、去停用词处理或文本清洗处理;
所述表示层由词向量模型构成,用于将所述输入层的文本数据转化为文本矩阵;
所述特征提取层由预设个数的TextCNN模型构成,用于提取所述文本矩阵中至少一个特征向量,所述预设个数是根据所述预先定义的物品级别分类标准设置的;
所述特征整合层用于对所述至少一个特征向量进行整合处理,得到整合后的特征向量;
所述输出层由神经网络模型和归一化指数函数构成,用于根据所述整合后的特征向量,计算所述多级文本分类模型的输出。
8.根据权利要求7所述的装置,其特征在于,所述训练模块还用于:
获取所述样本物品的样本文本数据,对所述样本文本数据进行预处理;
利用预处理后的所述样本文本数据,训练所述词向量模型,将所述词向量模型作为所述多级文本分类模型的表示层;
根据所述样本物品对应的各级样本分类标签,采用多任务学习的训练方式,对所述表示层与所述特征提取层进行联合训练;
联合训练所述表示层、所述特征提取层和所述输出层,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的多级样本分类标签。
9.根据权利要求8所述的装置,其特征在于,所述训练模块还用于:
将所述表示层依次与所述特征提取层中的每一个TextCNN模型进行联合训练,输入数据为预处理后的所述样本文本数据,输出数据为所述各级样本分类标签中的所述TextCNN模型对应的级别分类标签。
10.根据权利要求6所述的装置,其特征在于,所述确定模块还用于:
获取所述目标物品的目标文本数据,将所述目标文本数据输入至所述多级文本分类模型中,输出所述目标物品对应的多级目标分类标签,所述多级目标分类标签是所述目标物品的最后一个级别的分类标签。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202010047471.3A 2020-01-16 2020-01-16 确定物品的多级分类标签的方法和装置 Active CN113139558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047471.3A CN113139558B (zh) 2020-01-16 2020-01-16 确定物品的多级分类标签的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047471.3A CN113139558B (zh) 2020-01-16 2020-01-16 确定物品的多级分类标签的方法和装置

Publications (2)

Publication Number Publication Date
CN113139558A true CN113139558A (zh) 2021-07-20
CN113139558B CN113139558B (zh) 2023-09-05

Family

ID=76808509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047471.3A Active CN113139558B (zh) 2020-01-16 2020-01-16 确定物品的多级分类标签的方法和装置

Country Status (1)

Country Link
CN (1) CN113139558B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284359A (zh) * 2021-07-22 2021-08-20 腾讯科技(深圳)有限公司 车位推荐方法、装置、设备及计算机可读存储介质
TWI796880B (zh) * 2021-12-20 2023-03-21 賴綺珊 以人工智慧輔助之產品問題分析系統、方法及其儲存媒體

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070183655A1 (en) * 2006-02-09 2007-08-09 Microsoft Corporation Reducing human overhead in text categorization
CN106909654A (zh) * 2017-02-24 2017-06-30 北京时间股份有限公司 一种基于新闻文本信息的多级分类系统及方法
US20170308790A1 (en) * 2016-04-21 2017-10-26 International Business Machines Corporation Text classification by ranking with convolutional neural networks
CN108073677A (zh) * 2017-11-02 2018-05-25 中国科学院信息工程研究所 一种基于人工智能的多级文本多标签分类方法及系统
US20190171913A1 (en) * 2017-12-04 2019-06-06 Slice Technologies, Inc. Hierarchical classification using neural networks
CN109871444A (zh) * 2019-01-16 2019-06-11 北京邮电大学 一种文本分类方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070183655A1 (en) * 2006-02-09 2007-08-09 Microsoft Corporation Reducing human overhead in text categorization
US20170308790A1 (en) * 2016-04-21 2017-10-26 International Business Machines Corporation Text classification by ranking with convolutional neural networks
CN106909654A (zh) * 2017-02-24 2017-06-30 北京时间股份有限公司 一种基于新闻文本信息的多级分类系统及方法
CN108073677A (zh) * 2017-11-02 2018-05-25 中国科学院信息工程研究所 一种基于人工智能的多级文本多标签分类方法及系统
US20190171913A1 (en) * 2017-12-04 2019-06-06 Slice Technologies, Inc. Hierarchical classification using neural networks
CN109871444A (zh) * 2019-01-16 2019-06-11 北京邮电大学 一种文本分类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯梦莹;李红;: "文本卷积神经网络模型在短文本多分类中的应用", 金融科技时代, no. 01 *
江海戬;辛立强;: "卷积神经网络在博客多标签中的应用", 工业控制计算机, no. 12 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284359A (zh) * 2021-07-22 2021-08-20 腾讯科技(深圳)有限公司 车位推荐方法、装置、设备及计算机可读存储介质
TWI796880B (zh) * 2021-12-20 2023-03-21 賴綺珊 以人工智慧輔助之產品問題分析系統、方法及其儲存媒體

Also Published As

Publication number Publication date
CN113139558B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN110019732B (zh) 一种智能问答方法以及相关装置
CN110427623A (zh) 半结构化文档知识抽取方法、装置、电子设备及存储介质
CN110826335B (zh) 一种命名实体识别的方法和装置
CN110598078B (zh) 数据检索方法及装置、计算机可读存储介质、电子设备
CN114549874A (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
CN111459977A (zh) 自然语言查询的转换
CN113268560A (zh) 用于文本匹配的方法和装置
CN114861889A (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN113988157A (zh) 语义检索网络训练方法、装置、电子设备及存储介质
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
CN111753029A (zh) 实体关系抽取方法、装置
CN116028618A (zh) 文本处理、文本检索方法、装置、电子设备及存储介质
CN113139558A (zh) 确定物品的多级分类标签的方法和装置
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN114036921A (zh) 一种政策信息匹配方法和装置
CN109902152B (zh) 用于检索信息的方法和装置
CN117114063A (zh) 用于训练生成式大语言模型和用于处理图像任务的方法
CN112948561B (zh) 一种问答知识库自动扩建的方法和装置
CN114048315A (zh) 确定文档标签的方法、装置、电子设备和存储介质
CN111428486B (zh) 物品信息数据处理方法、装置、介质及电子设备
CN113806541A (zh) 情感分类的方法和情感分类模型的训练方法、装置
CN112784600A (zh) 信息排序方法、装置、电子设备和存储介质
CN112270189A (zh) 一种提问式的分析节点生成方法、系统及存储介质
CN111274383A (zh) 一种应用于报价的分类对象方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant