CN109308319A

CN109308319A - 文本分类方法、文本分类装置和计算机可读存储介质

Info

Publication number: CN109308319A
Application number: CN201810954835.9A
Authority: CN
Inventors: 欧阳村; 欧阳一村; 程源泉
Original assignee: ZTE ICT Technologies Co Ltd
Current assignee: ZTE ICT Technologies Co Ltd
Priority date: 2018-08-21
Filing date: 2018-08-21
Publication date: 2019-02-05
Anticipated expiration: 2038-08-21
Also published as: CN109308319B

Abstract

本发明提出了一种文本分类方法、文本分类装置和计算机可读存储介质。其中，文本分类方法包括：采集文本信息数据；将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果；迭代优化联合匹配结果，以输出文本信息数据的分类预测结果。本发明基于sigmoid函数的卷积神经网络分类模型对文本进行分类，使得输出概率更加平滑，避免了出现互斥的现象，分类预测结果不但有问题标签还有答案标签，实现多维多标签的分类预测，相比问题‑问题分类问答具有更高的准确率。

Description

文本分类方法、文本分类装置和计算机可读存储介质

技术领域

本发明涉及文本分类技术领域，具体而言，涉及一种文本分类方法、文本分类装置和计算机可读存储介质。

背景技术

相关技术中，文本分类运用的是softmax分类器(一种损失函数运用softmax函数的分类器)，但softmax函数有严重的问题是softmax分类输出的概率(0～1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中，一条数据即是社保类别又是征缴业务类别，所以很难用单一类别判断数据。Softmax分类器原本用于卷积神经网络图像识别，需要对1000个label(标签)输出确定类别，如今问题更加复杂，单一的互斥网络不能适用于越发复杂的智能系统和工业运用。可见，相关技术中是对分类问题的单label分类，但单标签会出现分类不够清晰的情况，只能对事物的一方面分类，比如图像分类中只能对猫狗进行分类，却不能对动物颜色，大小进行分类，比较片面。在复杂的文本分类中更是无法达到效果，自然语言本身高度抽象，多义性，依赖上下文，需要世界知识使得语句意义模糊不清，不是一次分类就能分类完全的。另外，相关技术的问答系统中都是对问题进行匹配，寻找问题对应的答案，输出答案。

发明内容

本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此，本发明第一个方面在于提出一种文本分类方法。

本发明的第二个方面在于提出一种文本分类装置。

本发明的第三个方面在于提出一种计算机可读存储介质。

有鉴于此，根据本发明的一个方面，提出了一种文本分类方法，包括：采集文本信息数据；将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果；迭代优化联合匹配结果，以输出文本信息数据的分类预测结果。

本发明提供的文本分类方法，采集文本信息数据，从真实场景中收集，将文本信息数据输入至基于sigmoid函数(S型生长曲线，用作神经网络的阈值函数)的卷积神经网络分类模型，基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数，sigmoid函数是0～1分布的非饱和光滑曲线，使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀，避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果，迭代优化，最终输出分类预测结果，对问题和答案复合匹配，分类预测结果不但有问题标签还有答案标签，实现多维多标签的分类预测，相比问题-问题分类问答具有更高的准确率。

根据本发明的上述文本分类方法，还可以具有以下技术特征：

在上述技术方案中，优选地，应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果，具体包括：将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签；将问题标签和答案标签作为联合匹配结果；其中，预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

在该技术方案中，应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果过程中，将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签，匹配过程不仅对对话问题和数据库问题进行分类匹配，也对对话问题和数据库答案进行分类匹配，问题相对答案来说比较少，答案句子比问题要长，更易提取特征。另外预设维度的匹配包括：匹配关键词，词性类别，语义深度学习网络，以及同义模糊匹配。因此，所以最后输出不仅有问题标签，还有答案标签等，提高了多维多标签对分类问题准确率。

在上述任一技术方案中，优选地，在迭代优化联合匹配结果，以输出文本信息数据的分类预测结果之后，还包括：将分类预测结果与预存文本信息数据对应的分类结果比对，获得比对结果参数；根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。

在该技术方案中，在得到分类预测结果之后，将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对，获取比对结果参数，再根据比对结果参数对本次分类预测结果进行评价，或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时，根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型，即不断训练模型，使分类预测更加准确、更加符合用户要求。

在上述任一技术方案中，优选地，比对结果参数包括：准确率、召回率、精度、F1分数。

在该技术方案中，通过上述比对结果参数对分类预测结果进行评价，即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价，为优化模型提供依据。

在上述任一技术方案中，优选地，还包括：将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储基于sigmoid函数的卷积神经网络分类模型。

在该技术方案中，将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数，若已存的卷积神经网络分类模型的损失函数为softmax函数，将softmax函数替换为sigmoid函数，如此，获取本发明中的基于sigmoid函数的卷积神经网络分类模型，使得输出的概率不互斥，输出更加平滑、均匀。

根据本发明的第二个方面，提出了一种文本分类装置，包括：存储器，用于存储计算机程序；处理器，用于执行计算机程序以：采集文本信息数据；将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果；迭代优化联合匹配结果，以输出文本信息数据的分类预测结果。

本发明提供的文本分类装置，存储器存储计算机程序；处理器执行计算机程序时，采集文本信息数据，从真实场景中收集，将文本信息数据输入至基于sigmoid函数(S型生长曲线，用作神经网络的阈值函数)的卷积神经网络分类模型，基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数，sigmoid函数是0～1分布的非饱和光滑曲线，使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀，避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果，迭代优化，最终输出分类预测结果，对问题和答案复合匹配，分类预测结果不但有问题标签还有答案标签，实现多维多标签的分类预测，相比问题-问题分类问答具有更高的准确率。

根据本发明的上述文本分类装置，还可以具有以下技术特征：

在上述技术方案中，优选地，处理器具体用于执行计算机程序以：将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签；将多个问题标签和多个答案标签作为联合匹配结果；其中，预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

在上述任一技术方案中，优选地，处理器还用于执行计算机程序以：将分类预测结果与预存文本信息数据对应的分类结果比对，获得比对结果参数；根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。

在上述任一技术方案中，优选地，处理器还用于执行计算机程序以：将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储基于sigmoid函数的卷积神经网络分类模型。

根据本发明的第三个方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一技术方案中文本分类方法的步骤。

本发明提供的一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一技术方案中文本分类方法的步骤，因此具有该文本分类方法的全部技术效果，在此不再赘述。

本发明的附加方面和优点将在下面的描述部分中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1示出了本发明的一个实施例的文本分类方法的流程示意图；

图2示出了本发明的另一个实施例的文本分类方法的流程示意图；

图3示出了本发明的再一个实施例的文本分类方法的流程示意图；

图4示出了本发明的又一个实施例的文本分类方法的流程示意图；

图5示出了本发明的一个实施例的文本分类装置的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述方面、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不限于下面公开的具体实施例的限制。

本发明第一方面的实施例，提出一种空调器室外风机的控制方法，图1示出了本发明的一个实施例的文本分类方法的流程示意图。如图1所示，该方法包括：

步骤102，采集文本信息数据；

步骤104，将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；

步骤106，应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果；

步骤108，迭代优化联合匹配结果，以输出文本信息数据的分类预测结果。

在上述实施例中，优选地，步骤106具体包括：将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签；将问题标签和答案标签作为联合匹配结果；其中，预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

在该实施例中，应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果过程中，将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签，匹配过程不仅对对话问题和数据库问题进行分类匹配，也对对话问题和数据库答案进行分类匹配，问题相对答案来说比较少，答案句子比问题要长，更易提取特征。另外预设维度的匹配包括：匹配关键词，词性类别，语义深度学习网络，以及同义模糊匹配。因此，所以最后输出不仅有问题标签，还有答案标签等，提高了多维多标签对分类问题准确率。

图2示出了本发明的另一个实施例的文本分类方法的流程示意图。其中，该方法包括：

步骤202，采集文本信息数据；

步骤204，将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；

步骤206，将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签，将问题标签和答案标签作为联合匹配结果；

步骤208，迭代优化联合匹配结果，以输出文本信息数据的分类预测结果；

步骤210，将分类预测结果与预存文本信息数据对应的分类结果比对，获得比对结果参数；

步骤212，根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。

其中，预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

在该实施例中，在得到分类预测结果之后，将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对，获取比对结果参数，再根据比对结果参数对本次分类预测结果进行评价，或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时，根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型，即不断训练模型，使分类预测更加准确、更加符合用户要求。

图3示出了本发明的再一个实施例的文本分类方法的流程示意图。其中，该方法包括：

步骤302，将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储基于sigmoid函数的卷积神经网络分类模型；

步骤304，采集文本信息数据；

步骤306，将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；

步骤308，将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签，将问题标签和答案标签作为联合匹配结果；

步骤310，迭代优化联合匹配结果，以输出文本信息数据的分类预测结果；

步骤312，将分类预测结果与预存文本信息数据对应的分类结果比对，获得比对结果参数；

步骤314，根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。

在该实施例中，将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数，若已存的卷积神经网络分类模型的损失函数为softmax函数，将softmax函数替换为sigmoid函数，如此，获取本发明中的基于sigmoid函数的卷积神经网络分类模型，使得输出的概率不互斥，输出更加平滑、均匀。其中，可以根据需要，将步骤302和步骤304执行顺序对调，即先采集文本信息数据，在需要将采集信息输入模型时，再进行将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储基于sigmoid函数的卷积神经网络分类模型，以使采集文本信息数据输入值基于sigmoid函数的卷积神经网络分类模型。

在上述任一实施例中，优选地，比对结果参数包括：准确率、召回率、精度、F1分数。

在该实施例中，通过上述比对结果参数对分类预测结果进行评价，即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价，为优化模型提供依据。

图4示出了本发明的又一个实施例的文本分类方法的流程示意图。其中，该方法包括：

步骤402，收集数据，从真实场景采集；

步骤404，选择CNN文本分类模型，并对其修改优化；

步骤406，调整softmax损失函数为sigmoid损失函数；

步骤408，用多维多标签，对问题与答案联合匹配；

步骤410，优化迭代至出结果，比较预测数据得准确率。

其中，CNN为卷积神经网络(Convolutional Neural Network)。

该实施例中，选取模型时，选取CNN模型用于文本分类，对CNN模型进行改进优化达到想要的效果。原CNN模型用的是softmax分类器，损失函数运用softmax函数。但softmax函数有严重的问题是softmax分类输出的概率(0～1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中，一条数据即是社保类别又是征缴业务类别，所以很难用单一类别判断数据。该实施例中选择sigmoid函数作为损失函数，sigmoid是0～1分布的非饱和光滑曲线，这样分类器输出概率更加平滑，均匀，不会出现互斥的现象。该实施例中把softmax分类器改造成sigmoid非互斥分类器，运用sigmoid损失函数训练，替代原有softmax交叉熵函数，使得输出概率更加平滑，不会再出现互斥的现象。在该实施例中，输出结果为多维多标签多任务的方法，多维label表示不仅对物品分类一次，而是进行多次分类。比如政务文本分类中，先对医保，社保，生育保险分类一次，再对时间，地点，人物分类一次，最后对怎么做，为什么做，做什么分类一次。这样就形成多维多标签分类结构，更加准确。在该实施例中，不仅对对话问题和数据库问题进行分类匹配，也对对话问题和数据库答案进行分类匹配。相关技术中只对问题进行相似度匹配，输出最高的几个答案。而该实施例对答案进行匹配，匹配关键词，词性类别，语义深度学习网络，以及同义模糊匹配。对答案复合匹配，所以该实施例最后不仅有问题标签，还有答案标签等，多维多标签对分类问题进行试验，和原有问题-问题分类问答进行ensumble(集成学习方法)混合模型，远远提高分类问题准确率。

在该实施例中，对话数据从真实场景采集成段，每段对话由问题与答案两方面输入CNN网络，输出多label结果，比对预测数据，查看准确率，F1，召回率等值。运用sigmoid函数代替softmax函数，使得输出非互斥结果。但在变形方案中，修改softmax函数的数值，其中，softmax函数如下：

当改变e的指数函数，改成log(e)对数函数，使得结果不互斥。比初始方法优秀，但想法过于抽象。导致效果比预期要差，也比sigmoid损失函数方法差许多。本发明的实施例对多角度(问题与答案)多维label(多层判断标准)的分类，可以引入更多的信息，进一步提高分类准确率。

本发明第二方面的实施例，提出一种文本分类装置500，图5示出了本发明的一个实施例的文本分类装置500的示意框图。如图5所示，文本分类装置500包括：存储器502，用于存储计算机程序；处理器504，用于执行计算机程序以：采集文本信息数据；将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取文本信息数据的问题特征和答案特征；应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果；迭代优化联合匹配结果，以输出文本信息数据的分类预测结果。

本发明提供的文本分类装置500，存储器502存储计算机程序；处理器504执行计算机程序时，采集文本信息数据，从真实场景中收集，将文本信息数据输入至基于sigmoid函数(S型生长曲线，用作神经网络的阈值函数)的卷积神经网络分类模型，基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数，sigmoid函数是0～1分布的非饱和光滑曲线，使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀，避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配，得到联合匹配结果，迭代优化，最终输出分类预测结果，对问题和答案复合匹配，分类预测结果不但有问题标签还有答案标签，实现多维多标签的分类预测，相比问题-问题分类问答具有更高的准确率。

在上述实施例中，优选地，处理器504具体用于执行计算机程序以：将问题特征和答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签；将多个问题标签和多个答案标签作为联合匹配结果；其中，预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

在上述任一实施例中，优选地，处理器504还用于执行计算机程序以：将分类预测结果与预存文本信息数据对应的分类结果比对，获得比对结果参数；根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。

在上述任一实施例中，优选地，处理器504还用于执行计算机程序以：将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储基于sigmoid函数的卷积神经网络分类模型。

在该实施例中，将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数，若已存的卷积神经网络分类模型的损失函数为softmax函数，将softmax函数替换为sigmoid函数，如此，获取本发明中的基于sigmoid函数的卷积神经网络分类模型，使得输出的概率不互斥，输出更加平滑、均匀。

本发明第三方面的实施例，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一实施例中文本分类方法的步骤。

本发明提供的一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一实施例中文本分类方法的步骤，因此具有该文本分类方法的全部技术效果，在此不再赘述。

在本说明书的描述中，术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或实例。而且，描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种文本分类方法，其特征在于，包括：

采集文本信息数据；

将所述文本信息数据输入基于sigmoid函数的卷积神经网络分类模型，提取所述文本信息数据的问题特征和答案特征；

将所述问题特征和所述答案特征输入基于sigmoid函数的卷积神经网络分类模型；

应用多维度多标签对所述问题特征和所述答案特征联合匹配，得到联合匹配结果；

迭代优化所述联合匹配结果，以输出所述文本信息数据的分类预测结果。

2.根据权利要求1所述的文本分类方法，其特征在于，所述应用多维度多标签对所述问题特征和所述答案特征联合匹配，得到联合匹配结果，具体包括：

将所述问题特征和所述答案特征分别以预设维度进行分类匹配，获得问题标签和答案标签；

将所述问题标签和所述答案标签作为所述联合匹配结果；

其中，所述预设维度包括以下一种或其组合：关键词、词性类别、语义、同义词。

3.根据权利要求1所述的文本分类方法，其特征在于，在所述迭代优化所述联合匹配结果，以输出所述文本信息数据的分类预测结果之后，还包括：

将所述分类预测结果与预存所述文本信息数据对应的分类结果比对，获得比对结果参数；

根据所述比对结果参数的值对所述分类预测结果进行评价和/或优化所述基于sigmoid函数的卷积神经网络分类模型。

4.根据权利要求3所述的文本分类方法，其特征在于，所述比对结果参数包括：准确率、召回率、精度、F1分数。

5.根据权利要求1至4中任一项所述的文本分类方法，其特征在于，还包括：

将已存卷积神经网络分类模型中损失函数调整为sigmoid函数，获取并存储所述基于sigmoid函数的卷积神经网络分类模型。

6.一种文本分类装置，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序以：

采集文本信息数据；

7.根据权利要求6所述的文本分类装置，其特征在于，所述处理器具体用于执行所述计算机程序以：

将所述多个问题标签和所述多个答案标签作为所述联合匹配结果；

8.根据权利要求7所述的文本分类装置，其特征在于，所述处理器还用于执行所述计算机程序以：

9.根据权利要求8所述的文本分类装置，其特征在于，所述比对结果参数包括：准确率、召回率、精度、F1分数。

10.根据权利要求6至9中任一项所述的文本分类装置，其特征在于，所述处理器还用于执行所述计算机程序以：

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述文本分类方法的步骤。