CN109308319A - 文本分类方法、文本分类装置和计算机可读存储介质 - Google Patents
文本分类方法、文本分类装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN109308319A CN109308319A CN201810954835.9A CN201810954835A CN109308319A CN 109308319 A CN109308319 A CN 109308319A CN 201810954835 A CN201810954835 A CN 201810954835A CN 109308319 A CN109308319 A CN 109308319A
- Authority
- CN
- China
- Prior art keywords
- classification
- answer
- information data
- text information
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 68
- 238000005457 optimization Methods 0.000 claims abstract description 21
- 239000000284 extract Substances 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 115
- 238000004590 computer program Methods 0.000 claims description 25
- 235000013399 edible fruits Nutrition 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 2
- 235000008434 ginseng Nutrition 0.000 claims 2
- 230000007717 exclusion Effects 0.000 abstract description 15
- 238000010586 diagram Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种文本分类方法、文本分类装置和计算机可读存储介质。其中,文本分类方法包括:采集文本信息数据;将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果;迭代优化联合匹配结果,以输出文本信息数据的分类预测结果。本发明基于sigmoid函数的卷积神经网络分类模型对文本进行分类,使得输出概率更加平滑,避免了出现互斥的现象,分类预测结果不但有问题标签还有答案标签,实现多维多标签的分类预测,相比问题‑问题分类问答具有更高的准确率。
Description
技术领域
本发明涉及文本分类技术领域,具体而言,涉及一种文本分类方法、文本分类装置和计算机可读存储介质。
背景技术
相关技术中,文本分类运用的是softmax分类器(一种损失函数运用softmax函数的分类器),但softmax函数有严重的问题是softmax分类输出的概率(0~1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中,一条数据即是社保类别又是征缴业务类别,所以很难用单一类别判断数据。Softmax分类器原本用于卷积神经网络图像识别,需要对1000个label(标签)输出确定类别,如今问题更加复杂,单一的互斥网络不能适用于越发复杂的智能系统和工业运用。可见,相关技术中是对分类问题的单label分类,但单标签会出现分类不够清晰的情况,只能对事物的一方面分类,比如图像分类中只能对猫狗进行分类,却不能对动物颜色,大小进行分类,比较片面。在复杂的文本分类中更是无法达到效果,自然语言本身高度抽象,多义性,依赖上下文,需要世界知识使得语句意义模糊不清,不是一次分类就能分类完全的。另外,相关技术的问答系统中都是对问题进行匹配,寻找问题对应的答案,输出答案。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明第一个方面在于提出一种文本分类方法。
本发明的第二个方面在于提出一种文本分类装置。
本发明的第三个方面在于提出一种计算机可读存储介质。
有鉴于此,根据本发明的一个方面,提出了一种文本分类方法,包括:采集文本信息数据;将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果;迭代优化联合匹配结果,以输出文本信息数据的分类预测结果。
本发明提供的文本分类方法,采集文本信息数据,从真实场景中收集,将文本信息数据输入至基于sigmoid函数(S型生长曲线,用作神经网络的阈值函数)的卷积神经网络分类模型,基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数,sigmoid函数是0~1分布的非饱和光滑曲线,使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀,避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果,迭代优化,最终输出分类预测结果,对问题和答案复合匹配,分类预测结果不但有问题标签还有答案标签,实现多维多标签的分类预测,相比问题-问题分类问答具有更高的准确率。
根据本发明的上述文本分类方法,还可以具有以下技术特征:
在上述技术方案中,优选地,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果,具体包括:将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;将问题标签和答案标签作为联合匹配结果;其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该技术方案中,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果过程中,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,匹配过程不仅对对话问题和数据库问题进行分类匹配,也对对话问题和数据库答案进行分类匹配,问题相对答案来说比较少,答案句子比问题要长,更易提取特征。另外预设维度的匹配包括:匹配关键词,词性类别,语义深度学习网络,以及同义模糊匹配。因此,所以最后输出不仅有问题标签,还有答案标签等,提高了多维多标签对分类问题准确率。
在上述任一技术方案中,优选地,在迭代优化联合匹配结果,以输出文本信息数据的分类预测结果之后,还包括:将分类预测结果与预存文本信息数据对应的分类结果比对,获得比对结果参数;根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。
在该技术方案中,在得到分类预测结果之后,将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对,获取比对结果参数,再根据比对结果参数对本次分类预测结果进行评价,或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时,根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型,即不断训练模型,使分类预测更加准确、更加符合用户要求。
在上述任一技术方案中,优选地,比对结果参数包括:准确率、召回率、精度、F1分数。
在该技术方案中,通过上述比对结果参数对分类预测结果进行评价,即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价,为优化模型提供依据。
在上述任一技术方案中,优选地,还包括:将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储基于sigmoid函数的卷积神经网络分类模型。
在该技术方案中,将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数,若已存的卷积神经网络分类模型的损失函数为softmax函数,将softmax函数替换为sigmoid函数,如此,获取本发明中的基于sigmoid函数的卷积神经网络分类模型,使得输出的概率不互斥,输出更加平滑、均匀。
根据本发明的第二个方面,提出了一种文本分类装置,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序以:采集文本信息数据;将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果;迭代优化联合匹配结果,以输出文本信息数据的分类预测结果。
本发明提供的文本分类装置,存储器存储计算机程序;处理器执行计算机程序时,采集文本信息数据,从真实场景中收集,将文本信息数据输入至基于sigmoid函数(S型生长曲线,用作神经网络的阈值函数)的卷积神经网络分类模型,基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数,sigmoid函数是0~1分布的非饱和光滑曲线,使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀,避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果,迭代优化,最终输出分类预测结果,对问题和答案复合匹配,分类预测结果不但有问题标签还有答案标签,实现多维多标签的分类预测,相比问题-问题分类问答具有更高的准确率。
根据本发明的上述文本分类装置,还可以具有以下技术特征:
在上述技术方案中,优选地,处理器具体用于执行计算机程序以:将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;将多个问题标签和多个答案标签作为联合匹配结果;其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该技术方案中,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果过程中,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,匹配过程不仅对对话问题和数据库问题进行分类匹配,也对对话问题和数据库答案进行分类匹配,问题相对答案来说比较少,答案句子比问题要长,更易提取特征。另外预设维度的匹配包括:匹配关键词,词性类别,语义深度学习网络,以及同义模糊匹配。因此,所以最后输出不仅有问题标签,还有答案标签等,提高了多维多标签对分类问题准确率。
在上述任一技术方案中,优选地,处理器还用于执行计算机程序以:将分类预测结果与预存文本信息数据对应的分类结果比对,获得比对结果参数;根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。
在该技术方案中,在得到分类预测结果之后,将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对,获取比对结果参数,再根据比对结果参数对本次分类预测结果进行评价,或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时,根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型,即不断训练模型,使分类预测更加准确、更加符合用户要求。
在上述任一技术方案中,优选地,比对结果参数包括:准确率、召回率、精度、F1分数。
在该技术方案中,通过上述比对结果参数对分类预测结果进行评价,即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价,为优化模型提供依据。
在上述任一技术方案中,优选地,处理器还用于执行计算机程序以:将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储基于sigmoid函数的卷积神经网络分类模型。
在该技术方案中,将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数,若已存的卷积神经网络分类模型的损失函数为softmax函数,将softmax函数替换为sigmoid函数,如此,获取本发明中的基于sigmoid函数的卷积神经网络分类模型,使得输出的概率不互斥,输出更加平滑、均匀。
根据本发明的第三个方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一技术方案中文本分类方法的步骤。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一技术方案中文本分类方法的步骤,因此具有该文本分类方法的全部技术效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明的一个实施例的文本分类方法的流程示意图;
图2示出了本发明的另一个实施例的文本分类方法的流程示意图;
图3示出了本发明的再一个实施例的文本分类方法的流程示意图;
图4示出了本发明的又一个实施例的文本分类方法的流程示意图;
图5示出了本发明的一个实施例的文本分类装置的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述方面、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
本发明第一方面的实施例,提出一种空调器室外风机的控制方法,图1示出了本发明的一个实施例的文本分类方法的流程示意图。如图1所示,该方法包括:
步骤102,采集文本信息数据;
步骤104,将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;
步骤106,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果;
步骤108,迭代优化联合匹配结果,以输出文本信息数据的分类预测结果。
本发明提供的文本分类方法,采集文本信息数据,从真实场景中收集,将文本信息数据输入至基于sigmoid函数(S型生长曲线,用作神经网络的阈值函数)的卷积神经网络分类模型,基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数,sigmoid函数是0~1分布的非饱和光滑曲线,使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀,避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果,迭代优化,最终输出分类预测结果,对问题和答案复合匹配,分类预测结果不但有问题标签还有答案标签,实现多维多标签的分类预测,相比问题-问题分类问答具有更高的准确率。
在上述实施例中,优选地,步骤106具体包括:将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;将问题标签和答案标签作为联合匹配结果;其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该实施例中,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果过程中,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,匹配过程不仅对对话问题和数据库问题进行分类匹配,也对对话问题和数据库答案进行分类匹配,问题相对答案来说比较少,答案句子比问题要长,更易提取特征。另外预设维度的匹配包括:匹配关键词,词性类别,语义深度学习网络,以及同义模糊匹配。因此,所以最后输出不仅有问题标签,还有答案标签等,提高了多维多标签对分类问题准确率。
图2示出了本发明的另一个实施例的文本分类方法的流程示意图。其中,该方法包括:
步骤202,采集文本信息数据;
步骤204,将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;
步骤206,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,将问题标签和答案标签作为联合匹配结果;
步骤208,迭代优化联合匹配结果,以输出文本信息数据的分类预测结果;
步骤210,将分类预测结果与预存文本信息数据对应的分类结果比对,获得比对结果参数;
步骤212,根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。
其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该实施例中,在得到分类预测结果之后,将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对,获取比对结果参数,再根据比对结果参数对本次分类预测结果进行评价,或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时,根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型,即不断训练模型,使分类预测更加准确、更加符合用户要求。
图3示出了本发明的再一个实施例的文本分类方法的流程示意图。其中,该方法包括:
步骤302,将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储基于sigmoid函数的卷积神经网络分类模型;
步骤304,采集文本信息数据;
步骤306,将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;
步骤308,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,将问题标签和答案标签作为联合匹配结果;
步骤310,迭代优化联合匹配结果,以输出文本信息数据的分类预测结果;
步骤312,将分类预测结果与预存文本信息数据对应的分类结果比对,获得比对结果参数;
步骤314,根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。
其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该实施例中,将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数,若已存的卷积神经网络分类模型的损失函数为softmax函数,将softmax函数替换为sigmoid函数,如此,获取本发明中的基于sigmoid函数的卷积神经网络分类模型,使得输出的概率不互斥,输出更加平滑、均匀。其中,可以根据需要,将步骤302和步骤304执行顺序对调,即先采集文本信息数据,在需要将采集信息输入模型时,再进行将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储基于sigmoid函数的卷积神经网络分类模型,以使采集文本信息数据输入值基于sigmoid函数的卷积神经网络分类模型。
在上述任一实施例中,优选地,比对结果参数包括:准确率、召回率、精度、F1分数。
在该实施例中,通过上述比对结果参数对分类预测结果进行评价,即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价,为优化模型提供依据。
图4示出了本发明的又一个实施例的文本分类方法的流程示意图。其中,该方法包括:
步骤402,收集数据,从真实场景采集;
步骤404,选择CNN文本分类模型,并对其修改优化;
步骤406,调整softmax损失函数为sigmoid损失函数;
步骤408,用多维多标签,对问题与答案联合匹配;
步骤410,优化迭代至出结果,比较预测数据得准确率。
其中,CNN为卷积神经网络(Convolutional Neural Network)。
该实施例中,选取模型时,选取CNN模型用于文本分类,对CNN模型进行改进优化达到想要的效果。原CNN模型用的是softmax分类器,损失函数运用softmax函数。但softmax函数有严重的问题是softmax分类输出的概率(0~1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中,一条数据即是社保类别又是征缴业务类别,所以很难用单一类别判断数据。该实施例中选择sigmoid函数作为损失函数,sigmoid是0~1分布的非饱和光滑曲线,这样分类器输出概率更加平滑,均匀,不会出现互斥的现象。该实施例中把softmax分类器改造成sigmoid非互斥分类器,运用sigmoid损失函数训练,替代原有softmax交叉熵函数,使得输出概率更加平滑,不会再出现互斥的现象。在该实施例中,输出结果为多维多标签多任务的方法,多维label表示不仅对物品分类一次,而是进行多次分类。比如政务文本分类中,先对医保,社保,生育保险分类一次,再对时间,地点,人物分类一次,最后对怎么做,为什么做,做什么分类一次。这样就形成多维多标签分类结构,更加准确。在该实施例中,不仅对对话问题和数据库问题进行分类匹配,也对对话问题和数据库答案进行分类匹配。相关技术中只对问题进行相似度匹配,输出最高的几个答案。而该实施例对答案进行匹配,匹配关键词,词性类别,语义深度学习网络,以及同义模糊匹配。对答案复合匹配,所以该实施例最后不仅有问题标签,还有答案标签等,多维多标签对分类问题进行试验,和原有问题-问题分类问答进行ensumble(集成学习方法)混合模型,远远提高分类问题准确率。
在该实施例中,对话数据从真实场景采集成段,每段对话由问题与答案两方面输入CNN网络,输出多label结果,比对预测数据,查看准确率,F1,召回率等值。运用sigmoid函数代替softmax函数,使得输出非互斥结果。但在变形方案中,修改softmax函数的数值,其中,softmax函数如下:
当改变e的指数函数,改成log(e)对数函数,使得结果不互斥。比初始方法优秀,但想法过于抽象。导致效果比预期要差,也比sigmoid损失函数方法差许多。本发明的实施例对多角度(问题与答案)多维label(多层判断标准)的分类,可以引入更多的信息,进一步提高分类准确率。
本发明第二方面的实施例,提出一种文本分类装置500,图5示出了本发明的一个实施例的文本分类装置500的示意框图。如图5所示,文本分类装置500包括:存储器502,用于存储计算机程序;处理器504,用于执行计算机程序以:采集文本信息数据;将文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取文本信息数据的问题特征和答案特征;应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果;迭代优化联合匹配结果,以输出文本信息数据的分类预测结果。
本发明提供的文本分类装置500,存储器502存储计算机程序;处理器504执行计算机程序时,采集文本信息数据,从真实场景中收集,将文本信息数据输入至基于sigmoid函数(S型生长曲线,用作神经网络的阈值函数)的卷积神经网络分类模型,基于sigmoid函数的卷积神经网络分类模型中将sigmoid函数作为损失函数,sigmoid函数是0~1分布的非饱和光滑曲线,使得基于sigmoid函数的卷积神经网络分类模型的输出概率更加平滑、均匀,避免了出现互斥的现象。然后应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果,迭代优化,最终输出分类预测结果,对问题和答案复合匹配,分类预测结果不但有问题标签还有答案标签,实现多维多标签的分类预测,相比问题-问题分类问答具有更高的准确率。
在上述实施例中,优选地,处理器504具体用于执行计算机程序以:将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;将多个问题标签和多个答案标签作为联合匹配结果;其中,预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
在该实施例中,应用多维度多标签对问题特征和答案特征联合匹配,得到联合匹配结果过程中,将问题特征和答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签,匹配过程不仅对对话问题和数据库问题进行分类匹配,也对对话问题和数据库答案进行分类匹配,问题相对答案来说比较少,答案句子比问题要长,更易提取特征。另外预设维度的匹配包括:匹配关键词,词性类别,语义深度学习网络,以及同义模糊匹配。因此,所以最后输出不仅有问题标签,还有答案标签等,提高了多维多标签对分类问题准确率。
在上述任一实施例中,优选地,处理器504还用于执行计算机程序以:将分类预测结果与预存文本信息数据对应的分类结果比对,获得比对结果参数;根据比对结果参数的值对分类预测结果进行评价和/或优化基于sigmoid函数的卷积神经网络分类模型。
在该实施例中,在得到分类预测结果之后,将模型输出的分类预测结果与已标记的预存储的文本信息数据对应的正确分类结果进行比对,获取比对结果参数,再根据比对结果参数对本次分类预测结果进行评价,或是在本次分类预测结果某些参数上不理想的情况下或是不满足要求时,根据比对结果参数优化基于sigmoid函数的卷积神经网络分类模型,即不断训练模型,使分类预测更加准确、更加符合用户要求。
在上述任一实施例中,优选地,比对结果参数包括:准确率、召回率、精度、F1分数。
在该实施例中,通过上述比对结果参数对分类预测结果进行评价,即对基于sigmoid函数的卷积神经网络分类模型的性能指标进行评价,为优化模型提供依据。
在上述任一实施例中,优选地,处理器504还用于执行计算机程序以:将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储基于sigmoid函数的卷积神经网络分类模型。
在该实施例中,将已存的卷积神经网络分类模型中损失函数调整为sigmoid函数,若已存的卷积神经网络分类模型的损失函数为softmax函数,将softmax函数替换为sigmoid函数,如此,获取本发明中的基于sigmoid函数的卷积神经网络分类模型,使得输出的概率不互斥,输出更加平滑、均匀。
本发明第三方面的实施例,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中文本分类方法的步骤。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中文本分类方法的步骤,因此具有该文本分类方法的全部技术效果,在此不再赘述。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种文本分类方法,其特征在于,包括:
采集文本信息数据;
将所述文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取所述文本信息数据的问题特征和答案特征;
将所述问题特征和所述答案特征输入基于sigmoid函数的卷积神经网络分类模型;
应用多维度多标签对所述问题特征和所述答案特征联合匹配,得到联合匹配结果;
迭代优化所述联合匹配结果,以输出所述文本信息数据的分类预测结果。
2.根据权利要求1所述的文本分类方法,其特征在于,所述应用多维度多标签对所述问题特征和所述答案特征联合匹配,得到联合匹配结果,具体包括:
将所述问题特征和所述答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;
将所述问题标签和所述答案标签作为所述联合匹配结果;
其中,所述预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
3.根据权利要求1所述的文本分类方法,其特征在于,在所述迭代优化所述联合匹配结果,以输出所述文本信息数据的分类预测结果之后,还包括:
将所述分类预测结果与预存所述文本信息数据对应的分类结果比对,获得比对结果参数;
根据所述比对结果参数的值对所述分类预测结果进行评价和/或优化所述基于sigmoid函数的卷积神经网络分类模型。
4.根据权利要求3所述的文本分类方法,其特征在于,所述比对结果参数包括:准确率、召回率、精度、F1分数。
5.根据权利要求1至4中任一项所述的文本分类方法,其特征在于,还包括:
将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储所述基于sigmoid函数的卷积神经网络分类模型。
6.一种文本分类装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以:
采集文本信息数据;
将所述文本信息数据输入基于sigmoid函数的卷积神经网络分类模型,提取所述文本信息数据的问题特征和答案特征;
应用多维度多标签对所述问题特征和所述答案特征联合匹配,得到联合匹配结果;
迭代优化所述联合匹配结果,以输出所述文本信息数据的分类预测结果。
7.根据权利要求6所述的文本分类装置,其特征在于,所述处理器具体用于执行所述计算机程序以:
将所述问题特征和所述答案特征分别以预设维度进行分类匹配,获得问题标签和答案标签;
将所述多个问题标签和所述多个答案标签作为所述联合匹配结果;
其中,所述预设维度包括以下一种或其组合:关键词、词性类别、语义、同义词。
8.根据权利要求7所述的文本分类装置,其特征在于,所述处理器还用于执行所述计算机程序以:
将所述分类预测结果与预存所述文本信息数据对应的分类结果比对,获得比对结果参数;
根据所述比对结果参数的值对所述分类预测结果进行评价和/或优化所述基于sigmoid函数的卷积神经网络分类模型。
9.根据权利要求8所述的文本分类装置,其特征在于,所述比对结果参数包括:准确率、召回率、精度、F1分数。
10.根据权利要求6至9中任一项所述的文本分类装置,其特征在于,所述处理器还用于执行所述计算机程序以:
将已存卷积神经网络分类模型中损失函数调整为sigmoid函数,获取并存储所述基于sigmoid函数的卷积神经网络分类模型。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述文本分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810954835.9A CN109308319B (zh) | 2018-08-21 | 2018-08-21 | 文本分类方法、文本分类装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810954835.9A CN109308319B (zh) | 2018-08-21 | 2018-08-21 | 文本分类方法、文本分类装置和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109308319A true CN109308319A (zh) | 2019-02-05 |
CN109308319B CN109308319B (zh) | 2022-03-01 |
Family
ID=65223901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810954835.9A Expired - Fee Related CN109308319B (zh) | 2018-08-21 | 2018-08-21 | 文本分类方法、文本分类装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109308319B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110347791A (zh) * | 2019-06-20 | 2019-10-18 | 广东工业大学 | 一种基于多标签分类卷积神经网络的题目推荐方法 |
CN110837843A (zh) * | 2019-09-26 | 2020-02-25 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN111125325A (zh) * | 2019-12-06 | 2020-05-08 | 山东浪潮人工智能研究院有限公司 | 一种基于gan网络的faq生成系统及方法 |
CN111612025A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 描述模型训练方法、文本描述方法、装置及电子设备 |
CN112417111A (zh) * | 2020-11-04 | 2021-02-26 | 厦门快商通科技股份有限公司 | 文本分类方法、问答系统及对话机器人 |
CN112507095A (zh) * | 2020-12-15 | 2021-03-16 | 平安国际智慧城市科技股份有限公司 | 基于弱监督学习的信息识别方法及相关设备 |
CN112836027A (zh) * | 2019-11-25 | 2021-05-25 | 京东方科技集团股份有限公司 | 用于确定文本相似度的方法、问答方法及问答系统 |
CN112989822A (zh) * | 2021-04-16 | 2021-06-18 | 北京世纪好未来教育科技有限公司 | 识别对话中句子类别的方法、装置、电子设备和存储介质 |
TWI759598B (zh) * | 2019-05-20 | 2022-04-01 | 南一書局企業股份有限公司 | 綜合學生習題發問頻率以整合回應的智能客服系統 |
CN116204645A (zh) * | 2023-03-02 | 2023-06-02 | 北京数美时代科技有限公司 | 一种智能文本分类方法、系统、存储介质和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017090051A1 (en) * | 2015-11-27 | 2017-06-01 | Giridhari Devanathan | A method for text classification and feature selection using class vectors and the system thereof |
CN106844530A (zh) * | 2016-12-29 | 2017-06-13 | 北京奇虎科技有限公司 | 一种问答对分类模型的训练方法和装置 |
CN106960243A (zh) * | 2017-03-06 | 2017-07-18 | 中南大学 | 一种改进卷积神经网络结构的方法 |
CN107145573A (zh) * | 2017-05-05 | 2017-09-08 | 上海携程国际旅行社有限公司 | 人工智能客服机器人的问题解答方法及系统 |
CN107239785A (zh) * | 2016-03-29 | 2017-10-10 | 北京市商汤科技开发有限公司 | 一种在智能设备中对图片进行分类的方法和系统 |
CN107291822A (zh) * | 2017-05-24 | 2017-10-24 | 北京邮电大学 | 基于深度学习的问题分类模型训练方法、分类方法及装置 |
-
2018
- 2018-08-21 CN CN201810954835.9A patent/CN109308319B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017090051A1 (en) * | 2015-11-27 | 2017-06-01 | Giridhari Devanathan | A method for text classification and feature selection using class vectors and the system thereof |
CN107239785A (zh) * | 2016-03-29 | 2017-10-10 | 北京市商汤科技开发有限公司 | 一种在智能设备中对图片进行分类的方法和系统 |
CN106844530A (zh) * | 2016-12-29 | 2017-06-13 | 北京奇虎科技有限公司 | 一种问答对分类模型的训练方法和装置 |
CN106960243A (zh) * | 2017-03-06 | 2017-07-18 | 中南大学 | 一种改进卷积神经网络结构的方法 |
CN107145573A (zh) * | 2017-05-05 | 2017-09-08 | 上海携程国际旅行社有限公司 | 人工智能客服机器人的问题解答方法及系统 |
CN107291822A (zh) * | 2017-05-24 | 2017-10-24 | 北京邮电大学 | 基于深度学习的问题分类模型训练方法、分类方法及装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111612025A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 描述模型训练方法、文本描述方法、装置及电子设备 |
CN111612025B (zh) * | 2019-02-25 | 2023-12-12 | 北京嘀嘀无限科技发展有限公司 | 描述模型训练方法、文本描述方法、装置及电子设备 |
TWI759598B (zh) * | 2019-05-20 | 2022-04-01 | 南一書局企業股份有限公司 | 綜合學生習題發問頻率以整合回應的智能客服系統 |
CN110347791B (zh) * | 2019-06-20 | 2023-06-16 | 广东工业大学 | 一种基于多标签分类卷积神经网络的题目推荐方法 |
CN110347791A (zh) * | 2019-06-20 | 2019-10-18 | 广东工业大学 | 一种基于多标签分类卷积神经网络的题目推荐方法 |
CN110837843A (zh) * | 2019-09-26 | 2020-02-25 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN110837843B (zh) * | 2019-09-26 | 2024-05-14 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN112836027A (zh) * | 2019-11-25 | 2021-05-25 | 京东方科技集团股份有限公司 | 用于确定文本相似度的方法、问答方法及问答系统 |
CN111125325A (zh) * | 2019-12-06 | 2020-05-08 | 山东浪潮人工智能研究院有限公司 | 一种基于gan网络的faq生成系统及方法 |
CN111125325B (zh) * | 2019-12-06 | 2024-01-30 | 山东浪潮科学研究院有限公司 | 一种基于gan网络的faq生成系统及方法 |
CN112417111A (zh) * | 2020-11-04 | 2021-02-26 | 厦门快商通科技股份有限公司 | 文本分类方法、问答系统及对话机器人 |
CN112507095A (zh) * | 2020-12-15 | 2021-03-16 | 平安国际智慧城市科技股份有限公司 | 基于弱监督学习的信息识别方法及相关设备 |
CN112507095B (zh) * | 2020-12-15 | 2024-08-13 | 平安国际智慧城市科技股份有限公司 | 基于弱监督学习的信息识别方法及相关设备 |
CN112989822B (zh) * | 2021-04-16 | 2021-08-27 | 北京世纪好未来教育科技有限公司 | 识别对话中句子类别的方法、装置、电子设备和存储介质 |
CN112989822A (zh) * | 2021-04-16 | 2021-06-18 | 北京世纪好未来教育科技有限公司 | 识别对话中句子类别的方法、装置、电子设备和存储介质 |
CN116204645A (zh) * | 2023-03-02 | 2023-06-02 | 北京数美时代科技有限公司 | 一种智能文本分类方法、系统、存储介质和电子设备 |
CN116204645B (zh) * | 2023-03-02 | 2024-02-20 | 北京数美时代科技有限公司 | 一种智能文本分类方法、系统、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109308319B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308319A (zh) | 文本分类方法、文本分类装置和计算机可读存储介质 | |
CN111177374B (zh) | 一种基于主动学习的问答语料情感分类方法及系统 | |
Bruni et al. | Distributional semantics from text and images | |
CN117009490A (zh) | 基于知识库反馈的生成式大语言模型的训练方法和装置 | |
CN110188351A (zh) | 语句通顺度及句法评分模型的训练方法及装置 | |
CN111026842A (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN115294407B (zh) | 基于预习机制知识蒸馏的模型压缩方法及系统 | |
CN111209384A (zh) | 基于人工智能的问答数据处理方法、装置及电子设备 | |
CN104239858A (zh) | 一种人脸特征验证的方法和装置 | |
CN109299271A (zh) | 训练样本生成、文本数据、舆情事件分类方法及相关设备 | |
CN106570521A (zh) | 多语言场景字符识别方法及识别系统 | |
CN109766935A (zh) | 一种基于超图p-Laplacian图卷积神经网络的半监督分类方法 | |
CN112487139A (zh) | 基于文本的自动出题方法、装置及计算机设备 | |
CN114818703B (zh) | 基于BERT语言模型和TextCNN模型的多意图识别方法及系统 | |
CN110110800A (zh) | 自动图像标注方法、装置、设备及计算机可读存储介质 | |
CN112131876A (zh) | 一种基于相似度确定标准问题的方法及系统 | |
CN110399467A (zh) | 提供用于自然语言问答系统的训练数据的方法和设备 | |
CN109800309A (zh) | 课堂话语类型分类方法及装置 | |
CN110765285A (zh) | 基于视觉特征的多媒体信息内容管控方法及系统 | |
CN110532363A (zh) | 一种基于决策树的任务导向型自动对话方法 | |
CN113886562A (zh) | 一种ai简历筛选方法、系统、设备和存储介质 | |
CN111191033A (zh) | 一种基于分类效用的开集分类方法 | |
JP3896868B2 (ja) | パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置 | |
CN108829675A (zh) | 文档表示方法及装置 | |
Hamidi-Haines et al. | Interactive naming for explaining deep neural networks: a formative study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220301 |
|
CF01 | Termination of patent right due to non-payment of annual fee |