CN113344127A - 一种数据预测方法、装置、设备及存储介质 - Google Patents
一种数据预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113344127A CN113344127A CN202110732640.1A CN202110732640A CN113344127A CN 113344127 A CN113344127 A CN 113344127A CN 202110732640 A CN202110732640 A CN 202110732640A CN 113344127 A CN113344127 A CN 113344127A
- Authority
- CN
- China
- Prior art keywords
- neural network
- feature vector
- network model
- service data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 318
- 238000003062 neural network model Methods 0.000 claims abstract description 184
- 230000006870 function Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 238000007499 fusion processing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及人工智能领域,公开了一种数据预测方法、装置、设备及存储介质,该方法包括:将样本数据输入第一神经网络模型,计算得到离散型业务数据的第一特征向量和连续型业务数据的第二特征向量;利用第一特征向量预训练第一神经网络模型,通过预训练后的第一神经网络模型计算得到第三特征向量;将第三特征向量与第二特征向量拼接处理得到的目标特征向量输入第二神经网络模型,并根据预测结果训练第一神经网络模型和第二神经网络模型,得到数据预测模型;将待检测业务数据输入数据预测模型,得到待检测业务数据的预测结果,提高了数据预测的准确性。本发明涉及区块链技术,如可将业务数据写入区块链中,以用于数据取证等场景。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种数据预测方法、装置、设备及存储介质。
背景技术
目前,市面上出现越来越多的业务产品,其中,业务产品会涉及到许多业务数据,如保险业务中的重疾险需要用户连续缴费20年等数据。在对业务产品进行维护的过程中,有些用户由于首次购买业务产品可能存在未缴费完全或者分期缴费的情况,在这种情况下业务代理人员可能未能及时提醒用户缴费,从而导致用户可能会出现断缴的情况,影响用户利益,用户体验差。因此,如何有效地维护业务数据非常重要。
发明内容
本发明实施例提供了一种数据预测方法、装置、设备及存储介质,可以提高模型提取特征向量的准确性,以及提高数据预测的准确性。
第一方面,本发明实施例提供了一种数据预测方法,所述方法包括:
获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
进一步地,所述利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,包括:
根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量;
根据所述预测特征向量预训练所述第一神经网络模型。
进一步地,所述预设的分类器包括多分类器;所述根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量,包括:
按照预设比例从所述离散型业务数据对应的第一特征向量中选取部分第一特征向量,并对选取的所述部分第一特征向量进行mask操作;
将进行mask操作后的第一特征向量输入所述多分类器中,预测得到进行mask操作位置处所对应的第一预测特征向量。
进一步地,所述根据所述预测特征向量预训练所述第一神经网络模型,包括:
将所述第一预测特征向量与选取的所述部分第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第一模型参数,并重新预训练调整所述第一模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述预设的分类器包括二分类器;所述根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量,包括:
从所述第一特征向量中随机选取N个第一特征向量,并将所述N个第一特征向量随机替换为与所述N个第一特征向量不同的特征向量值,其中,N为正整数;
将替换后的第一特征向量输入所述二分类器中,预测得到替换位置处所对应的第二预测特征向量。
进一步地,所述根据所述预测特征向量预训练所述第一神经网络模型,包括:
将所述第二预测特征向量与替换的所述N个第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第二模型参数,并重新预训练调整所述第二模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型,包括:
将所述预测结果与真实结果进行比较,根据比较结果确定损失函数;
当所述损失函数不满足预设阈值时,根据所述损失函数调整所述第一神经网络模型的第三模型参数和所述第二神经网络模型的模型参数,并重新训练所述所述第一神经网络模型和所述第二神经网络模型;
当所述损失函数满足预设阈值时,确定训练得到所述数据预测模型。
第二方面,本发明实施例提供了一种数据预测装置,包括:
获取单元,用于获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
提取单元,用于将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
预训练单元,用于利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
训练单元,用于将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
预测单元,用于获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
第三方面,本发明实施例提供了一种计算机设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持数据预测装置执行上述方法的计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量,基于离散型业务数据的第一特征向量对第一神经网络模型进行预训练,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型提取特征向量的准确性。将通过预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果训练第一神经模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测的准确性。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据预测方法的示意流程图;
图2是本发明实施例提供的一种数据预测装置的示意框图;
图3是本发明实施例提供的一种计算机设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的数据预测方法可以应用于一种数据预测装置,在某些实施例中,所述数据预测装置设置于计算机设备中。在某些实施例中,所述计算机设备包括但不限于智能手机、平板电脑、膝上型电脑等中的一种或者多种。
本发明实施例可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
本发明实施例基于离散型业务数据的第一特征向量对第一神经网络模型进行预训练,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型提取特征向量的准确性。将通过预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果训练第一神经模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测的准确性。
下面结合附图1对本发明实施例提供的数据预测方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种数据预测方法的示意流程图,如图1所示,该方法可以由数据预测装置执行,所述数据预测装置设置于计算机设备中。具体地,本发明实施例的所述方法包括如下步骤。
S101:获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据。
本发明实施例中,数据预测装置可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据。
在某些实施例中,所述历史业务数据包括但不限于业务代理人信息、业务购买人信息、业务信息等结构化数据。在某些实施例中,所述业务信息可以包括但不限于业务的缴费信息,如缴费时间、缴费金额等。在某些实施例中,所述历史业务数据可以包括但不限于保险业务数据。
S102:将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量。
本发明实施例中,数据预测装置可以将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量。在某些实施例中,所述第一神经网络模型为transfomer模型。
在某些实施例中,所述第一特征向量是根据所述第一神经网络模型计算得到的历史业务数据中离散型业务数据的向量特征,用于表征离散型业务数据的向量特征。在某些实施例中,所述第二特征是根据所述第一神经网络模型计算得到的历史业务数据中连续型业务数据的向量特征,用于表征连续型业务数据的向量特征。
在某些实施例中,所述离散型业务数据可以为不连续的文本业务数据,所述连续型业务数据可以为连续的数字业务数据。
S103:利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量。
本发明实施例中,数据预测装置可以利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量。
在一个实施例中,数据预测装置在利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型时,可以根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量;根据所述预测特征向量预训练所述第一神经网络模型。在某些实施例中,所述预设的分类器包括多分类器或二分类器。
在一个实施例中,所述预设的分类器包括多分类器;数据预测装置在根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,可以按照预设比例从所述离散型业务数据对应的第一特征向量中选取部分第一特征向量,并对选取的所述部分第一特征向量进行mask操作;将进行mask操作后的第一特征向量输入所述多分类器中,预测得到进行mask操作位置处所对应的第一预测特征向量。
在一个实施例中,数据预测装置在根据所述预测特征向量预训练所述第一神经网络模型时,可以将所述第一预测特征向量与选取的所述部分第一特征向量进行对比;当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第一模型参数,并重新预训练调整所述第一模型参数后的第一神经网络模型;当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
在一个实施例中,所述预设的分类器包括二分类器;数据预测装置在根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,可以从所述第一特征向量中随机选取N个第一特征向量,并将所述N个第一特征向量随机替换为与所述N个第一特征向量不同的特征向量值,其中,N为正整数;将替换后的第一特征向量输入所述二分类器中,预测得到替换位置处所对应的第二预测特征向量。
在一个实施例中,数据预测装置在根据所述预测特征向量预训练所述第一神经网络模型时,可以将所述第二预测特征向量与替换的所述N个第一特征向量进行对比;当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第二模型参数,并重新预训练调整所述第二模型参数后的第一神经网络模型;当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
本发明实施例通过这两种预训练第一神经网络模型的方式中的任意一种,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型计算特征向量的准确性。
S104:将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型。
本发明实施例中,数据预测装置可以将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型。
在一个实施例中,数据预测装置在将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量时,可以将所述第三特征变量与所述连续型业务数据对应的第二特征向量进行融合处理,得到的融合特征向量为目标特征向量。在融合处理过程,可以将第三特征向量与第二特征向量的同一个阶对应进行拼接,例如,假设第三特征变量v1∈Rn和第二特征变量v2∈Rm,将n维第三特征向量和m维第二特征向量进行融合处理,得到n+m维目标特征向量V=[v1,v2]∈Rn+m。
在一个实施例中,数据预测装置在根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型时,可以将所述预测结果与真实结果进行比较,根据比较结果确定损失函数;当所述损失函数不满足预设阈值时,根据所述损失函数调整所述第一神经网络模型的第三模型参数和所述第二神经网络模型的模型参数,并重新训练所述所述第一神经网络模型和所述第二神经网络模型;当所述损失函数满足预设阈值时,确定训练得到所述数据预测模型。
本方案通过将预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果再次训练第一神经网络模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测数据的准确性。
S105:获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
本发明实施例中,数据预测装置可以获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
在一个实施例中,所述预测结果中可以包括但不限于待检测业务数据的缴费信息,所述缴费信息包括缴费时间、缴费金额等,数据预测装置可以根据待检测业务数据的预测结果中的缴费信息确定所述待检测业务数据的继续率。在一个具体实施例中,数据预测装置可以根据待检测业务数据的预测结果的缴费信息确定所述待检测业务数据中的续费业务量,并根据续费业务量和业务总量计算得到所述待检测业务数据的继续率。
本发明实施例中,数据预测装置可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量,基于离散型业务数据的第一特征向量对第一神经网络模型进行预训练,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型提取特征向量的准确性。将通过预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果训练第一神经模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测的准确性。
本发明实施例还提供了一种数据预测装置,该数据预测装置用于执行前述任一项所述的方法的单元。具体地,参见图2,图2是本发明实施例提供的一种数据预测装置的示意框图。本实施例的数据预测装置包括:获取单元201、提取单元202、预训练单元203、训练单元204以及预测单元205。
获取单元201,用于获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
提取单元202,用于将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
预训练单元203,用于利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
训练单元204,用于将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
预测单元205,用于获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
进一步地,所述预训练单元203利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型时,具体用于:
根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量;
根据所述预测特征向量预训练所述第一神经网络模型。
进一步地,所述预设的分类器包括多分类器;所述预训练单元203根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,具体用于:
按照预设比例从所述离散型业务数据对应的第一特征向量中选取部分第一特征向量,并对选取的所述部分第一特征向量进行mask操作;
将进行mask操作后的第一特征向量输入所述多分类器中,预测得到进行mask操作位置处所对应的第一预测特征向量。
进一步地,所述预训练单元203根据所述预测特征向量预训练所述第一神经网络模型时,具体用于:
将所述第一预测特征向量与选取的所述部分第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第一模型参数,并重新预训练调整所述第一模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述预设的分类器包括二分类器;所述预训练单元203根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,具体用于:
从所述第一特征向量中随机选取N个第一特征向量,并将所述N个第一特征向量随机替换为与所述N个第一特征向量不同的特征向量值,其中,N为正整数;
将替换后的第一特征向量输入所述二分类器中,预测得到替换位置处所对应的第二预测特征向量。
进一步地,所述预训练单元203根据所述预测特征向量预训练所述第一神经网络模型时,具体用于:
将所述第二预测特征向量与替换的所述N个第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第二模型参数,并重新预训练调整所述第二模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述预测单元205根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型时,具体用于:
将所述预测结果与真实结果进行比较,根据比较结果确定损失函数;
当所述损失函数不满足预设阈值时,根据所述损失函数调整所述第一神经网络模型的第三模型参数和所述第二神经网络模型的模型参数,并重新训练所述所述第一神经网络模型和所述第二神经网络模型;
当所述损失函数满足预设阈值时,确定训练得到所述数据预测模型。
本发明实施例中,数据预测装置可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量,基于离散型业务数据的第一特征向量对第一神经网络模型进行预训练,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型提取特征向量的准确性。将通过预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果训练第一神经模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测的准确性。
参见图3,图3是本发明实施例提供的一种计算机设备的示意框图。如图所示的本实施例中的设备可以包括:一个或多个处理器301;一个或多个输入设备302,一个或多个输出设备303和存储器304。上述处理器301、输入设备302、输出设备303和存储器304通过总线305连接。存储器304用于存储计算机程序,所述计算机程序包括程序,处理器301用于执行存储器304存储的程序。
其中,处理器301被配置用于调用所述程序执行:
获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
进一步地,所述处理器301利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型时,具体用于:
根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量;
根据所述预测特征向量预训练所述第一神经网络模型。
进一步地,所述预设的分类器包括多分类器;所述处理器301根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,具体用于:
按照预设比例从所述离散型业务数据对应的第一特征向量中选取部分第一特征向量,并对选取的所述部分第一特征向量进行mask操作;
将进行mask操作后的第一特征向量输入所述多分类器中,预测得到进行mask操作位置处所对应的第一预测特征向量。
进一步地,所述处理器301根据所述预测特征向量预训练所述第一神经网络模型时,具体用于:
将所述第一预测特征向量与选取的所述部分第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第一模型参数,并重新预训练调整所述第一模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述预设的分类器包括二分类器;所述处理器301根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量时,具体用于:
从所述第一特征向量中随机选取N个第一特征向量,并将所述N个第一特征向量随机替换为与所述N个第一特征向量不同的特征向量值,其中,N为正整数;
将替换后的第一特征向量输入所述二分类器中,预测得到替换位置处所对应的第二预测特征向量。
进一步地,所述处理器301根据所述预测特征向量预训练所述第一神经网络模型时,具体用于:
将所述第二预测特征向量与替换的所述N个第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第二模型参数,并重新预训练调整所述第二模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
进一步地,所述处理器301根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型时,具体用于:
将所述预测结果与真实结果进行比较,根据比较结果确定损失函数;
当所述损失函数不满足预设阈值时,根据所述损失函数调整所述第一神经网络模型的第三模型参数和所述第二神经网络模型的模型参数,并重新训练所述所述第一神经网络模型和所述第二神经网络模型;
当所述损失函数满足预设阈值时,确定训练得到所述数据预测模型。
本发明实施例中,计算机设备可以获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量,基于离散型业务数据的第一特征向量对第一神经网络模型进行预训练,有助于使得利用预训练后的第一神经网络模型计算得到的离散型业务数据的第三特征向量更加准确,提高了第一神经网络模型提取特征向量的准确性。将通过预训练后的第一神经网络模型得到的离散型业务数据的第三特征向量与连续型业务数据的第二特征向量进行拼接,得到目标特征向量,将目标特征向量输入第二神经网络模型,得到预测结果,并根据预测结果训练第一神经模型和第二神经网络模型,得到数据预测模型,有助于进一步提高数据预测模型预测的准确性。
应当理解,在本发明实施例中,所称处理器301可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备302可以包括触控板、麦克风等,输出设备303可以包括显示器(LCD等)、扬声器等。
该存储器304可以包括只读存储器和随机存取存储器,并向处理器301提供指令和数据。存储器304的一部分还可以包括非易失性随机存取存储器。例如,存储器304还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器301、输入设备302、输出设备303可执行本发明实施例提供的图1所述的方法实施例中所描述的实现方式,也可执行本发明实施例图2所描述的数据预测装置的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所对应实施例中描述的数据预测方法,也可实现本发明图2所对应实施例的数据预测装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的数据预测装置的内部存储单元,例如数据预测装置的硬盘或内存。所述计算机可读存储介质也可以是所述数据预测装置的外部存储装置,例如所述数据预测装置上配备的插接式硬盘,智能存储卡(SmarSMedia Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述数据预测装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述数据预测装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种数据预测方法,其特征在于,所述方法包括:
获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,包括:
根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量;
根据所述预测特征向量预训练所述第一神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述预设的分类器包括多分类器;所述根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量,包括:
按照预设比例从所述离散型业务数据对应的第一特征向量中选取部分第一特征向量,并对选取的所述部分第一特征向量进行mask操作;
将进行mask操作后的第一特征向量输入所述多分类器中,预测得到进行mask操作位置处所对应的第一预测特征向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述预测特征向量预训练所述第一神经网络模型,包括:
将所述第一预测特征向量与选取的所述部分第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第一模型参数,并重新预训练调整所述第一模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
5.根据权利要求2所述的方法,其特征在于,所述预设的分类器包括二分类器;所述根据预设规则对所述离散型业务数据对应的第一特征向量进行预处理,并将预处理后的第一特征向量输入预设的分类器中,计算得到与所述第一特征向量对应的预测特征向量,包括:
从所述第一特征向量中随机选取N个第一特征向量,并将所述N个第一特征向量随机替换为与所述N个第一特征向量不同的特征向量值,其中,N为正整数;
将替换后的第一特征向量输入所述二分类器中,预测得到替换位置处所对应的第二预测特征向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述预测特征向量预训练所述第一神经网络模型,包括:
将所述第二预测特征向量与替换的所述N个第一特征向量进行对比;
当对比结果不一致时,根据对比结果调整所述第一神经网络模型的第二模型参数,并重新预训练调整所述第二模型参数后的第一神经网络模型;
当对比结果一致时,确定对所述第一神经网络模型的预训练结束。
7.根据权利要求1所述的方法,其特征在于,所述根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型,包括:
将所述预测结果与真实结果进行比较,根据比较结果确定损失函数;
当所述损失函数不满足预设阈值时,根据所述损失函数调整所述第一神经网络模型的第三模型参数和所述第二神经网络模型的模型参数,并重新训练所述所述第一神经网络模型和所述第二神经网络模型;
当所述损失函数满足预设阈值时,确定训练得到所述数据预测模型。
8.一种数据预测装置,其特征在于,包括:
获取单元,用于获取样本数据,所述样本数据中包括与当前时刻相邻的预设时间范围内的历史业务数据;
提取单元,用于将所述样本数据输入第一神经网络模型中,计算得到与所述样本数据对应的业务数据特征向量,所述业务数据特征向量的类型包括离散型业务数据对应的第一特征向量和连续型业务数据对应的第二特征向量;
预训练单元,用于利用所述离散型业务数据对应的第一特征向量预训练所述第一神经网络模型,并通过预训练后的第一神经网络模型计算得到所述离散型业务数据对应的第三特征向量;
训练单元,用于将所述第三特征向量与所述连续型业务数据对应的第二特征向量进行拼接处理,得到目标特征向量,并将所述目标特征向量输入第二神经网络模型,得到预测结果,以及根据预测结果训练所述第一神经网络模型和所述第二神经网络模型,得到数据预测模型;
预测单元,用于获取待检测业务数据,并将所述待检测业务数据输入所述数据预测模型,得到所述待检测业务数据的预测结果。
9.一种计算机设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110732640.1A CN113344127B (zh) | 2021-06-29 | 2021-06-29 | 一种数据预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110732640.1A CN113344127B (zh) | 2021-06-29 | 2021-06-29 | 一种数据预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344127A true CN113344127A (zh) | 2021-09-03 |
CN113344127B CN113344127B (zh) | 2024-04-26 |
Family
ID=77481788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110732640.1A Active CN113344127B (zh) | 2021-06-29 | 2021-06-29 | 一种数据预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344127B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415006A (zh) * | 2018-04-28 | 2019-11-05 | 广东神马搜索科技有限公司 | 广告点击率预估方法和装置 |
CN110503186A (zh) * | 2019-07-19 | 2019-11-26 | 北京三快在线科技有限公司 | 商品排序神经网络模型训练方法、装置、电子设备 |
CN110647696A (zh) * | 2018-06-08 | 2020-01-03 | 北京三快在线科技有限公司 | 一种业务对象的排序方法及装置 |
CN111329469A (zh) * | 2020-03-05 | 2020-06-26 | 广州天嵌计算机科技有限公司 | 一种心律异常预测方法 |
-
2021
- 2021-06-29 CN CN202110732640.1A patent/CN113344127B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415006A (zh) * | 2018-04-28 | 2019-11-05 | 广东神马搜索科技有限公司 | 广告点击率预估方法和装置 |
CN110647696A (zh) * | 2018-06-08 | 2020-01-03 | 北京三快在线科技有限公司 | 一种业务对象的排序方法及装置 |
CN110503186A (zh) * | 2019-07-19 | 2019-11-26 | 北京三快在线科技有限公司 | 商品排序神经网络模型训练方法、装置、电子设备 |
CN111329469A (zh) * | 2020-03-05 | 2020-06-26 | 广州天嵌计算机科技有限公司 | 一种心律异常预测方法 |
Non-Patent Citations (1)
Title |
---|
王娜 等: "一种基于用户播放行为序列的个性化视频推荐策略", 计算机学报, vol. 43, no. 01, 31 January 2020 (2020-01-31), pages 123 - 135 * |
Also Published As
Publication number | Publication date |
---|---|
CN113344127B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109064175B (zh) | 一种账户盗用风险防控方法及装置 | |
US11544808B2 (en) | Digital negotiation platform | |
US20210019657A1 (en) | Fraud detection and risk assessment method, system, device, and storage medium | |
CN105337928B (zh) | 用户身份识别方法、安全保护问题生成方法及装置 | |
CN110110592A (zh) | 业务处理方法、模型训练方法、设备及存储介质 | |
CN111523413B (zh) | 生成人脸图像的方法和装置 | |
CN110751557A (zh) | 一种基于序列模型的异常资金交易行为分析方法及系统 | |
CN110020662B (zh) | 用户分类模型的训练方法和装置 | |
US20210264517A1 (en) | Internet meme economy | |
CN114202384A (zh) | 信用分数计算方法、设备及存储介质 | |
CN111341041A (zh) | 一种支付方式确定方法、装置、系统及设备 | |
CN109598110A (zh) | 一种用户身份的识别方法及装置 | |
CN110992139B (zh) | 竞标价格实现方法及相关产品 | |
CN117422553A (zh) | 区块链网络的交易处理方法、装置、设备、介质和产品 | |
CN110213239B (zh) | 可疑交易报文生成方法、装置及服务器 | |
CN113344127A (zh) | 一种数据预测方法、装置、设备及存储介质 | |
CN113807858B (zh) | 一种基于决策树模型的数据处理方法及相关设备 | |
CN110992155A (zh) | 竞标入围处理方法及相关产品 | |
KR20200128250A (ko) | 블록체인 기반의 계약 플랫폼 서비스 제공 시스템 및 방법 | |
CN112085469B (zh) | 基于向量机模型的数据审批方法、装置、设备及存储介质 | |
CN113890948B (zh) | 基于语音外呼机器人对话数据的资源分配方法及相关设备 | |
CN113221907A (zh) | 一种车辆部件分割方法、装置、设备及存储介质 | |
KR102210448B1 (ko) | 블록체인을 이용한 제품의 소유권 등록 및 위조 판단 서비스 제공 방법, 장치 및 컴퓨터프로그램 | |
CN114925275A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN115860889A (zh) | 一种基于人工智能的金融贷款大数据管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |