CN113744060A - 基于融合模型的数据预测方法、装置、设备以及存储介质 - Google Patents

基于融合模型的数据预测方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113744060A
CN113744060A CN202111057981.XA CN202111057981A CN113744060A CN 113744060 A CN113744060 A CN 113744060A CN 202111057981 A CN202111057981 A CN 202111057981A CN 113744060 A CN113744060 A CN 113744060A
Authority
CN
China
Prior art keywords
data
model
real
function
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111057981.XA
Other languages
English (en)
Inventor
覃德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111057981.XA priority Critical patent/CN113744060A/zh
Publication of CN113744060A publication Critical patent/CN113744060A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能领域,提供了一种基于融合模型的数据预测方法、装置、设备以及存储介质。其中,方法包括:通过经验公式源模型和神经网络源模型的融合模型进行预测,先经过经验公式源模型得到较佳的函数模型,再基于神经网络源模型得到计算公式中的函数模型参数,最终将假设数据计算的预测值,与当前实时数据的预测值相减,从而使得到的数据结果更加准确。为用户提供了一个具有指导性和参考性的预测结果。

Description

基于融合模型的数据预测方法、装置、设备以及存储介质
技术领域
本发明涉及人工智能领域,特别涉及一种基于融合模型的数据预测方法、装置、设备以及存储介质。
背景技术
在一些场景中,人们需要对一些操作产生的数据进行预测,以确定数据的走向,从而便于人们选择最优的选择。例如,以资金头寸为例,资金头寸是指一种以买入或卖出表达的交易意向,因此需要对不同的资金头寸进行数据预测,以便于人们执行对自己更有利的执行方式。
目前,一般都是通过预测模型来预测最终结果与多个变量之间可能存在的相关关系,但是影响结果的参数具有很多,预测模型具有较大的局限性,导致预测模型的预测结果与实际的结果偏差较大,不具备指导性和参考性。
发明内容
本发明的主要目的为提供一种基于融合模型的数据预测方法、装置、设备以及存储介质,旨在预测模型具有较大的局限性,导致预测模型的预测结果与实际的结果偏差较大的问题。
本发明提供了一种基于融合模型的数据预测方法,所述融合模型包括经验公式源模型和神经网络源模型,包括:
接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
进一步地,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数的步骤,包括:
计算每个维度的实时数据与所述待预测信息之间的相关度值;
选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量;
通过池化的方式对各所述第一特征向量进行稀疏处理,得到各自对应的第二特征向量;
将各所述第二特征向量输入至所述神经网络源模型的全连接层中,得到所述第一函数模型参数。
进一步地,所述计算每个维度的实时数据与所述待预测信息之间的相关度值的步骤,包括:
提取所述实时数据集中各个维度对应的维度向量,以及所述待预测信息对应的结果向量;
根据公式D(X,Y)=f(X,Y)*d2(X,Y)+[1-f(X,Y)]*maX[m,d(X,Y)]计算各所述维度向量与所述结果向量的相关度值;其中,D(X,Y)表示所述相关度值,X表示维度向量,Y表示所述结果向量,f(X,Y)表示X和Y的相似度计算函数,0≤f(X,Y)≤1,m为预设的参数,max(a,b)表示取a,b中的较大值,
Figure BDA0003255436070000031
Figure BDA0003255436070000032
X[i]表示所述维度向量的第i个实时数据,Y[i]表示所述结果向量的第i个实时数据。
进一步地,所述接收各个维度的实时数据的步骤,包括:
获取各所述实时数据的目标特征向量信息;
根据所述目标特征向量信息判断各所述实时数据所在的位置信息;
通过爬虫脚本在所述位置信息对应的位置处,采集对应的所述实时数据。
进一步地,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数的步骤之前,还包括:
从数据库中获取到各种操作数据、对应所述操作数据的历史实时数据,以及对应的实际结果,并分别进行特征向量化处理,分别得到所述操作数据对应的操作向量和所述历史实时数据对应的历史操作向量,以及所述实际结果对应的结果特征向量;
将所述操作向量和所述历史操作向量作为初始神经网络的输入,以及将所述结果特征向量作为所述初始神经网络的输出,对所述初始神经网络进行训练;
当所述初始神经网络收敛后,得到暂时神经网络;
计算所述暂时神经网络的损失值;
判断所述损失值是否低于损失预设值;
若所述损失值低于所述损失预设值,则认定所述暂时神经网络为所述神经网络源模型。
进一步地,所述将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型的步骤之前,还包括:
根据公式
Figure BDA0003255436070000041
计算每个实时数据的异常值;其中Zij表示第j个维度中的第i个实时数据的所述异常值,
Figure BDA0003255436070000042
Figure BDA0003255436070000043
xij表示第j个所述维度中第i个实时数据;
将|Zij|>Zthr对应的目标实时数据提取出来,并将所述目标实时数据的值与当前的实际信息进行比对,其中Zthr为设定的参数值;
若比对结果为所述目标实时数据的值错误,则获取所述目标实时数据的准确值并替换所述目标实时数据的值。
进一步地,所述选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量的步骤,包括:
提取各选取的实时数据以及所述假设数据中的局部特征向量并进行降维处理,得到多个低维度的局部特征向量以及将多个低维度的局部特征向量压缩为多个一维的局部特征向量;
对所述多个一维的局部特征向量进行正则化处理,得到处理后的多个所述第一特征向量。
本发明提供了一种基于融合模型的预测装置,所述融合模型包括经验公式源模型和神经网络源模型,包括:
接收模块,用于接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
第一输入模块,用于将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
第二输入模块,用于将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
第三输入模块,用于将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
计算模块,用于根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过经验公式源模型和神经网络源模型的融合模型进行预测,先经过经验公式源模型得到较佳的函数模型,再基于神经网络源模型得到计算公式中的函数模型参数,最终将假设数据计算的预测值,与当前实时数据的预测值相减,从而使得到的数据结果更加准确。为用户提供了一个具有指导性和参考性的预测结果。
附图说明
图1是本发明一实施例的一种基于融合模型的数据预测方法的流程示意图;
图2是本发明一实施例的一种基于融合模型的数据预测装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参照图1,本发明提出一种基于融合模型的数据预测方法,包括:
S1:接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
S2:将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
S3:将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
S4:将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
S5:根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
如上述步骤S1所述,接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集。其中,融合模型是通过输入层接收该实时数据和假设数据的,输入层为经验公式源模型和神经网络源模型的共同输入层,即实时数据和假设数据需要输入至经验公式源模型和神经网络源模型中。其中,实时数据为当前的实时数据,举例而言,若是对收益的预测,则各维度的实时数据为截止至当前位置用户的充值总额、取现总额、申购数据、赎回数据以及一个小时内的交易数据、客户信息等维度的实时数据,该实时数据可以在服务器中实时获取,而假设数据则是所作的一个虚拟决定产生的数据,实际情况并未发生,而是一种假设的数据,一般为通过人员上传得到,例如为对某个投资项目增加5千万的投资,也可以是对某个投资项目撤回一定量的资金等。在获取到假设数据时,则对第一数据集中的数据进行更新,其中,更新的方式包括添加、删除、替换等一个或者操作,具体地操作步骤为,检测假设数据所对应的第一数据集中的数据,其中检测的方式为先解析该假设数据,根据解析结果得到假设数据所属的维度,再根据假设数据的维度在第一数据集中找出对应的数据。再通过语义识别得到假设数据的更改方式,对对应的数据进行删除、减少、增加等操作。例如为对第一数据集中某个数据的删除,则对所述第一数据集中对应的数据进行删除处理。待预测信息为用户所需要预测的信息,例如一定时间后的收益情况,其需要基于对应的数据进行推测,即基于第一数据集或第二数据集进行推测。
如上述步骤S2所述,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型。其中,经验公式源模型中存储了各种公式,根据当前数据集,可以得到计算当前数据集对应的预测结果的最佳公式,使得到不同的计算函数模型,其中,若得到的第一函数计算模型和第二函数计算模型相同,则说明当前的数据并不会对预测结果的走向发生大的变化。另外,该经验公式模型中预存有对预测结果的不同计算公式,例如为贝叶斯计算公式、指数平滑算法公式等,也还可以是相关人员自己基于经验所总结出来的复合公式,该经验公式源模型根据不同的数据集以及相关人员所选取的计算公式训练而成。
如上述步骤S3所述,将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数。其中,该神经网络源模型的作用是选用函数模型并训练函数模型(包括第一函数模型和第二函数模型)中的各个参数,即对公式中的参数进行训练,根据对应的训练集中的实时数据对其进行训练,其中,神经网络源模型为根据不同的训练集以及对应各训练集的多个函数模型参数作为输入,将正确的对应的函数模型参数作为输出训练而成。其中,训练集与上述的数据集可以是相同的集合,也可以是不同的集合,其包含的数据都是预先收集到的各个维度的数据。需要说明的是,第一函数模型参数为第一函数模型中的参数,第一函数模型为一个计算公式,则第一函数模型参数为对应计算公式的公式参数,例如计算公式为y=kx+b,则对应的k和b为对应的公式参数,同理第二函数模型参数为第二函数模型中的参数,此处不再赘述。将第一函数模型参数或第二函数模型参数输入至神经网络源模型中的方式为将经验公式源模型的输出层与神经网络模型的输入层进行连接,从而实现将第一函数模型和第二函数模型输入至神经网络源模型中。
如上述步骤S4所述,将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式f1(t),以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式f2(t)。其中,t为时间,即得到的函数计算公式为根据时间变化而变化的参数。其中,第一函数计算公式f1(t)和所述第二函数计算公式f2(t)分别为随着时间变化的函数,例如所需计算的结果为收益,则对应为随着时间变化而变化的收益数值,若时间为一年,则将时间一年替换第一函数计算公式f1(t)和所述第二函数计算公式f2(t)中的t,从而可以得到其中,第一函数计算公式f1(t)对应的第一收益和所述第二函数计算公式f1(t)对应的第二收益。
如上述步骤S5所述,根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。即根据公式G(t)=f2(t)-f1(t)得到所述假设数据的预测结果。即该预测结果需要呈时间的变化而变化的预测结果,该预测结果应当是第二函数计算公式减去第一函数计算公式所得到的变化情况,用户可以基于该预测情况选择自己的资金头寸,例如投入500万,收益值会如何变化等。需要说明的是,预测结果具体为假设数据所对应的第二函数计算公式与当前实时数据所对应的第一函数计算公式之差,即预测结果为假设数据所带来的额外收益,而不仅仅是假设数据所对应的收益,仅凭借假设数据所对应的收益,用户难以得到假设数据所产生的效果,因此需要将假设数据所对应的第一函数计算公式减去当前实时数据所对应的第二函数计算公式,从而得到最终的预测结果,另外,由于第一函数计算公式和第二函数计算公式均为与时间相关的函数,因此所对应的预测结果也应当是与时间相关的函数,即用户可以查看不同时间后所对应的收益情况,以便于用户做进一步的评估。
本实施例中,通过经验公式源模型和神经网络源模型的融合模型进行预测,先经过经验公式源模型得到较佳的函数模型,再基于神经网络源模型得到计算公式中的函数模型参数,最终将假设数据计算的预测值,与当前实时数据的预测值相减,从而使得到的数据结果更加准确。为用户提供了一个具有指导性和参考性的预测结果。
在一个实施例中,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数的步骤S3,包括:
S301:计算每个维度的实时数据与所述待预测信息之间的相关度值;
S302:选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量;
S303:通过池化的方式对各所述第一特征向量进行稀疏处理,得到各自对应的第二特征向量;
S304:将各所述第二特征向量输入至所述神经网络源模型的全连接层中,得到所述第一函数模型参数。
神经网络源模型(CNN)是一种深度前馈人工神经网络,在图像识别中具有较好的性能表现。CNN包括卷积层(convolutional layer)和池化层(pooling layer)。卷积层用于从输入的数据中自动抽取特征,得到第一特征。池化层用于对第一特征进行池化处理,以简化第一特征。池化处理包括最大池化、平均池化、随机池化等方式,其可根据实际需求选择合适的方式。在一个具体地实施例中,CNN包括1个输入层、11个卷积层、3个池化层、1个全连接层和1个输出层。其中,卷积层的通道数最大不超过64。假设卷积层由上到下依次为C1至C11,卷积层C1是一个32通道、卷积核大小为5×5的卷积层。卷积层C1后面连接核大小为2×2的池化层S1用于下采样。池化层S1之后顺次连接4个48通道、卷积核大小为5×5的卷积层,分别为C2~C5。卷积层C5后面连接核大小为2×2的池化层S2用于下采样。池化层S2之后顺次连接4个64通道、卷积核大小为3×3的卷积层,分别为C6~C9。卷积层C9后面连接核大小为2×2的池化层S3。池化层S3之后顺次连接2个64通道、卷积核大小为3×3的卷积层,分别为C10~C11。卷积层C11后面连接全连接层,将卷积层C11输出的第二特征向量映射为一维特征向量用于最后的定位预测,最后在输出层中输出与一维向量特征所对应的预测结果。
如上述步骤S301所述,计算每个维度的实时数据与所述待预测信息之间的相关度值。其中,计算相关度值的公式可以是任意的相似度算法,也可以是其他的算法,本申请中后续提供了一种较优的算法,此处不再赘述,应当理解的是,可以计算出各个维度的实时数据与所述待预测信息之间的关联性即可,以此作为对应维度是否为后续所必须的维度数据,从而可以略去不相关的维度数据,减少对实时数据的计算,从而可以实现快速计算得到最终的结果,并且还可以提升融合模型的鲁棒性。预测结果是事先设定的,即需要哪一方面的结果,例如可以是风险,也可以是利益等。
如上述步骤S302所述,选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量。即只选取与预测结果相关的维度的实时数据,进行数特征向量的提取和特征向量映射,其中特征向量提取是通过在卷积层中的卷积和进行提取,而特征向量映射的方式可以是线性映射,也可以是非线性映射,从而得到了多个第一特征向量,应当理解的是一个维度的实时数据对应一个第一特征向量,而假设数据也对应一个第一特征向量。
如上述步骤S303所述,通过池化(pooling)的方式对各所述第一特征向量进行稀疏处理,得到各自对应的第二特征向量,其中,在池化层中对第一特征进行稀疏处理,稀疏处理的方式可以是求区域内的平均值,也可以是求区域内的最大值,即稀疏处理的方式可以采用Maxpooling(最大值池化)、SUM Pooling(相加池化)以及AVE pooling(平均值池化)中的任意一种池化方式,用于对第一特征向量进行压缩和减少参数的量,避免后续过度拟合,提高了神经网络源模型识别的准确性。
如上述步骤S304所述,将各所述第二特征向量输入至所述神经网络源模型的全连接层中,得到所述第一函数模型参数。即将第二特征向量输入至所述神经网络源模型的连接层中,可以得到各个参数值的概率,全连接层会输出其概率最高的参数作为第一函数模型参数。
在一个实施例中,所述计算每个维度的实时数据与所述待预测信息之间的相关度值的步骤S301,包括:
S3011:提取所述实时数据集中各个维度的实时数据集中,各个维度对应的维度向量,以及所述待预测信息对应的结果向量;
S3012:根据公式D(X,Y)=f(X,Y)*d2(X,Y)+[1-f(X,Y)]*max[m,d(X,Y)]计算各所述维度向量与所述结果向量的相关度值;其中,D(X,Y)表示所述相关度值,X表示维度向量,Y表示所述结果向量,f(X,Y)表示X和Y的相似度计算函数,0≤f(X,Y)≤1,m为预设的参数,max(a,b)表示取a,b中的较大值,
Figure BDA0003255436070000121
Figure BDA0003255436070000131
X[i]表示所述维度向量的第i个实时数据,Y[i]表示所述结果向量的第i个实时数据。
如上述步骤S3011-S3012所述,实现了对相关度值的计算。
步骤S3011中,提取所述实时数据集中各个维度的实时数据集中,各个维度对应的维度向量,以及所述预测结果对应的结果向量。即提取各个维度的维度向量,以及预测结果的结果向量,其中,各个维度的维度向量可以是根据构成该维度的数据来源所构成的维度向量,而结果向量可以是所需计算的原始数据来源构成结果向量,从而可以得到对应的维度向量和结果向量。
步骤S3012中,通过公式D(X,Y)=f(X,Y)*d2(X,Y)+[1-f(X,Y)]*max[m,d(X,Y)]计算各所述维度向量与所述结果向量的相关度值,公式中考虑了二者之间的相似度,欧式距离,从而可以得到正确的相关性,当得到的相关度值越大,则说明该维度向量与结果向量越相关,当得到的相关度值越小,则说明该维度向量与结果向量越不相关。
在一个实施例中,所述通过初始神经网络接收各个维度的实时数据的步骤S1,包括:
S101:获取各所述实时数据的目标特征向量信息;
S102:根据所述目标特征向量信息判断各所述实时数据所在的位置信息;
S103:通过爬虫脚本在所述位置信息对应的位置处,采集对应的所述实时数据。
如上述步骤S101-S103所述,实现了对实时数据的获取。具体地,先获取各实时数据的目标特征向量信息,例如类别,关键词等信息,然后根据目标特征向量信息判断个实时数据所在的位置信息,位置信息包括对应的平台信息,以及平台中对应的存储位置,然后再通过爬虫脚本在各个平台上获取相应的实时数据。其中爬虫脚本具体可以是sqoop脚本,sqoop脚本可以从各个平台处获取到对应的数据,从而实现对实时数据的获取。
在一个实施例中,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数的步骤S3之前,还包括:
S201:从数据库中获取到各种操作数据、对应所述操作数据的历史实时数据,以及对应的实际结果,并分别进行特征向量化处理,分别得到所述操作数据对应的操作向量和所述历史实时数据对应的历史操作向量,以及所述实际结果对应的结果特征向量;
S202:将所述操作向量和所述历史操作向量作为初始神经网络的输入,以及将所述结果特征向量作为所述初始神经网络的输出,对所述初始神经网络进行训练;
S203:当所述初始神经网络收敛后,得到暂时神经网络;
S204:计算所述暂时神经网络的损失值;
S205:判断所述损失值是否低于损失预设值;
S206:若所述损失值低于所述损失预设值,则认定所述暂时神经网络为所述神经网络源模型。
如上述步骤S201-S203所述,本实施例可通过训练好的Transformer模型对操作数据,历史实时数据,以及实际结果进行特征化处理,再将特征向量化后的数据输入初始神经网络中进行模型训练,当训练次数达到设定要求时,对初始神经网络进行收敛,从而训练出暂时神经网络。训练完成后,可将该暂时神经网络直接用来预测,也可以再次检测其损失值。
如上述步骤S004-S007所述,通过公式
Figure BDA0003255436070000141
计算所述暂时神经网络的损失值,其中,S为损失值,Ai表示经过暂时神经网络计算的第i个计算值,Bi为与Ai相应的第i个预测值,n表示数据的个数。然后判断是否低于损失预设值,该损失预设值为设定的值,若所述损失值低于损失预设值时,则认定所述暂时神经网络为所述神经网络源模型;若不低于损失预设值时,则调整所述暂时神经网络模型的参数,对暂时神经网络继续训练,直至得到损失值低于损失预设值的暂时神经网络。从而完成对神经网络源模型的训练。
在一个实施例中,所述将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型的步骤S2之前,还包括:
S111:根据公式
Figure BDA0003255436070000151
计算每个实时数据的异常值;其中Zij表示第j个维度中的第i个实时数据的所述异常值,
Figure BDA0003255436070000152
Figure BDA0003255436070000153
xij表示第j个所述维度中第i个实时数据;
S112:将|Zij|>Zthr对应的目标实时数据提取出来,并将所述目标实时数据的值与当前的实际信息进行比对,其中Zthr为设定的参数值;
S113:若比对结果为所述目标实时数据的值错误,则获取所述目标实时数据的准确值并替换所述目标实时数据的值。
如上述步骤S111-S113所述,实现了对异常值的再次检测,即在获取到实时数据后,需要对获取到的实时数据信息计算各个实时数据的异常值,当异常值超出了设定的参数值时,可以认为该实时数据异常,当然也不排除该实时数据可能会出现异常值,例如因为一些舆论导致收益具有一些巨大影响,对于这种数据需要进行验证处理,将原始的数据进行特征比对,当比对有误时,则获取正确的实时数据进行替换,保证实时数据的正确度,从而使计算结果不会出现误差。
在一个实施例中,所述选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量的步骤S302,包括:
S3021:提取各选取的实时数据以及所述假设数据中的局部特征向量并进行降维处理,得到多个低维度的局部特征向量以及将多个低维度的局部特征向量压缩为多个一维的局部特征向量;
S3022:对所述多个一维的局部特征向量进行正则化处理,得到处理后的多个所述第一特征向量。
如上述步骤S3021-S3022所述,实现了对第一特征向量的处理,以便于后续对第一特征向量的处理更加方便。具体地,可以通过Dropout层进行降维处理,其中,Dropout层是一种在深度学习环境中应用的正规化手段,实现原理如下:在一次训练时的迭代中,对每一层中的神经元(总数为N)以概率P随机剔除,用余下的(1-P)×N个神经元所构成的网络来训练本次迭代中的数据。本实施例中优选概率P为0.5。为提高CNN的表达或分类能力,最直接的方法就是采用更深的网络和更多的神经元,然而复杂的网络也意味着更加容易过拟合。因此接入Dropout层对多个一维的局部特征向量进行正则化处理,得到处理后的多个最优局部特征向量,进而防止CNN模型过拟合。
本实施例中,全连接层中的每个神经元与其前一层的所有神经元进行全连接,用来把前边提取到的特征综合起来。全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息。最后一层全连接层的输出值将被传递给一个输出层进行分类。
在一个实施例中,所述将概率最大的收益结果作为所述假设数据的预测收益结果的步骤S5之后,还包括:
S601:获取各个不同的假设数据各自对应的预测结果;
S602:并基于不同的所述假设数据以及对应的所述预测结果整合成数据报表;
S603:将所述数据报表发送给对应的人员进行判断分析。
如上述步骤S601-S603所述,实现了对预测结果的整合,即可以输入不同的假设数据,而实时数据都是相同的,可以不需要进行改变,只需要改变输入的假设数据即可。然后将假设数据输入后都会得到对应的一个预测结果,基于该预测结果可以生成对应的数据报表,该数据报表为根据不同的假设数据所对应的数据报表。因此,可以针对该数据报表进行更详细的分析,或者作为资金头寸的指导和参考,以便于相关人员进行进一步的分析。
本发明的有益效果:通过经验公式源模型和神经网络源模型的融合模型进行预测,先经过经验公式源模型得到较佳的函数模型,再基于神经网络源模型得到计算公式中的函数模型参数,最终将假设数据计算的预测值,与当前实时数据的预测值相减,从而使得到的数据结果更加准确。为用户提供了一个具有指导性和参考性的预测结果。
参照图2,本发明还提供了一种基于融合模型的预测装置,所述融合模型包括经验公式源模型和神经网络源模型,包括:
接收模块10,用于接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
第一输入模块20,用于将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
第二输入模块30,用于将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
第三输入模块40,用于将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
计算模块50,用于根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
在一个实施例中,第二输入模块30,包括:
相关度计算子模块,用于计算每个维度的实时数据与所述待预测信息之间的相关度值;
实时数据选取子模块,用于选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量;
稀疏处理子模块,用于通过池化的方式对各所述第一特征向量进行稀疏处理,得到各自对应的第二特征向量;
全连接层输入子模块,用于将各所述第二特征向量输入至所述神经网络源模型的全连接层中,得到所述第一函数模型参数。
在一个实施例中,相关度计算子模块,包括:
维度向量提取单元,用于提取所述实时数据集中各个维度对应的维度向量,以及所述待预测信息对应的结果向量;
相关度计算单元,用于根据公式D(X,Y)=f(X,Y)*d2(X,Y)+[1-f(X,Y)]*max[m,d(X,Y)]计算各所述维度向量与所述结果向量的相关度值;其中,D(X,Y)表示所述相关度值,X表示维度向量,Y表示所述结果向量,f(X,Y)表示X和Y的相似度计算函数,0≤f(X,Y)≤1,m为预设的参数,max(a,b)表示取a,b中的较大值,
Figure BDA0003255436070000181
X[i]表示所述维度向量的第i个实时数据,Y[i]表示所述结果向量的第i个实时数据。
在一个实施例中,接收模块10,包括:
目标特征向量信息获取子模块,用于获取各所述实时数据的目标特征向量信息;
位置信息判断子模块,用于根据所述目标特征向量信息判断各所述实时数据所在的位置信息;
实时数据采集子模块,用于通过爬虫脚本在所述位置信息对应的位置处,采集对应的所述实时数据。
在一个实施例中,基于融合模型的预测装置,还包括:
训练数据获取模块,用于从数据库中获取到各种操作数据、对应所述操作数据的历史实时数据,以及对应的实际结果,并分别进行特征向量化处理,分别得到所述操作数据对应的操作向量和所述历史实时数据对应的历史操作向量,以及所述实际结果对应的结果特征向量;
训练数据输入模块,用于将所述操作向量和所述历史操作向量作为初始神经网络的输入,以及将所述结果特征向量作为所述初始神经网络的输出,对所述初始神经网络进行训练;
检测模块,用于当所述初始神经网络收敛后,得到暂时神经网络;
损失值计算模块,用于计算所述暂时神经网络的损失值;
损失值判断模块,用于判断所述损失值是否低于损失预设值;
认定模块,用于若所述损失值低于所述损失预设值,则认定所述暂时神经网络为所述神经网络源模型。
在一个人实施例中,基于融合模型的预测装置,还包括:
异常值计算模块,用于据公式
Figure BDA0003255436070000191
叶算每个实时数据的异常值;其中Zij表示第j个维度中的第i个实时数据的所述异常值,
Figure BDA0003255436070000192
xij表示第j个所述维度中第i个实时数据;
目标实时数据提取模块,用于将|Zij|>Zthr对应的目标实时数据提取出来,并将所述目标实时数据的值与当前的实际信息进行比对,其中Zthr为设定的参数值;
替换模块,用于若比对结果为所述目标实时数据的值错误,则获取所述目标实时数据的准确值并替换所述目标实时数据的值。
在一个实施例中,实时数据选取子模块,包括:
提取单元,用于提取各选取的实时数据以及所述假设数据中的局部特征向量并进行降维处理,得到多个低维度的局部特征向量以及将多个低维度的局部特征向量压缩为多个一维的局部特征向量;
处理单元,用于对所述多个一维的局部特征向量进行正则化处理,得到处理后的多个所述第一特征向量。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种实时数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的基于融合模型的数据预测方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的基于融合模型的数据预测方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种基于融合模型的数据预测方法,其特征在于,包括:
接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各所述数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络源模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
2.如权利要求1所述的基于融合模型的数据预测方法,其特征在于,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数的步骤,包括:
计算每个维度的实时数据与所述待预测信息之间的相关度值;
选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量;
通过池化的方式对各所述第一特征向量进行稀疏处理,得到各自对应的第二特征向量;
将各所述第二特征向量输入至所述神经网络源模型的全连接层中,得到所述第一函数模型参数。
3.如权利要求2所述的基于融合模型的数据预测方法,其特征在于,所述计算每个维度的实时数据与所述待预测信息之间的相关度值的步骤,包括:
提取所述实时数据集中各个维度对应的维度向量,以及所述待预测信息对应的结果向量;
根据公式D(X,Y)=f(X,Y)*d2(X,Y)+[1-f(X,Y)]*max[m,d(X,Y)]计算各所述维度向量与所述结果向量的相关度值;其中,D(X,Y)表示所述相关度值,X表示维度向量,Y表示所述结果向量,f(X,Y)表示X和Y的相似度计算函数,0≤f(X,Y)≤1,m为预设的参数,max(a,b)表示取a,b中的较大值,
Figure FDA0003255436060000021
Figure FDA0003255436060000022
X[i]表示所述维度向量的第i个实时数据,Y[i]表示所述结果向量的第i个实时数据。
4.如权利要求1所述的基于融合模型的数据预测方法,其特征在于,所述接收各个维度的实时数据的步骤,包括:
获取各所述实时数据的目标特征向量信息;
根据所述目标特征向量信息判断各所述实时数据所在的位置信息;
通过爬虫脚本在所述位置信息对应的位置处,采集对应的所述实时数据。
5.如权利要求1所述的基于融合模型的数据预测方法,其特征在于,将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数的步骤之前,还包括:
从数据库中获取到各种操作数据、对应所述操作数据的历史实时数据,以及对应的实际结果,并分别进行特征向量化处理,分别得到所述操作数据对应的操作向量和所述历史实时数据对应的历史操作向量,以及所述实际结果对应的结果特征向量;
将所述操作向量和所述历史操作向量作为初始神经网络的输入,以及将所述结果特征向量作为所述初始神经网络的输出,对所述初始神经网络进行训练;
当所述初始神经网络收敛后,得到暂时神经网络;
计算所述暂时神经网络的损失值;
判断所述损失值是否低于损失预设值;
若所述损失值低于所述损失预设值,则认定所述暂时神经网络为所述神经网络源模型。
6.如权利要求1所述的基于融合模型的数据预测方法,其特征在于,所述将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型的步骤之前,还包括:
根据公式
Figure FDA0003255436060000031
计算每个实时数据的异常值;其中Zij表示第j个维度中的第i个实时数据的所述异常值,
Figure FDA0003255436060000032
Figure FDA0003255436060000033
xij表示第j个所述维度中第i个实时数据;
将|Zij|>Zthr对应的目标实时数据提取出来,并将所述目标实时数据的值与当前的实际信息进行比对,其中Zthr为设定的参数值;
若比对结果为所述目标实时数据的值错误,则获取所述目标实时数据的准确值并替换所述目标实时数据的值。
7.如权利要求2所述的基于融合模型的数据预测方法,其特征在于,所述选取相关度值大于预设相关阈值的维度的实时数据,并与所述假设数据进行特征向量提取和特征向量映射,得到多个第一特征向量的步骤,包括:
提取各选取的实时数据以及所述假设数据中的局部特征向量并进行降维处理,得到多个低维度的局部特征向量以及将多个低维度的局部特征向量压缩为多个一维的局部特征向量;
对所述多个一维的局部特征向量进行正则化处理,得到处理后的多个所述第一特征向量。
8.一种基于融合模型的预测装置,所述融合模型包括经验公式源模型和神经网络源模型,其特征在于,包括:
接收模块,用于接收各个维度的实时数据以及待预测信息,得到第一数据集,以及获取假设数据并基于所述假设数据更新所述第一数据集,得到第二数据集;
第一输入模块,用于将所述第一数据集和所述第二数据集分别输入至预设的经验公式源模型中,得到所述第一数据集对应的第一函数模型,以及所述第二数据集对应的第二函数模型;其中,所述经验公式源模型基于多个数据集以及各数据集对应的函数模型训练而成;所述第一函数模型和所述第二函数模型为基于时间t变化的预测函数模型;
第二输入模块,用于将所述第一数据集和所述第一函数模型输入至预设的神经网络源模型中,得到对应的第一函数模型参数,以及将所述第二数据集和所述第二函数模型输入至所述神经网络模型中,得到对应的第二函数模型参数;其中,所述神经网络源模型基于多个训练集以及所述训练集对应的各种函数模型参数训练而成;
第三输入模块,用于将所述第一函数模型参数输入至所述第一函数模型中,得到第一函数计算公式,以及将所述第二函数模型参数输入至所述第二函数模型中,得到第二函数计算公式;
计算模块,用于根据所述第一函数计算公式和所述第二函数计算公式,得到所述假设数据的预测结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111057981.XA 2021-09-09 2021-09-09 基于融合模型的数据预测方法、装置、设备以及存储介质 Pending CN113744060A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111057981.XA CN113744060A (zh) 2021-09-09 2021-09-09 基于融合模型的数据预测方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111057981.XA CN113744060A (zh) 2021-09-09 2021-09-09 基于融合模型的数据预测方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN113744060A true CN113744060A (zh) 2021-12-03

Family

ID=78737667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111057981.XA Pending CN113744060A (zh) 2021-09-09 2021-09-09 基于融合模型的数据预测方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113744060A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115047894A (zh) * 2022-04-14 2022-09-13 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115047894A (zh) * 2022-04-14 2022-09-13 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质
CN115047894B (zh) * 2022-04-14 2023-09-15 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111737458A (zh) 基于注意力机制的意图识别方法、装置、设备及存储介质
CN112612894B (zh) 意图识别模型的训练方法、装置、计算机设备和存储介质
CN109271958B (zh) 人脸年龄识别方法及装置
CN111553759A (zh) 一种产品信息推送方法、装置、设备及存储介质
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
CN112699941B (zh) 植物病害严重程度图像分类方法、装置、设备和存储介质
CN111724370B (zh) 基于不确定性和概率的多任务图像质量评估方法及系统
CN112182384A (zh) 基于对抗学习的内容推荐方法、装置和计算机设备
CN113221645A (zh) 目标模型训练方法、人脸图像生成方法以及相关装置
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
Ibragimovich et al. Effective recognition of pollen grains based on parametric adaptation of the image identification model
CN113011895A (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
CN115186062A (zh) 多模态预测方法、装置、设备及存储介质
CN113744060A (zh) 基于融合模型的数据预测方法、装置、设备以及存储介质
US20210374545A1 (en) Method and apparatus of increasing knowledge based on uncertainty in neural networks
CN113762005B (zh) 特征选择模型的训练、对象分类方法、装置、设备及介质
CN114692785B (zh) 行为分类方法、装置、设备及存储介质
CN116363445A (zh) 图像角度分类模型训练方法、装置、设备及存储介质
Baghoussi et al. Corrector LSTM: built-in training data correction for improved time-series forecasting
CN115565115A (zh) 一种舾装件智能识别方法、计算机设备
CN115565051B (zh) 轻量级人脸属性识别模型训练方法、识别方法及设备
US20230351493A1 (en) Efficient processing of extreme inputs for real-time prediction of future events
CN116597456A (zh) 签名笔迹鉴定方法、装置、设备及存储介质
US20240202631A1 (en) Machine Learning Systems and Methods for Validating Workflows
CN114840752A (zh) 产品信息推荐处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination