CN110276492A - 一种节点数据预测方法及装置 - Google Patents

一种节点数据预测方法及装置 Download PDF

Info

Publication number
CN110276492A
CN110276492A CN201910549462.1A CN201910549462A CN110276492A CN 110276492 A CN110276492 A CN 110276492A CN 201910549462 A CN201910549462 A CN 201910549462A CN 110276492 A CN110276492 A CN 110276492A
Authority
CN
China
Prior art keywords
data
time period
unit time
training
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910549462.1A
Other languages
English (en)
Inventor
李治
曾岩
李晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201910549462.1A priority Critical patent/CN110276492A/zh
Publication of CN110276492A publication Critical patent/CN110276492A/zh
Priority to PCT/CN2020/084322 priority patent/WO2020258994A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及机器学习领域,尤其涉及一种节点数据预测方法及装置,用以减小节点数据的预测误差,保证预留数据的适度性。本发明实施例包括:获取参考时间段内节点的初始数据;针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;获取SVM模型的模型参数;将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;根据所述预测数据,确定所述节点中的预留数据。

Description

一种节点数据预测方法及装置
技术领域
本发明涉及金融科技(Fintech)中的机器学习领域,尤其涉及一种节点数据预测方法及装置。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如针对包括头寸数据在内的节点数据进行计算和预测。
头寸其实就是款项的意思,可指投资者拥有或借用的资金数量。银行头寸是银行系统对于可用资金调度的一个专业的叫法,指的是银行当前所有可以运用的资金的总和,主要包括在央行的超额准备金、存放同业清算款项净额、银行存款以及现金等部分。每个银行或者证券业都有自己的资金头寸。
银行如果头寸不能满足业务需要,出现客户挤兑或者无资金发放贷款,势必会失去客户,从而影响效益;而如果头寸相对积压,将会增加银行的资金机会成本。因此,银行头寸管理的主要任务是在保持资金流动性需要的前提下,将现有头寸的机会成本降到最低。银行头寸应保持头寸的总量适度,即银行头寸总量要保持在一个适度的规模上。
现有技术中一般利用多元线性回归分析的方法对节点中的预留数据进行预测,通过选取可能会对预留数据有影响的因素,通过线性回归得到每个因素的权重系数。这种方法预测结果误差较大,且不同因素之间会有相关性互相干扰,从而进一步增加了预测误差。
发明内容
本申请提供一种节点数据预测方法及装置,用以减小节点数据的预测误差,保证预留数据的适度性。
本发明实施例提供的一种节点数据预测方法,包括:
获取参考时间段内节点的初始数据;
针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
获取SVM模型的模型参数;
将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
根据所述预测数据,确定所述节点中的预留数据。
一种可选的实施例中,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据,包括:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
一种可选的实施例中,所述获取SVM模型的模型参数之前,还包括:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
一种可选的实施例中,所述将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数之后,所述根据所述预测数据,确定所述节点中的预留数据之前,还包括:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述根据所述预测数据,确定所述节点中的预留数据,包括:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
本发明实施例还提供一种节点数据预测装置,包括:
获取单元,用于获取参考时间段内节点的初始数据;
计算单元,用于针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
所述获取单元,还用于获取支持向量机SVM模型的模型参数;
预测单元,用于将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
控制单元,用于根据所述预测数据,确定所述节点中的预留数据。
一种可选的实施例中,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述计算单元,具体用于:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
一种可选的实施例中,还包括训练单元,用于:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
一种可选的实施例中,还包括误差单元,用于:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述控制单元,还用于:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
本发明实施例还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上所述的方法。
本发明实施例中,获取参考时间段内节点的初始数据,针对参考时间段内的任一参考单位时间段,根据参考单位时间段内的初始数据,确定参考时间段的参考数据,这样,参考时间段内的所有参考数据均与时间相关,组成时间序列数据。另一方面,又获取SVM模型的模型参数。将模型参数和参考时间段内的所有参考数据输入SVM模型中,计算出预测时间段的预测数据。再依据预测数据,确定节点中的预留数据。本发明实施例利用SVM模型对预测时间段进行预测,可以进行实时预留数据预测,且确定的参考数据为时间序列数据,受影响预留数据的所有相关因素合力影响,体现了所有因素的信息,因此将参考数据作为SVM模型的输入,准确率高。同时,只使用参考数据,计算量小,数据源要求简单,减轻了计算压力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种可能的系统构架的结构示意图;
图2为本发明实施例提供的一种节点数据预测方法的流程示意图;
图3为本发明具体实施例提供的节点数据预测方法的流程示意图;
图4为本发明实施例提供的一种节点数据预测装置的结构示意图;
图5为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明实施例所适用的一种系统架构,包括头寸节点101、头寸管理设备102以及头寸预测设备103。头寸节点101、头寸管理设备102以及头寸预测设备103可以是计算机等网络设备,可以是一个独立的设备,也可以是多个服务器所形成的服务器集群。优选地,头寸节点101、头寸管理设备102以及头寸预测设备103可以采用云计算技术进行信息处理。
其中,头寸节点101中有业务资金的流入流出,头寸管理设备102从各个头寸节点101中收集数据,对各个头寸节点101进行头寸监测和管理。头寸预测设备103为头寸管理设备102的辅助设备,用于对各个头寸节点101进行头寸预测,从而给头寸管理设备102以参考,使得头寸管理设备102可以根据头寸预测设备103的实时预测,调整头寸节点101中的头寸数据。
为了便于理解,下面对本发明实施例中可能涉及的名词进行定义和解释。
SVM:支持向量机(Support Vector Machine),一种基于机器学习的分类回归算法,是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。一般应用于人像识别、文本分类等模式识别场景。
Spark:一种开源的分布式平台下的计算框架。
Spark Mlib:一套基于Spark计算框架的机器学习开发包。
头寸预测:对各个头寸节点流入流出资金进行预测,给业务提供一个明确的量化数据参考,避免出现资金不足或头寸安排过多的情况。本发明实施例中节点的预留数据以头寸数据为例进行介绍。
时间序列:是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。
为了实施预测节点的头寸数据,并提高预测的准确性,本发明实施例提供了一种节点数据预测方法,如图2所示,本发明实施例提供的节点数据预测方法包括以下步骤:
步骤201、获取参考时间段内节点的初始数据。
其中,节点中的初始数据,可以为该节点中参考时间段内每个时间点的实时流入数据或者流出数据,可以利用正负号标记流入流出数据,如某一时间点的初始数据为正,则表明为流入数据;为负,则表明为流出数据。
这里的参考时间段为预测时间段之前的时间段,即根据参考时间段内的数据对预测时间段内的数据进行预测。参考时间段与预测时间段之间的距离越近,参考数据与预测数据之间的关联性越高,则预测的准确性越高。因此,太久远的历史数据对预测的数据影响不大,本发明实施例中的参考时间段可以取最近1000小时内的数据。
举例来说,表1示出了头寸节点1的实时资金流入数据。
表1
头寸节点 时间 流入金额
头寸节点1 20190101 11:12:13 253 1234.12
头寸节点1 20190101 11:12:13 123 1223.34
头寸节点1 20190101 11:11:22 321 8976.67
头寸节点1 20190101 11:11:11 321 45645.00
…… …… ……
如表1所示,头寸节点1中在2019年1月1日的11时12分13秒253这个时间点,流入资金为1234.12元;在2019年1月1日11时12分13秒123这个时间点,流入资金为1223.34元;在2019年1月1日11时11分22秒321这个时间点,流入资金为8976.67元;在2019年1月1日11时11分11秒321这个时间点,流入资金为45645.00元。则头寸节点1的初始数据为1234.12、1223.34、8976.67、45645.00。
对于流出数据,可以另外进行统计,其与流入数据的计算方式类似,这里不多做赘述。
步骤202、针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据。
其中,初始数据为每个时间点的资金流动数据,参考数据为每个参考单位时间段内该节点的资金流动数据,参考单位时间段可以取为一分钟、一刻钟、一天等,一般根据需要,参考单位时间段取一个小时,即根据每个小时内节点中各个时间点的流入或者流出数据,确定该节点每个小时的资金流动情况。
步骤203、获取SVM模型的模型参数。
具体实施过程中,SVM模型可以从Spark Mlib包里调用,或者也可以利用开发语言python实现。SVM模型的模型参数可以为预先计算得出,需要进行预测时直接获取即可;或者在预测的过程中,模型参数也实时计算修正,以提高模型计算的准确性。
步骤204、将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据。
本发明实施例中,获取参考时间段内节点的初始数据,针对参考时间段内的任一参考单位时间段,根据参考单位时间段内的初始数据,确定参考时间段的参考数据,这样,参考时间段内的所有参考数据均与时间相关,组成时间序列数据。另一方面,又获取SVM模型的模型参数。将模型参数和参考时间段内的所有参考数据输入SVM模型中,计算出预测时间段的预测数据。再依据预测数据,确定节点中的头寸数据。本发明实施例利用SVM模型对预测时间段进行预测,可以进行实时头寸数据预测,且确定的参考数据为时间序列数据,受影响头寸数据的所有相关因素合力影响,体现了所有因素的信息,因此将参考数据作为SVM模型的输入,准确率高。同时,只使用参考数据,计算量小,数据源要求简单,减轻了计算压力。
进一步地,为了增加模型计算的准确性,可以对参考时间段内的数据对数化处理。所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据,包括:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
具体实施过程中,首先将参考单位时间段内每个时间点的初始数据相加,其中正负初始数据相互抵消。例如,表2示出了每个单位时间段内头寸节点1的资金流动数据。
表2
头寸节点 时间段 流入金额
头寸节点1 20190101 11点-12点 12323432.32
头寸节点1 20190101 10点-11点 34534534.67
头寸节点1 20190101 9点-10点 12312342.45
头寸节点1 20190101 8点-9点 32132423.00
…… …… ……
如表2所示,头寸节点1中在2019年1月1日的11时至12时,流入资金为12323432.32元;2019年1月1日的10时至11时,流入资金为34534534.67元;2019年1月1日的9时至10时,流入资金为12312342.45元;2019年1月1日的8时至9时,流入资金为32132423.00元。即头寸节点1的加权数据为12323432.32、34534534.67、12312342.45、32132423.00……。
之后,用后一个参考单位时间段的加权数据与前一个参考单位时间内段的加权数据相对比,并将比值取对数。表3示出了参考时间段内对数化处理后得到的参考数据。
表3
如表3所示,对数化处理后得到的参考数据,标示出每一单位时间段相对于上一单位时间段的变化率。将这种变化率输入SVM算法模型中,提高了预测的准确性。
进一步地,利用SVM模型进行计算之前,需训练出模型参数。所述获取SVM模型的模型参数之前,还包括:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
具体实施过程中,根据历史时间段内的很多初始数据,将通过上文介绍的根据初始数据计算出的对数化处理后的变化率作为训练数据,训练数据即为训练单位时间段内该节点的对数化处理后的参数数据。将各个单位时间段内的训练数据作为SVM模型的输入参数,将各个单位时间段各自对应的时间序列数据作为SVM模型的输出参数,其中一个单位时间段对应的所述时间序列数据为该单位时间段之前的预设数量的单位时间段对应的训练数据按照时间由先到后的顺序排列生成的数据;显然在获取到大量的上述输入参数和输出参数的对应关系后,基于现有的SVM核函数的训练方法可以得到SVM模型的模型参数。
需要说明的是,训练过程对应的历史时间段与预测过程对应的参考时间段,可以为同一时间段,也可以为不同时间段,若历史时间段与参考时间段为不同时间段时,两个时间段可以有重叠也可以没有重叠。例如,历史时间段为当前时间点之前的1000个小时,参考时间段为当前时间点之前的999个小时;或者历史时间段为2018年1月至3月的每天上午9点至11点,参考时间段为2019年1月至3月的每天上午9点至11点。历史时间段与参考时间段的选取依据计算需要,本发明实施例中不做限制。
此外,训练数据的计算方式与上述参考数据的计算方式相似,这里不多做赘述。
本发明实施例中,SVM模型的模型参数可以为动态数据,或者为相对静态的数据。即,模型参数为动态数据时,每次进行头寸数据预测时,均实时计算模型参数,这样模型参数的准确性较高,但需要实时计算得出,服务器计算压力较大。模型参数为相对静态的数据时,可以预先计算出模型参数并存储,需要进行头寸数据预测时,直接从内存中获取,此时模型参数可以每隔一段较长时间,如一个月或者半年,进行一次更新。这种方式下,服务器无需实时计算模型参数,但其准确性较低。
值得注意地,显然在计算预设时间段的预测数据时,可以将预设时间段对应的时间序列数据(如上文介绍,时间序列数据为单位时间段之前的预设数量的单位时间段对应的训练数据按照时间由先到后的顺序排列生成的数据)作为输入参数输入通过上文训练出的SVM模型,通过上文训练好的SVM模型即可计算出在预设时间段后一时刻的对数化处理后的变化率,作为预测数据。
步骤205、根据所述预测数据,确定所述节点中的预留数据。
可以理解地,由于预测数据为上文提到地变化率,所以根据上文表3的计算方法的反向计算,在已知预设时间段的流入资金以及预测数据后就可以计算出预留数据了。现实情况中,银行节点会根据前几天节点中资金的流动情况以及经验,预计出当天节点中流出资金与流入资金的差值,从而在当天开始营业之前账户中预留一定的资金,该资金即为头寸。因此,本发明实施例中,银行节点可以依据预测数据确定预留数据,即头寸数据。
可选地,由于算法仍具有一定的误差,为了进一步提高准确性,本发明实施例将预测数据与历史时间中的真实值相对比,确定误差数据。所述将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数之后,所述根据所述预测数据,确定所述节点中的预留数据之前,还包括:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练单位时间段的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述根据所述预测数据,确定所述节点中的预留数据,包括:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
具体实施过程中,对历史时间段内的每个训练单位时间段中的头寸数据进行预测,得到历史时间段内的多个预测数据。具体计算每个训练单位时间段中的预测数据的方法与计算参考数据的方法相似。举例来说,历史时间段包括N个训练单位时间段,分别记为T1、T2、……TN。针对T1,将T1之前的训练数据,以及模型参数输入SVM模型,得到T1的预测数据,记为X1;将X1与T1的真实数据,即T1的训练数据,相减,得到T1的误差数据。针对T2至TN,均根据上述方式得到T2的误差数据至TN的误差数据。进一步,可以根据T1至TN的误差数据,算出误差数据的均值μ与方差σ,作为该SVM模型的历史误差。
最后,根据预测数据和历史误差,确定头寸数据。现实场景中,计算出的预测数据是一个预测值,将其提供给银行节点后,若银行节点直接将实际的头寸等于预测数据,则没有考虑到误差,且无法应付突发情况。因此,往往银行节点会在预测数据的基础上增加一些数据量,即实际的头寸数据会大于预测数据。因此,本发明实施例中向银行节点提供增加数据的参考值。可选的,可以根据误差数据的均值和/或方差得到误差范围,误差范围的个数可以根据需要选择,如选择三个误差范围,分别为μ、μ+σ和μ+2σ,在不同的需求条件下可以从这三个误差范围中选择一个加上预测数据,作为最终确定的节点的头寸数据。本发明实施例中的误差范围除了上述形式,还可以为μ和2μ,或者如σ、2σ、3σ和4σ,这里只为举例,不做限制。
为了更清楚地理解本发明,下面基于图1的架构,以具体实施例对上述流程进行详细描述,具体实施例的步骤如图3所示,包括:
步骤S301:头寸预测设备从头寸管理设备中,获取头寸节点1当前时间点之前999个小时内的初始数据。
步骤S302:针对任一个小时,头寸预测设备将该小时内的初始数据相加,得到该小时的加权数据,并与该小时的前一小时的加权数据相对比,并将比值取对数,得到该小时的参考数据。
步骤S303:头寸预测设备从头寸管理设备中,获取头寸节点1当前时间点之前1000个小时内的初始数据。
步骤S304:针对任一个小时,头寸预测设备将该小时内的初始数据相加,得到该小时的加权数据,并与该小时的前一小时的加权数据相对比,并将比值取对数,得到该小时的训练数据。
步骤S305:头寸预测设备将当前时间点之前1000个小时中,每一小时的训练数据作为参数,输入SVM算法模型中进行训练,得到SVM算法模型的模型参数。其中,核函数采用高斯径向基函数做为SVM核函数。
步骤S306:头寸预测设备将999个参考数据,输入训练好的SVM算法模型中进行计算,得到变化率数据,记为V。
步骤S307:头寸预测设备确定当前时间点之前一个小时内的参考数据,记为A,根据变化率数据V和参考数据A,计算出预测数据Y。其中预测数据Y根据以下公式计算得到:
Y=A·exp(V)
步骤S308:头寸预测设备获取误差范围。
步骤S309:头寸预测设备将误差范围与预测数据Y向头寸管理设备发送。
步骤S310:头寸管理设备根据误差范围与预测数据确定头寸节点1的头寸数据。
本发明实施例还提供了一种节点数据预测装置,如图4所示,包括:
获取单元401,用于获取参考时间段内节点的初始数据;
计算单元402,用于针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
所述获取单元401,还用于获取支持向量机SVM模型的模型参数;
预测单元403,用于将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
控制单元404,用于根据所述预测数据,确定所述节点中的预留数据。
可选的,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述计算单元402,具体用于:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
可选的,还包括训练单元405,用于:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
可选的,还包括误差单元406,用于:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述控制单元404,还用于:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
基于相同的原理,本发明还提供一种电子设备,如图5所示,包括:
包括处理器501、存储器502、收发机503、总线接口504,其中处理器501、存储器502与收发机503之间通过总线接口504连接;
所述处理器501,用于读取所述存储器502中的程序,执行下列方法:
获取参考时间段内节点的初始数据;
针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
获取支持向量机SVM模型的模型参数;
将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
根据所述预测数据,确定所述节点中的预留数据。
可选的,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述处理器501,具体用于:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
可选的,所述处理器501,具体用于:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
可选的,所述处理器501,具体用于:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种节点数据预测方法,其特征在于,所述方法包括:
获取参考时间段内节点的初始数据;
针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
获取支持向量机SVM模型的模型参数;
将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
根据所述预测数据,确定所述节点中的预留数据。
2.如权利要求1所述的方法,其特征在于,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据,包括:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
3.如权利要求1所述的方法,其特征在于,所述获取SVM模型的模型参数之前,还包括:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
4.如权利要求3所述的方法,其特征在于,所述将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数之后,所述根据所述预测数据,确定所述节点中的预留数据之前,还包括:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述根据所述预测数据,确定所述节点中的预留数据,包括:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
5.一种节点数据预测装置,其特征在于,包括:
获取单元,用于获取参考时间段内节点的初始数据;
计算单元,用于针对所述参考时间段内的任一参考单位时间段,根据所述参考单位时间段内的初始数据,确定所述参考单位时间段的参考数据;
所述获取单元,还用于获取支持向量机SVM模型的模型参数;
预测单元,用于将所述模型参数以及所述参考时间段内的所有参考数据,输入所述SVM模型,计算出预测时间段的预测数据;
控制单元,用于根据所述预测数据,确定所述节点中的预留数据。
6.如权利要求5所述的装置,其特征在于,所述参考时间段内包括N个参考单位时间段;
针对第i个参考单位时间段,所述计算单元,具体用于:
将所述参考单位时间段内的初始数据相加,确定所述参考单位时间段的加权数据;
将第i个参考单位时间段的加权数据与所述第i-1个参考时间段的加权数据相比,并将比值取对数,得到所述第i个参考单位时间段的参考数据;其中1<i≤N。
7.如权利要求5所述的装置,其特征在于,还包括训练单元,用于:
获取历史时间段内节点的初始数据;
针对所述历史时间段内的任一训练单位时间段,根据所述训练单位时间段内的初始数据,确定所述训练单位时间段的训练数据;
将所述历史时间段内的训练数据作为参数,输入所述SVM模型中,确定所述SVM模型的模型参数。
8.如权利要求7所述的装置,其特征在于,还包括误差单元,用于:
针对所述历史时间段内的任一训练单位时间段,将所述训练单位时间段之前的训练数据,以及所述模型参数输入所述SVM模型,确定所述训练单位时间段的预测数据;将所述训练单位时间段的预测数据与所述训练单位时间段的训练数据相比较,确定所述训练单位时间段的误差数据;
根据所述历史时间段内所有训练单位时间段的误差数据,确定所述SVM模型的历史误差;
所述控制单元,还用于:
根据所述预测数据以及所述SVM模型的历史误差,确定所述节点中的预留数据。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1~4任一所述方法。
CN201910549462.1A 2019-06-24 2019-06-24 一种节点数据预测方法及装置 Pending CN110276492A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910549462.1A CN110276492A (zh) 2019-06-24 2019-06-24 一种节点数据预测方法及装置
PCT/CN2020/084322 WO2020258994A1 (zh) 2019-06-24 2020-04-10 一种节点数据预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910549462.1A CN110276492A (zh) 2019-06-24 2019-06-24 一种节点数据预测方法及装置

Publications (1)

Publication Number Publication Date
CN110276492A true CN110276492A (zh) 2019-09-24

Family

ID=67961679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910549462.1A Pending CN110276492A (zh) 2019-06-24 2019-06-24 一种节点数据预测方法及装置

Country Status (2)

Country Link
CN (1) CN110276492A (zh)
WO (1) WO2020258994A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143169A (zh) * 2019-12-30 2020-05-12 杭州迪普科技股份有限公司 异常参数检测方法及装置、电子设备、存储介质
CN111752816A (zh) * 2020-06-30 2020-10-09 深圳前海微众银行股份有限公司 一种操作系统的分析方法及装置
WO2020258994A1 (zh) * 2019-06-24 2020-12-30 深圳前海微众银行股份有限公司 一种节点数据预测方法及装置
CN113159790A (zh) * 2021-05-19 2021-07-23 中国银行股份有限公司 一种异常交易识别方法和装置
US20220230236A1 (en) * 2021-01-20 2022-07-21 Bank Of America Corporation Artificial intelligence (ai) architecture with smart, automated triggers of incoming and outgoing actions and usage

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114154696A (zh) * 2021-11-19 2022-03-08 中国建设银行股份有限公司 资金流预测方法、系统、计算机设备及存储介质
CN116740946B (zh) * 2023-08-14 2023-11-03 山东华夏高科信息股份有限公司 一种公路车流量大数据分析处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424598A (zh) * 2013-09-06 2015-03-18 株式会社日立制作所 现金需求量预测装置与方法
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN106952420A (zh) * 2016-01-07 2017-07-14 株式会社日立制作所 自动柜员机现金管理装置、系统及方法
CN109697522A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 一种数据预测的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3698433B2 (ja) * 2002-09-06 2005-09-21 株式会社ティーエスシーコンサルティング 安全在庫量算出装置、安全在庫量算出プログラム及び発注点算出装置
CN103258388B (zh) * 2012-02-17 2015-09-02 日立(中国)研究开发有限公司 自动交易装置和服务器、以及用于预测现金需求量的方法
CN106997497A (zh) * 2017-06-13 2017-08-01 中南大学 一种基于时间序列和节假日信息的银行备付金预测方法
CN110276492A (zh) * 2019-06-24 2019-09-24 深圳前海微众银行股份有限公司 一种节点数据预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424598A (zh) * 2013-09-06 2015-03-18 株式会社日立制作所 现金需求量预测装置与方法
CN106952420A (zh) * 2016-01-07 2017-07-14 株式会社日立制作所 自动柜员机现金管理装置、系统及方法
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN109697522A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 一种数据预测的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何昆: "银行自助设备备付金预测模型探索", 中小企业管理与科技(上旬刊), no. 1, 5 January 2015 (2015-01-05), pages 53 - 55 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020258994A1 (zh) * 2019-06-24 2020-12-30 深圳前海微众银行股份有限公司 一种节点数据预测方法及装置
CN111143169A (zh) * 2019-12-30 2020-05-12 杭州迪普科技股份有限公司 异常参数检测方法及装置、电子设备、存储介质
CN111143169B (zh) * 2019-12-30 2024-02-27 杭州迪普科技股份有限公司 异常参数检测方法及装置、电子设备、存储介质
CN111752816A (zh) * 2020-06-30 2020-10-09 深圳前海微众银行股份有限公司 一种操作系统的分析方法及装置
US20220230236A1 (en) * 2021-01-20 2022-07-21 Bank Of America Corporation Artificial intelligence (ai) architecture with smart, automated triggers of incoming and outgoing actions and usage
CN113159790A (zh) * 2021-05-19 2021-07-23 中国银行股份有限公司 一种异常交易识别方法和装置

Also Published As

Publication number Publication date
WO2020258994A1 (zh) 2020-12-30

Similar Documents

Publication Publication Date Title
CN110276492A (zh) 一种节点数据预测方法及装置
AU2021232839B2 (en) Updating Attribute Data Structures to Indicate Trends in Attribute Data Provided to Automated Modelling Systems
CN108846520B (zh) 贷款逾期预测方法、装置以及计算机可读存储介质
WO2021147557A1 (zh) 客户画像方法、装置、计算机可读存储介质及终端设备
CN110830448B (zh) 目标事件的流量异常检测方法、装置、电子设备及介质
Kabbani et al. Deep reinforcement learning approach for trading automation in the stock market
CN111429006A (zh) 金融风险指标预测模型构建、风险态势预测方法和装置
CN111008896A (zh) 金融风险预警方法、装置、电子设备及存储介质
CN110942248B (zh) 交易风控网络的训练方法及装置、交易风险检测方法
CN111178537B (zh) 一种特征提取模型训练方法及设备
CN113705929B (zh) 一种基于负荷特征曲线及典型特征值融合的春节假期负荷预测方法
WO2019019346A1 (zh) 资产配置策略获取方法、装置、计算机设备和存储介质
US11574096B1 (en) Systems and methods for time series simulation
CN111738504A (zh) 企业财务指标资金量预测方法和装置、设备及存储介质
CN117764706A (zh) 一种风险识别方法、装置及电子设备
Zomchak et al. Creditworthiness of Individual Borrowers Forecasting with Machine Learning Methods
CN111461353A (zh) 一种模型训练的方法和系统
CN112308293B (zh) 违约概率预测方法及装置
CN113869700A (zh) 一种绩效指标预测方法、装置、电子设备和存储介质
US11409502B2 (en) Intelligent controls for end-user computing
Borysenko et al. Intelligent forecasting in multi-criteria decision-making.
US8712890B2 (en) Systems and methods for optimizing capital structure of a financial institution
CN115545088B (zh) 模型构建方法、分类方法、装置和电子设备
KR101830090B1 (ko) 포트폴리오 최적화 시스템 및 그 방법, 그리고 이 방법이 구현된 계산 프로그램을 저장하는 실행 가능한 디지털 매체
Janosek et al. Knowledge discovery in dynamic data using neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination