CN108615096A - 服务器、金融时序数据的处理方法及存储介质 - Google Patents
服务器、金融时序数据的处理方法及存储介质 Download PDFInfo
- Publication number
- CN108615096A CN108615096A CN201810441414.6A CN201810441414A CN108615096A CN 108615096 A CN108615096 A CN 108615096A CN 201810441414 A CN201810441414 A CN 201810441414A CN 108615096 A CN108615096 A CN 108615096A
- Authority
- CN
- China
- Prior art keywords
- data
- missing values
- time series
- digit
- intercepted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 230000000306 recurrent effect Effects 0.000 claims abstract description 57
- 238000003062 neural network model Methods 0.000 claims abstract description 54
- 241001269238 Data Species 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 80
- 238000012360 testing method Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 22
- 238000012795 verification Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 21
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 9
- 239000010931 gold Substances 0.000 claims description 9
- 229910052737 gold Inorganic materials 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 8
- 230000007774 longterm Effects 0.000 claims 1
- 238000005070 sampling Methods 0.000 description 10
- 230000007812 deficiency Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007787 long-term memory Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种服务器、金融时序数据的处理方法及存储介质,该方法包括:设置不同预定时间步长的滑动窗口,利用滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到样本数据;利用各样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各模型作为预测模型;获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;将待输入数据输入至各预测模型中,获取各预测模型输出的预测值的平均值作为该缺失值的填充值。本发明能够预测得到准确、客观的缺失值。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种服务器、金融时序数据的处理方法及存储介质。
背景技术
金融时序数据具有时间序列的统计特征,具有很多类别,例如,价量的金融时序数据包括:股票、期货、外汇等标的的开盘价、收盘价、最高价、最低价、成交量数据;又如,衍生指标的金融时序数据包括:中债国债到期收益率-中债企业债到期收益率、风险溢价、股息率、CR指标、大小盘换手率比值、RSRS指标、沪深300溢价率、沪深300主动买入额等。在实际情况中,金融时序数据由于各种原因引起数据的缺失,例如:1、上市公司股票停牌导致当日股票开盘价、收盘价、最高价、最低价、成交量等信息丧失;2、在公开平台无法获取相应的金融时序数据;3、在公开平台获取的金融时序数据与实际值存在显著偏差,等。
传统的缺失值处理方法包括人工填写、特殊值填充、均值填充、就近补齐、聚类填充等。但对于金融时序数据而言,由于其在时间上存在依赖关系,传统的简单处理方法得到的缺失值不准确,无法最大程度地模拟真实的金融时序数据的分布,易造成信息损失,影响了后续对金融时序数据的研究。
发明内容
本发明的目的在于提供一种服务器、金融时序数据的处理方法及存储介质,旨在预测得到准确、客观的缺失值。
为实现上述目的,本发明提供一种服务器,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
优选地,所述利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型的步骤,具体包括:
将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;
在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;
利用测试集对训练后的循环神经网络模型的准确率进行测试;
若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;
若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
优选地,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,具体包括:
根据该缺失值的位数确定截取数据的位数,并截取在该缺失值的位置前方与所确定的位数相同的位数的金融时序数据,以所截取的数据作为待输入数据。
优选地,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,进一步包括:
若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;
若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
为实现上述目的,本发明还提供一种金融时序数据的处理方法,所述金融时序数据的处理方法包括:
S1,设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
S2,利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
S3,获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
S4,将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
优选地,所述步骤S2,具体包括:
将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;
在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;
利用测试集对训练后的循环神经网络模型的准确率进行测试;
若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;
若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
优选地,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,具体包括:
根据该缺失值的位数确定截取数据的位数,并截取在该缺失值的位置前方与所确定的位数相同的位数的金融时序数据,以所截取的数据作为待输入数据。
优选地,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,进一步包括:
若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;
若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
优选地,所述预定时间步长为6个时间单位、11个时间单位及16个时间单位,所述预定的循环神经网络模型为长短期记忆网络模型与门控循环单元模型组成的混合模型。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的金融时序数据的处理方法的步骤。
本发明的有益效果是:本发明对不含有缺失值的金融时序数据,设置不同时间步长的滑动窗口截取数据,再对截取的数据进行采样得到不同时间步长对应的样本数据,分别将样本数据划分训练集及测试集训练预定的循环神经网络模型,得到不同时间步长对应的预测模型;对于含有缺失值的金融时序数据,定位缺失值的位置及确定缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,将数据输入至各预测模型中,得到各预测模型输出的预测值,以各预测值的平均值作为该缺失值的填充值,本发明利用循环神经网络模型处理和预测金融时序数据中的缺失值,能够捕捉到金融时序数据前后的依赖关系,缺失值的填充值由多种模型的平均值给出,更加客观、准确,能够最大程度地还原真实的金融时序数据的整体分布。
附图说明
图1为本发明服务器一实施例的硬件架构的示意图;
图2为LSTM模型的结构示意图;
图3为图2所示修改后的LSTM模型的结构示意图;
图4为本发明金融时序数据的处理方法一实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,为本发明服务器一实施例的硬件架构的示意图。服务器1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述服务器1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,服务器1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的处理系统。需要指出的是,图1仅示出了具有组件11-13的服务器1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为服务器1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是服务器1的内部存储单元,例如该服务器1的硬盘;在另一些实施例中,该非易失性存储介质也可以是服务器1的外部存储设备,例如服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于服务器1的操作系统和各类应用软件,例如存储本发明一实施例中的处理系统的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器1的总体操作,例如执行与所述其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行处理系统等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述服务器1与其他电子设备之间建立通信连接。本实施例中,网络接口13主要用于将服务器1与一个或多个终端设备2相连,在服务器1与一个或多个终端设备2之间建立数据传输通道和通信连接。
所述处理系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。
在一实施例中,上述处理系统被所述处理器12执行时实现如下步骤:
设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
其中,预定时间步长包括6个时间单位、11个时间单位及16个时间单位,时间单位指的是金融时序数据的粒度单位,例如,以天为粒度的金融时序数据,其时间单位为天;以分钟为粒度的高频金融时序数据,其时间单位为分钟,等。
对于6个时间单位的滑动窗口,对应的窗口数据的位数为6位,采样得到的样本数据的位数为6位;对于11个时间单位的滑动窗口,对应的窗口数据的位数为11位,采样得到的样本数据的位数为6位,例如,采样得到的样本数据为(x1,x3,x5,x7,x9,x11),即采样窗口数据中的第1、3、5、7、9、11位的数据;对于16个时间单位的滑动窗口,对应的窗口数据的位数为16位,采样得到的样本数据的位数为6位,例如,采样得到的样本数据为(x1,x4,x7,x10,x13,x16),即采样窗口数据中的第1、4、7、10、13、16位的数据。
其中,设置设置不同预定时间步长的滑动窗口的目的在于在样本数据的长度不变的情况下,扩大所捕获信息的久远度及联系关系。对不含有缺失值的金融时序数据进行采样得到样本数据,利用该样本数据来训练模型,以得到准确度较高的模型。
利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
其中,预定的循环神经网络模型为两个或两个以上的循环神经网络的混合模型,优选地,为长短期记忆网络模型(Long Short-Term Memory,LSTM)与门控循环单元模型(Gated Recurrent Unit,GRU)组成的混合模型,LSTM模型及GRU模型均可用于捕捉时间序列前后的依赖关系。
在一实施例中,该步骤包括:将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;利用测试集对训练后的循环神经网络模型的准确率进行测试;若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
其中,由于各预定时间步长对应的样本数据可以视为是独立同分布的,故对于训练集和测试集采取随机随机抽样,训练集所占的比例为70%,测试集所占的比例为30%,例如,训练集包括7万份样本数据,测试集包括3万份样本数据。
优选地,在训练集中,采用交叉验证的方式进行训练,即将训练集中的样本数据分为10份,每次取9份进行训练,取1份样本数据作为验证集,以利用验证集对训练中的循环神经网络模型的参数进行测试。在训练集上进行训练,并且在验证集上获取测试结果,随着训练次数的增加,如果在验证集上发现测试误差上升,即测试误差大于等于预定的误差阈值,则停止训练,以得到训练后的循环神经网络模型作为下述测试集测试的模型,可以有效避免模型的过度拟合。
具体地,利用训练集对LSTM模型进行训练,LSTM模型结构可采用Bi-directionalLSTM结构,训练集的样本数据包括(X1,X2,X3,X4,X5,X6),如图2所示,(X1,X2,X3,X4,X5)为输入层,A为隐含层,St为输出。其中,隐含层A是LSTM模型的记忆单元,为模型的参数,根据当前输入层的输入和上一步隐含层的输出进行计算得到。在测试集对训练后的LSTM模型的准确率进行测试时,将输出St与样本数据中的X6进行比较,以进行测试,测试结果表明模型对金融时序数据分布的刻画能力。如果LSTM模型的准确率大于等于预定准确率阈值(例如,0.9),则LSTM模型符合要求,将该训练后的LSTM模型作为预测模型;如果LSTM模型的准确率小于预定准确率阈值,则LSTM模型不符合要求,修改LSTM模型的隐含层结构,如图3所示,本实施例中,将每一个时间点对应输入的样本数据的隐含层由单隐层的形式修改为双隐含层堆叠结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
GRU模型和LSTM模型的结构类似,只是隐含层的结构比LSTM模型复杂。利用上述相同的训练集对GRU模型进行训练,训练GRU模型与训练LSTM模型的过程基本一致,且在训练集抽取部分样本数据作为验证集,可以有效避免模型的过度拟合。在训练后利用测试集对训练后的GRU模型进行测试,以使得GRU模型的准确率大于等于预定的准确率阈值,如果GRU模型的准确率小于该准确率阈值,则考虑修改GRU模型的结构,修改方式与LSTM模型类似。
通过上述的训练及测试过程,拟合得到各预定时间步长对应的LSTM模型+GRU模型组合成的混合模型,作为预测模型。
获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
本实施例中,首先定位缺失值的位置,由于金融时序数据是时序序列,因此可以通过缺失值所在的时间点定位缺失值的位置;然后确定每一处缺失值的位数,例如为1位或2位等。根据将要预测的缺失值的位数,确定输入模型的金融时序数据的位数,截取在缺失值前方的若干位数据,作为待输入数据。
其中,缺失值的位数一般为1位或2位,待输入数据优选为5位、6位或者7位,少于5位和多于7位通常难以取得较好的效果,因为少于5位则捕获的时序信息较少,而多于7位则时序较长,信息偏差较大。优选地,如下表1所示,缺失值的位数与待输入数据的位数的对应关系为:
缺失值的位数 | 待输入数据的位数 |
1 | 5 |
1 | 6 |
2 | 6 |
1 | 7 |
2 | 7 |
表1
在表1中,若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
本实施例中,将待输入数据分别输入至各GRU模型和LSTM模型组成的混合模型的预测模型中,即分别输入至6个时间单位对应的混合模型、11个时间单位对应的混合模型、16个时间单位对应的混合模型中,获取三个混合模型对应输出的预测值V1、V2、V3,计算该缺失值的填充值V=(V1+V2+V3)/3,缺失值的位数为2位的也是计算输出的对应位置的预测值的平均值。该缺失值的填充值V能够捕捉到金融时序数据前后的依赖关系,且由三种混合模型的平均值给出,更加客观、准确。
与现有技术相比,本发明对不含有缺失值的金融时序数据,设置不同时间步长的滑动窗口截取数据,再对截取的数据进行采样得到不同时间步长对应的样本数据,分别将样本数据划分训练集及测试集训练预定的循环神经网络模型,得到不同时间步长对应的预测模型;对于含有缺失值的金融时序数据,定位缺失值的位置及确定缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,将数据输入至各预测模型中,得到各预测模型输出的预测值,以各预测值的平均值作为该缺失值的填充值,本发明利用循环神经网络模型处理和预测金融时序数据中的缺失值,能够捕捉到金融时序数据前后的依赖关系,缺失值的填充值由多种模型的平均值给出,更加客观、准确,能够最大程度地还原真实的金融时序数据的整体分布。
如图4所示,图4本发明金融时序数据的处理方法一实施例的流程示意图,该金融时序数据的处理方法包括以下步骤:
步骤S1,设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
其中,预定时间步长包括6个时间单位、11个时间单位及16个时间单位,时间单位指的是金融时序数据的粒度单位,例如,以天为粒度的金融时序数据,其时间单位为天;以分钟为粒度的高频金融时序数据,其时间单位为分钟,等。
对于6个时间单位的滑动窗口,对应的窗口数据的位数为6位,采样得到的样本数据的位数为6位;对于11个时间单位的滑动窗口,对应的窗口数据的位数为11位,采样得到的样本数据的位数为6位,例如,采样得到的样本数据为(x1,x3,x5,x7,x9,x11),即采样窗口数据中的第1、3、5、7、9、11位的数据;对于16个时间单位的滑动窗口,对应的窗口数据的位数为16位,采样得到的样本数据的位数为6位,例如,采样得到的样本数据为(x1,x4,x7,x10,x13,x16),即采样窗口数据中的第1、4、7、10、13、16位的数据。
其中,设置设置不同预定时间步长的滑动窗口的目的在于在样本数据的长度不变的情况下,扩大所捕获信息的久远度及联系关系。对不含有缺失值的金融时序数据进行采样得到样本数据,利用该样本数据来训练模型,以得到准确度较高的模型。
步骤S2,利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
其中,预定的循环神经网络模型为两个或两个以上的循环神经网络的混合模型,优选地,为长短期记忆网络模型(Long Short-Term Memory,LSTM)与门控循环单元模型(Gated Recurrent Unit,GRU)组成的混合模型,LSTM模型及GRU模型均可用于捕捉时间序列前后的依赖关系。
在一实施例中,该步骤包括:将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;利用测试集对训练后的循环神经网络模型的准确率进行测试;若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
其中,由于各预定时间步长对应的样本数据可以视为是独立同分布的,故对于训练集和测试集采取随机随机抽样,训练集所占的比例为70%,测试集所占的比例为30%,例如,训练集包括7万份样本数据,测试集包括3万份样本数据。
优选地,在训练集中,采用交叉验证的方式进行训练,即将训练集中的样本数据分为10份,每次取9份进行训练,取1份样本数据作为验证集,以利用验证集对训练中的循环神经网络模型的参数进行测试。在训练集上进行训练,并且在验证集上获取测试结果,随着训练次数的增加,如果在验证集上发现测试误差上升,即测试误差大于等于预定的误差阈值,则停止训练,以得到训练后的循环神经网络模型作为下述测试集测试的模型,可以有效避免模型的过度拟合。
具体地,利用训练集对LSTM模型进行训练,LSTM模型结构可采用Bi-directionalLSTM结构,训练集的样本数据包括(X1,X2,X3,X4,X5,X6),如图2所示,(X1,X2,X3,X4,X5)为输入层,A为隐含层,St为输出。其中,隐含层A是LSTM模型的记忆单元,为模型的参数,根据当前输入层的输入和上一步隐含层的输出进行计算得到。在测试集对训练后的LSTM模型的准确率进行测试时,将输出St与样本数据中的X6进行比较,以进行测试,测试结果表明模型对金融时序数据分布的刻画能力。如果LSTM模型的准确率大于等于预定准确率阈值(例如,0.9),则LSTM模型符合要求,将该训练后的LSTM模型作为预测模型;如果LSTM模型的准确率小于预定准确率阈值,则LSTM模型不符合要求,修改LSTM模型的隐含层结构,如图3所示,本实施例中,将每一个时间点对应输入的样本数据的隐含层由单隐层的形式修改为双隐含层堆叠结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
GRU模型和LSTM模型的结构类似,只是隐含层的结构比LSTM模型复杂。利用上述相同的训练集对GRU模型进行训练,训练GRU模型与训练LSTM模型的过程基本一致,且在训练集抽取部分样本数据作为验证集,可以有效避免模型的过度拟合。在训练后利用测试集对训练后的GRU模型进行测试,以使得GRU模型的准确率大于等于预定的准确率阈值,如果GRU模型的准确率小于该准确率阈值,则考虑修改GRU模型的结构,修改方式与LSTM模型类似。
通过上述的训练及测试过程,拟合得到各预定时间步长对应的LSTM模型+GRU模型组合成的混合模型,作为预测模型。
步骤S3,获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
本实施例中,首先定位缺失值的位置,由于金融时序数据是时序序列,因此可以通过缺失值所在的时间点定位缺失值的位置;然后确定每一处缺失值的位数,例如为1位或2位等。根据将要预测的缺失值的位数,确定输入模型的金融时序数据的位数,截取在缺失值前方的若干位数据,作为待输入数据。
其中,缺失值的位数一般为1位或2位,待输入数据优选为5位、6位或者7位,少于5位和多于7位通常难以取得较好的效果,因为少于5位则捕获的时序信息较少,而多于7位则时序较长,信息偏差较大。优选地,如上述表1所示。
在表1中,若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
步骤S4,将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
本实施例中,将待输入数据分别输入至各GRU模型和LSTM模型组成的混合模型的预测模型中,即分别输入至6个时间单位对应的混合模型、11个时间单位对应的混合模型、16个时间单位对应的混合模型中,获取三个混合模型对应输出的预测值V1、V2、V3,计算该缺失值的填充值V=(V1+V2+V3)/3,缺失值的位数为2位的也是计算输出的对应位置的预测值的平均值。该缺失值的填充值V能够捕捉到金融时序数据前后的依赖关系,且由三种混合模型的平均值给出,更加客观、准确。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的金融时序数据的处理方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
2.根据权利要求1所述的服务器,其特征在于,所述利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型的步骤,具体包括:
将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;
在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;
利用测试集对训练后的循环神经网络模型的准确率进行测试;
若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;
若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
3.根据权利要求1或2所述的服务器,其特征在于,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,具体包括:
根据该缺失值的位数确定截取数据的位数,并截取在该缺失值的位置前方与所确定的位数相同的位数的金融时序数据,以所截取的数据作为待输入数据。
4.根据权利要求3所述的服务器,其特征在于,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,进一步包括:
若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;
若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
5.一种金融时序数据的处理方法,其特征在于,所述金融时序数据的处理方法包括:
S1,设置不同预定时间步长的滑动窗口,利用所设置的滑动窗口在不含有缺失值的金融时序数据滑动以获取多个窗口数据,对每一窗口数据进行采样得到各预定时间步长对应的样本数据;
S2,利用各预定时间步长对应的样本数据分别对预定的循环神经网络模型进行训练,得到训练后的各预定时间步长对应的模型作为预测模型;
S3,获取含有缺失值的金融时序数据,获取该金融时序数据中的缺失值的位置及缺失值的位数,根据该缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据;
S4,将待输入数据输入至各预测模型中,获取各预测模型输出的预测值,获取各预测值的平均值作为该缺失值的填充值。
6.根据权利要求5所述的金融时序数据的处理方法,其特征在于,所述步骤S2,具体包括:
将每一种预定时间步长对应的样本数据划分为第一比例的训练集及第二比例的测试集,利用每一种预定时间步长对应的训练集分别对预定的循环神经网络模型进行训练,所述第一比例与第二比例的和小于等于1;
在每一种预定时间步长对应的训练集中抽取预定数量的样本数据作为验证集,利用该验证集对训练中的循环神经网络模型的参数进行测试,在测试误差大于等于预定的误差阈值时,结束训练以得到训练后的循环神经网络模型;
利用测试集对训练后的循环神经网络模型的准确率进行测试;
若该准确率大于等于预定的准确率阈值,则将该训练后的循环神经网络模型作为预测模型;
若该准确率小于预定的准确率阈值,则修改该循环神经网络模型的隐含层结构,并重新进行训练,以得到准确率大于等于预定准确率阈值的预测模型。
7.根据权利要求5或6所述的金融时序数据的处理方法,其特征在于,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,具体包括:
根据该缺失值的位数确定截取数据的位数,并截取在该缺失值的位置前方与所确定的位数相同的位数的金融时序数据,以所截取的数据作为待输入数据。
8.根据权利要求7所述的金融时序数据的处理方法,其特征在于,所述根据缺失值的位置及缺失值的位数截取在该缺失值的位置前方的金融时序数据,以所截取的数据作为待输入数据的步骤,进一步包括:
若缺失值的位数为1位,则确定截取数据的位数为5位、6位或者7位,截取在该缺失值的位置前方的5位、6位或者7位金融时序数据,以所截取的数据作为待输入数据;
若缺失值的位数为2位,则确定截取数据的位数为6位或者7位,截取在该缺失值的位置前方的6位或者7位金融时序数据,以所截取的数据作为待输入数据。
9.根据权利要求5或6所述的金融时序数据的处理方法,其特征在于,所述预定时间步长为6个时间单位、11个时间单位及16个时间单位,所述预定的循环神经网络模型为长短期记忆网络模型与门控循环单元模型组成的混合模型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现如权利要求5至9中任一项所述的金融时序数据的处理方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441414.6A CN108615096A (zh) | 2018-05-10 | 2018-05-10 | 服务器、金融时序数据的处理方法及存储介质 |
JP2019556878A JP6812573B2 (ja) | 2018-05-10 | 2018-09-26 | サーバ、金融時系列データの処理方法及び記憶媒体 |
PCT/CN2018/107678 WO2019214143A1 (zh) | 2018-05-10 | 2018-09-26 | 服务器、金融时序数据的处理方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441414.6A CN108615096A (zh) | 2018-05-10 | 2018-05-10 | 服务器、金融时序数据的处理方法及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108615096A true CN108615096A (zh) | 2018-10-02 |
Family
ID=63662626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810441414.6A Pending CN108615096A (zh) | 2018-05-10 | 2018-05-10 | 服务器、金融时序数据的处理方法及存储介质 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP6812573B2 (zh) |
CN (1) | CN108615096A (zh) |
WO (1) | WO2019214143A1 (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635923A (zh) * | 2018-11-20 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 用于处理数据的方法和装置 |
CN109711665A (zh) * | 2018-11-20 | 2019-05-03 | 深圳壹账通智能科技有限公司 | 一种基于金融风控数据的预测模型构建方法及相关设备 |
CN109886387A (zh) * | 2019-01-07 | 2019-06-14 | 北京大学 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
CN110163748A (zh) * | 2019-05-28 | 2019-08-23 | 京东数字科技控股有限公司 | 一种流动性期限管理缺失数据回填方法和设备 |
CN110309136A (zh) * | 2019-07-10 | 2019-10-08 | 山东大学 | 一种数据库异常事件缺失数据填充方法及系统 |
CN110851505A (zh) * | 2019-11-20 | 2020-02-28 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN110911011A (zh) * | 2019-11-27 | 2020-03-24 | 医惠科技有限公司 | 一种脓毒血症的预警装置、设备及存储介质 |
CN111694830A (zh) * | 2020-06-12 | 2020-09-22 | 复旦大学 | 基于深度集成学习的缺失数据补全方法 |
CN111798018A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 行为预测方法、装置、存储介质及电子设备 |
WO2021051976A1 (zh) * | 2019-09-18 | 2021-03-25 | 华泰证券股份有限公司 | 金融时间序列的合成方法、装置和存储介质 |
CN113486433A (zh) * | 2020-12-31 | 2021-10-08 | 上海东方低碳科技产业股份有限公司 | 用于净零能耗建筑的能耗缺数的计算方法以及填充系统 |
CN113763186A (zh) * | 2021-10-22 | 2021-12-07 | 平安科技(深圳)有限公司 | 基于循环神经网络的用户转保预测方法、装置以及设备 |
CN113780666A (zh) * | 2021-09-15 | 2021-12-10 | 湖北天天数链技术有限公司 | 一种缺失值的预测方法及装置、可读存储介质 |
CN116823338A (zh) * | 2023-08-28 | 2023-09-29 | 国网山东省电力公司临沂供电公司 | 电力用户经济属性缺失值的推断方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260156B (zh) * | 2020-02-18 | 2023-07-28 | 中国农业银行股份有限公司 | 现金流预测模型的构建方法及现金流预测方法及装置 |
CN114820199A (zh) * | 2022-03-29 | 2022-07-29 | 深圳先进技术研究院 | 金融衍生品价格的预测方法、预测装置、存储介质和设备 |
CN117319312B (zh) * | 2023-11-29 | 2024-03-08 | 凯美瑞德(苏州)信息科技股份有限公司 | 一种数据流量控制方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19530646C1 (de) * | 1995-08-21 | 1996-10-17 | Siemens Ag | Lernverfahren für ein rekurrentes neuronales Netz |
CN106886846A (zh) * | 2017-04-26 | 2017-06-23 | 中南大学 | 一种基于长短期记忆循环神经网络的银行网点备付金预测方法 |
CN107273429A (zh) * | 2017-05-19 | 2017-10-20 | 哈工大大数据产业有限公司 | 一种基于深度学习的缺失值填充方法及系统 |
CN107316108A (zh) * | 2017-06-19 | 2017-11-03 | 华南理工大学 | 一种市民出行公交线路选乘滑动窗口多特征预测方法 |
CN107578124A (zh) * | 2017-08-28 | 2018-01-12 | 国网山东省电力公司电力科学研究院 | 基于多层改进gru神经网络的短期电力负荷预测方法 |
CN107730087A (zh) * | 2017-09-20 | 2018-02-23 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4206369B2 (ja) * | 2004-07-15 | 2009-01-07 | 日本放送協会 | 時系列データ補完装置、その方法及びそのプログラム |
JP5861619B2 (ja) * | 2012-11-22 | 2016-02-16 | 富士通株式会社 | データ補間装置、データ補間プログラム及びデータ補間方法 |
US11449732B2 (en) * | 2016-09-06 | 2022-09-20 | Nippon Telegraph And Telephone Corporation | Time-series-data feature extraction device, time-series-data feature extraction method and time-series-data feature extraction program |
CN106991506A (zh) * | 2017-05-16 | 2017-07-28 | 深圳先进技术研究院 | 智能终端及其基于lstm的股票趋势预测方法 |
CN107563122B (zh) * | 2017-09-20 | 2020-05-19 | 长沙学院 | 基于交织时间序列局部连接循环神经网络的犯罪预测方法 |
CN107577649A (zh) * | 2017-09-26 | 2018-01-12 | 广州供电局有限公司 | 缺失数据的插补处理方法及装置 |
CN107832897A (zh) * | 2017-11-30 | 2018-03-23 | 浙江工业大学 | 一种基于深度学习的股票市场预测方法 |
-
2018
- 2018-05-10 CN CN201810441414.6A patent/CN108615096A/zh active Pending
- 2018-09-26 JP JP2019556878A patent/JP6812573B2/ja active Active
- 2018-09-26 WO PCT/CN2018/107678 patent/WO2019214143A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19530646C1 (de) * | 1995-08-21 | 1996-10-17 | Siemens Ag | Lernverfahren für ein rekurrentes neuronales Netz |
CN106886846A (zh) * | 2017-04-26 | 2017-06-23 | 中南大学 | 一种基于长短期记忆循环神经网络的银行网点备付金预测方法 |
CN107273429A (zh) * | 2017-05-19 | 2017-10-20 | 哈工大大数据产业有限公司 | 一种基于深度学习的缺失值填充方法及系统 |
CN107316108A (zh) * | 2017-06-19 | 2017-11-03 | 华南理工大学 | 一种市民出行公交线路选乘滑动窗口多特征预测方法 |
CN107578124A (zh) * | 2017-08-28 | 2018-01-12 | 国网山东省电力公司电力科学研究院 | 基于多层改进gru神经网络的短期电力负荷预测方法 |
CN107730087A (zh) * | 2017-09-20 | 2018-02-23 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711665A (zh) * | 2018-11-20 | 2019-05-03 | 深圳壹账通智能科技有限公司 | 一种基于金融风控数据的预测模型构建方法及相关设备 |
CN109635923A (zh) * | 2018-11-20 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 用于处理数据的方法和装置 |
CN109886387A (zh) * | 2019-01-07 | 2019-06-14 | 北京大学 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
CN111798018A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 行为预测方法、装置、存储介质及电子设备 |
CN110163748A (zh) * | 2019-05-28 | 2019-08-23 | 京东数字科技控股有限公司 | 一种流动性期限管理缺失数据回填方法和设备 |
CN110163748B (zh) * | 2019-05-28 | 2021-08-17 | 京东数字科技控股有限公司 | 一种流动性期限管理缺失数据回填方法和设备 |
CN110309136A (zh) * | 2019-07-10 | 2019-10-08 | 山东大学 | 一种数据库异常事件缺失数据填充方法及系统 |
WO2021051976A1 (zh) * | 2019-09-18 | 2021-03-25 | 华泰证券股份有限公司 | 金融时间序列的合成方法、装置和存储介质 |
CN110851505A (zh) * | 2019-11-20 | 2020-02-28 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN110851505B (zh) * | 2019-11-20 | 2023-12-22 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN110911011A (zh) * | 2019-11-27 | 2020-03-24 | 医惠科技有限公司 | 一种脓毒血症的预警装置、设备及存储介质 |
CN110911011B (zh) * | 2019-11-27 | 2021-10-19 | 医惠科技有限公司 | 一种脓毒血症的预警装置、设备及存储介质 |
CN111694830A (zh) * | 2020-06-12 | 2020-09-22 | 复旦大学 | 基于深度集成学习的缺失数据补全方法 |
CN113486433A (zh) * | 2020-12-31 | 2021-10-08 | 上海东方低碳科技产业股份有限公司 | 用于净零能耗建筑的能耗缺数的计算方法以及填充系统 |
CN113780666A (zh) * | 2021-09-15 | 2021-12-10 | 湖北天天数链技术有限公司 | 一种缺失值的预测方法及装置、可读存储介质 |
CN113780666B (zh) * | 2021-09-15 | 2024-03-22 | 湖北天天数链技术有限公司 | 一种缺失值的预测方法及装置、可读存储介质 |
CN113763186A (zh) * | 2021-10-22 | 2021-12-07 | 平安科技(深圳)有限公司 | 基于循环神经网络的用户转保预测方法、装置以及设备 |
CN113763186B (zh) * | 2021-10-22 | 2024-03-15 | 平安科技(深圳)有限公司 | 基于循环神经网络的用户转保预测方法、装置以及设备 |
CN116823338A (zh) * | 2023-08-28 | 2023-09-29 | 国网山东省电力公司临沂供电公司 | 电力用户经济属性缺失值的推断方法 |
CN116823338B (zh) * | 2023-08-28 | 2023-11-17 | 国网山东省电力公司临沂供电公司 | 电力用户经济属性缺失值的推断方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019214143A1 (zh) | 2019-11-14 |
JP2020522774A (ja) | 2020-07-30 |
JP6812573B2 (ja) | 2021-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108615096A (zh) | 服务器、金融时序数据的处理方法及存储介质 | |
CN109409918A (zh) | 基于用户行为的羊毛党识别方法、装置、设备及存储介质 | |
CN108711047B (zh) | 一种自动还款方法、系统及终端设备 | |
CN110363645A (zh) | 资产数据处理方法、装置、计算机设备和存储介质 | |
CN108052279A (zh) | 一种提升闪存性能的方法、装置、设备及存储介质 | |
CN109523117A (zh) | 风险预测方法、装置、计算机设备和存储介质 | |
CN108182633A (zh) | 贷款数据处理方法、装置、计算机设备和存储介质 | |
CN110060053A (zh) | 一种识别方法、设备及计算机可读介质 | |
CN107870980A (zh) | 电子装置、账单数据处理方法及计算机存储介质 | |
CN114418187A (zh) | 河道水文信息预测方法、系统、终端设备及存储介质 | |
CN109375146B (zh) | 一种用电数据的补采方法、系统及终端设备 | |
CN110060041A (zh) | 支付渠道接入方法、系统、计算机设备及可读存储介质 | |
CN108876388A (zh) | 一种身份认证方法、装置及终端设备 | |
CN108416662A (zh) | 一种数据验证方法及装置 | |
CN116934061A (zh) | 基于区块链的碳排放管理方法、系统、设备及存储介质 | |
CN107194712B (zh) | 共享账户变动信息记录方法及装置、内部账户补账方法及系统 | |
CN113343577B (zh) | 一种基于机器学习的参数优化方法、装置、设备及介质 | |
CN108510071B (zh) | 数据的特征提取方法、装置及计算机可读存储介质 | |
CN108804640A (zh) | 基于最大化iv的数据分组方法、装置、储存介质及设备 | |
CN112488825B (zh) | 基于区块链的对象交易方法及装置 | |
CN106447486B (zh) | 获取银行卡开户时间的方法及装置 | |
CN108805778A (zh) | 电子装置、采集征信数据的方法及存储介质 | |
CN115208831B (zh) | 请求处理方法、装置、设备及存储介质 | |
CN109710884B (zh) | 一种支持多种复杂计算方式的实时指标配置方法及系统 | |
CN110648208B (zh) | 群组识别方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181002 |
|
RJ01 | Rejection of invention patent application after publication |