CN111639798A - 智能的预测模型选择方法及装置 - Google Patents
智能的预测模型选择方法及装置 Download PDFInfo
- Publication number
- CN111639798A CN111639798A CN202010458512.8A CN202010458512A CN111639798A CN 111639798 A CN111639798 A CN 111639798A CN 202010458512 A CN202010458512 A CN 202010458512A CN 111639798 A CN111639798 A CN 111639798A
- Authority
- CN
- China
- Prior art keywords
- processed
- prediction model
- data
- model
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 28
- 238000009499 grossing Methods 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000000737 periodic effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 description 14
- 230000007547 defect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种智能的预测模型选择方法及装置,涉及数据处理的技术领域,包括:先获取待处理的时间序列;其中,待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;然后对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息;其中,特性信息用于表征待处理的时间序列的时间特性;从预设预测模型库中查找与特性信息相匹配的候选预测模型;最后基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。本发明通过待处理的时间序列的特性信息选择最优预测模型的方式,提高了选择出最优预测模型的成功率,进而提高了预测结果的准确性。
Description
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种智能的预测模型选择方法及装置。
背景技术
为了有效预测银行在未来某一时间段内的交易数据,需要对预测模型进行合理地选择。现有的预测模型选择方法存在以下缺陷:在时间序列中近期数据有异常时,即使对时间序列进行平滑处理,也无法消除异常数据的影响。同时,不同的预测模型受异常数据的影响程度不同。若仅考虑近期异常数据,简单的平均模型为最优模型。但是考虑整个数据长度的时间序列,Holt-winters模型为最优模型,由于现有技术的缺陷,简单的平均模型可能会被选择为最优模型。
因此,在时间序列的近期数据有异常时,现有方法存在选择最优预测模型的正确率较低、可靠性差的缺陷,容易使得预测的结果不准确。
发明内容
本发明的目的在于提供一种智能的预测模型选择方法及装置,以缓解了现有技术中存在的选择最优预测模型的正确率较低、可靠性差的缺陷,容易使得预测的结果不准确的技术问题。
第一方面,本发明提供的一种智能的预测模型选择方法,其中,包括:获取待处理的时间序列;其中,所述待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;对所述待处理的时间序列进行特性分析,得到所述待处理的时间序列的特性信息;其中,所述特性信息用于表征所述待处理的时间序列的时间特性,所述时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;从预设预测模型库中查找与所述特性信息相匹配的候选预测模型;基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型,以通过所述最优预测模型预测未来目标时间段内所产生的交易数据。
进一步地,基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型包括:基于所述待处理的时间序列确定数据训练样本和数据测试样本;基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型。
进一步地,所述相匹配的候选预测模型的数量为多个;基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型包括:通过所述数据训练样本对每个候选预测模型进行训练;将所述数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;其中,每个候选预测模型输出一组所述预测数据;基于每组所述预测数据和所述数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;其中,所述目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差;将所述目标误差最小的候选预测模型确定为所述最优预测模型。
进一步地,对所述待处理的时间序列进行特性分析包括:将所述待处理的时间序列进行预处理,并对预处理之后得到的所述待处理的时间序列进行特性分析;其中,所述预处理包括平滑处理。
进一步地,所述预设预测模型库中的预测模型包括以下至少一种:朴素贝叶斯模型,平均模型,滑动平均模型,指数平滑模型,自回归移动平均模型;其中,所述指数平滑模型包括:一次指数平滑模型,两次指数平滑模型和三次指数平滑模型。
第二方面,本发明提供的一种智能的预测模型选择装置,其中,包括:获取单元,用于获取待处理的时间序列;其中,所述待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;特性分析单元,用于对所述待处理的时间序列进行特性分析,得到所述待处理的时间序列的特性信息;其中,所述特性信息用于表征所述待处理的时间序列的时间特性,所述时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;查找单元,用于从预设预测模型库中查找与所述特性信息相匹配的候选预测模型;选择单元,用于基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型,以通过所述最优预测模型预测未来目标时间段内所产生的交易数据。
进一步地,选择单元包括:第一确定模块,用于基于所述待处理的时间序列确定数据训练样本和数据测试样本;第二确定模块,用于基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型。
进一步地,所述相匹配的候选预测模型的数量为多个;第二确定模块包括:训练子模块,用于通过所述数据训练样本对每个候选预测模型进行训练;输入子模块,用于将所述数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;其中,每个候选预测模型输出一组所述预测数据;计算子模块,用于基于每组所述预测数据和所述数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;其中,所述目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差;确定子模块,用于将所述目标误差最小的候选预测模型确定为所述最优预测模型。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现所述的智能的预测模型选择方法。
第四方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,其中,所述程序代码使所述处理器执行所述的智能的预测模型选择方法。
本发明提供的一种智能的预测模型选择方法及装置,先获取待处理的时间序列;其中,待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;然后对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息;其中,特性信息用于表征待处理的时间序列的时间特性,时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;从预设预测模型库中查找与特性信息相匹配的候选预测模型;最后基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。本发明通过待处理的时间序列的特性信息选择最优预测模型的方式,不易受异常数据的影响,提高了选择出最优预测模型的成功率,进而提高了预测结果的准确性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种智能的预测模型选择方法的流程图;
图2为图1中步骤S104的流程示意图;
图3为图2中步骤S202的流程示意图;
图4为本发明实施例提供的一种智能的预测模型选择装置的结构示意图。
图标:
11-获取单元;12-特性分析单元;13-查找单元;14-选择单元。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术在进行预测模型的选择时,直接将时间序列分成两部分数据,第一部分数据用于训练预测模型,第二部分用于校验预测模型预测的准确性,具体的,先利用第一部分数据对每一种预测模型进行训练,然后使用训练好的预测模型对第二部分数据进行预测,得到预测值,再计算预测值与实际值之间的误差,最后选择出误差最小的预测模型作为最优预测模型。
现有技术存在以下缺陷:在时间序列的近期数据有异常时,即使对时间序列进行平滑处理,也无法消除异常数据的影响。同时,不同的预测模型受异常数据的影响程度不同。例如:简单的平均模型的准确性容易受异常数据的影响,而对于Holt-winters模型,近期数据对其进行预测的影响要小很多。因此,简单的平均模型根据近期数据的变化可以快速调整预测值,而Holt-winters模型基于过往数据的周期性进行预测,输出的预测值不会因为近期数据的变化而快速调整。仅考虑近期数据时,简单的平均模型为最优模型。但是考虑到时间序列的整个数据长度,Holt-winters模型应该为最优模型,由于现有技术的缺陷,简单的平均模型会被选择为最优模型,因此在时间序列的近期数据有异常的情况下,现有的预测模型选择方法存在选择最优预测模型的正确率较低、可靠性差的缺陷。因此在预测银行交易数据时,选择合适的预测模型尤为重要。
基于此,本发明实施例提供的一种智能的预测模型选择方法及装置,可以通过待处理的时间序列的特性信息选择出最优预测模型,进而提高了预测结果的准确性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种智能的预测模型选择方法进行详细介绍。
实施例一:
根据本发明实施例,提供了一种智能的预测模型选择方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例提供的一种智能的预测模型选择方法的流程图,如图1所示,该方法包括以下步骤:
步骤S101,获取待处理的时间序列。
在本发明实施例中,为了预测银行在未来某一时间段内的交易数据,待处理的时间序列可以指用户在执行金融交易操作之后得到的交易数据(即银行产生的交易数据)。然而本发明实施例提供的智能的预测模型选择方法还可以应用在其他的预测场景中,且本发明实施例获取到的待处理的时间序列的含义也会发生相应的变化。例如,在对天气进行预测的场景下,待处理的时间序列可以指与天气相关的参数信息的时间序列。因此本实施例对待处理的时间序列的具体含义不作具体限制。
步骤S102,对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息。
在本发明实施例中,特性信息用于表征待处理的时间序列的时间特性,时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性。本发明实施例对时间特性的具体定义不作具体限制。
步骤S103,从预设预测模型库中查找与特性信息相匹配的候选预测模型。
在本发明实施例中,预设预测模型库中的预测模型包括以下至少一种:朴素贝叶斯模型,平均模型,滑动平均模型,指数平滑模型(exponential smoothing,ES),自回归移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA);其中,指数平滑模型包括:一次指数平滑模型,两次指数平滑模型(例如:Holt’s线性趋势模型)和三次指数平滑模型(例如:Holt-winters模型)。本发明实施例不限于上述几种类型的预测模型。
本实施例可以提前分析好各个预测模型与哪些特性信息相匹配,其中,一个预测模型可以与一个特性信息相匹配,也可以与多个特性信息相匹配,因此本发明实施例对预测模型与特性信息之间的匹配关系不作具体限定。例如,时间序列若具有周期性,那么与周期性相匹配的预测模型为holt-winters模型。
本发明实施例可以确定待处理的时间序列的特性信息,然后智能的选择出与该特性信息相匹配的预测模型,由于该智能的预测模型选择方法是基于时间序列进行的各项操作,因此该预测模型选择方法适用于所有类型的时间序列。本发明实施例在步骤S102中分析出时间序列的特性信息,然后在步骤S103中选择出相匹配的候选预测模型,以达到挑选出预测最为准确的最优预测模型的目的。
步骤S104,基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。
在本实施例中,每个相匹配的候选预测模型都有成为最优预测模型的可能性,为了准确的选择出最优预测模型,本发明实施例执行下述步骤S201~步骤S202。
本发明实施例提供的一种智能的预测模型选择方法,先获取待处理的时间序列;其中,待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;然后对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息;其中,特性信息用于表征待处理的时间序列的时间特性,时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;从预设预测模型库中查找与特性信息相匹配的候选预测模型;最后基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。本发明实施例通过待处理的时间序列的特性信息选择最优预测模型的方式,不易受异常数据的影响,提高了选择出最优预测模型的成功率,进而提高了预测结果的准确性。
下面结合具体的实施例介绍上述智能的预测模型选择方法。
在一个可选的实施例中,如图2所示,步骤S104,基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型包括以下步骤:
步骤S201,基于待处理的时间序列确定数据训练样本和数据测试样本;
步骤S202,基于数据训练样本和数据测试样本,在相匹配的候选预测模型中确定最优预测模型。
在本发明实施例中,数据训练样本可以完成对相匹配的候选预测模型的参数的训练,得到每个相匹配的候选预测模型的最优参数。数据测试样本可以对预测模型预测的准确性进行校验,进而确定最优预测模型。
在一个可选的实施例中,相匹配的候选预测模型的数量为多个;如图3所示,步骤S202,基于数据训练样本和数据测试样本,在相匹配的候选预测模型中确定最优预测模型包括以下步骤:
步骤S301,通过数据训练样本对每个候选预测模型进行训练;
步骤S302,将数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;
在本发明实施例中,每个候选预测模型输出一组预测数据;一组预测数据的数据量可以指一个预测数据,也可以指多个预测数据,例如:预测某银行在7点该时刻的交易额,则预测数据的数量为一个,若预测某银行在7点至8点这一时间段内每一秒的交易额,则预测数据的数量为多个,因此本发明实施例对预测数据的数据量不作具体限制。
步骤S303,基于每组预测数据和数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;
在本发明实施例中,目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差。本发明实施例对目标误差的类型不作具体限定。
步骤S304,将目标误差最小的候选预测模型确定为最优预测模型。
在本发明实施例中,目标误差越小,表示该候选预测模型预测的越准确,因此可以将目标误差最小的候选预测模型确定为最优预测模型,由于候选预测模型已经排除了不符合相匹配的特性信息的其他预测模型,因此即使时间序列中存在异常数据,也不会影响对最优预测模型的正确选择。
在一个可选的实施例中,步骤S201,对待处理的时间序列进行特性分析包括以下步骤:将待处理的时间序列进行预处理,并对预处理之后得到的待处理的时间序列进行特性分析;其中,预处理包括平滑处理。
在本发明实施例中,平滑处理的目的是去掉时间序列中的噪点,以使后期对时间序列进行特性分析出的特性信息更加准确。
通过上述描述,可知本发明实施例的具体流程如下:
步骤1,在接收到一组时间序列后,对该时间序列进行平滑处理,平滑处理是数据预处理阶段的核心步骤,该步骤可以找出时间序列中偏离度较大的异常点并将其修正,进而可以提高对时间序列进行特性分析的准确性,也可以使对候选预测模型的训练更加准确。
步骤2,在时间序列经过平滑处理后,对该组时间序列进行特性分析,特性分析包括但不限于以下步骤:分析时间序列的长度(包含多少个数据),判断时间序列是否呈线性,判断时间序列是否具有周期性,判断时间序列是否存在自相关性,该自相关性可以指时间序列的一部分与事件序列的另一部分之间的相关程度,判断是否毫无特性;
步骤3,根据上述步骤2分析出的各种特性信息,可以从预设预测模型库中查找所有与这些特性信息相匹配的候选预测模型。例如:如果时间序列的长度较小,且不具备自相关性,那么可以将朴素贝叶斯模型和简单的平均模型均作为候选预测模型;如果时间序列的长度足够大,并且具备周期性,那么Holt-winters模型(例如:Mutliplicative Holt-Winters和Double Season Holt-Winters模型)均作为候选预测模型;如果时间序列毫无特性,那么可以将循环神经网络模型作为候选预测模型。
步骤4,在得到所有的候选预测模型之后,可以将时间序列分为两部分,第一部分用来对候选预测模型进行训练,第二部分用来校验候选预测模型预测的准确度。在对所有的候选预测模型分别进行训练之后,使用这些训练好的候选预测模型来计算第二部分的预测值(即预测数据),对实际值和预测值进行一系列的目标误差计算,得到一组误差值,通过预设算法对这组误差值进行整合与分析,选择出整体误差最小的一个预测模型,误差最小,表示该候选预测模型对于该组时间序列的预测最为准确,因此在未来的一段时间内,可以使用该预测模型计算预测值。
本发明实施例可以在对候选预测模型进行训练前,先对历史数据(即时间序列)进行分析,分析出该历史数据的特性信息,根据该历史数据的特性信息智能地选择出一个或多个适合于该历史数据的预测模型,然后对其进行训练和校验,最后在这组候选预测模型中选择出预测效果最佳的最优预测模型,从而达到提高选择出最佳预测模型的成功率的目的,解决了现有技术无法选择出最为准确的最优预测模型的技术问题。
实施例二:
本发明实施例还提供了一种智能的预测模型选择装置,该图像处理装置主要用于执行本发明实施例上述内容所提供的智能的预测模型选择方法,以下对本发明实施例提供的智能的预测模型选择装置做具体介绍。
图4为本发明实施例提供的一种智能的预测模型选择装置的结构示意图。如图4所示,该图像处理装置主要包括:获取单元11,特性分析单元12,查找单元13和选择单元14,其中:
获取单元11,用于获取待处理的时间序列;其中,待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;
特性分析单元12,用于对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息;其中,特性信息用于表征待处理的时间序列的时间特性,时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;
查找单元13,用于从预设预测模型库中查找与特性信息相匹配的候选预测模型;
选择单元14,用于基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。
本发明实施例提供的一种智能的预测模型选择装置,先利用获取单元11获取待处理的时间序列;其中,待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;然后利用特性分析单元12对待处理的时间序列进行特性分析,得到待处理的时间序列的特性信息;其中,特性信息用于表征待处理的时间序列的时间特性,时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;再利用查找单元13从预设预测模型库中查找与特性信息相匹配的候选预测模型;最后利用选择单元14基于待处理的时间序列,从相匹配的候选预测模型中选择出最优预测模型,以通过最优预测模型预测未来目标时间段内所产生的交易数据。本发明实施例通过待处理的时间序列的特性信息选择最优预测模型的方式,不易受异常数据的影响,提高了选择出最优预测模型的成功率,进而提高了预测结果的准确性。
可选地,选择单元包括第一确定模块和第二确定模块,其中:
第一确定模块,用于基于待处理的时间序列确定数据训练样本和数据测试样本;
第二确定模块,用于基于数据训练样本和数据测试样本,在相匹配的候选预测模型中确定最优预测模型。
可选地,相匹配的候选预测模型的数量为多个;第二确定模块包括训练子模块,输入子模块,计算子模块和确定子模块,其中:
训练子模块,用于通过数据训练样本对每个候选预测模型进行训练;
输入子模块,用于将数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;其中,每个候选预测模型输出一组预测数据;
计算子模块,用于基于每组预测数据和数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;其中,目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差;
确定子模块,用于将目标误差最小的候选预测模型确定为最优预测模型。
可选地,特性分析单元12,用于将待处理的时间序列进行预处理,并对预处理之后得到的待处理的时间序列进行特性分析;其中,预处理包括平滑处理。
可选地,预设预测模型库中的预测模型包括以下至少一种:朴素贝叶斯模型,平均模型,滑动平均模型,指数平滑模型,自回归移动平均模型;其中,指数平滑模型包括:一次指数平滑模型,两次指数平滑模型和三次指数平滑模型。
在本发明的又一实施例中,还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法实施例所述方法的步骤。
在本发明的又一实施例中,还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行方法实施例所述方法。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本发明实施例所提供的智能的预测模型选择方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种智能的预测模型选择方法,其特征在于,包括:
获取待处理的时间序列;其中,所述待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;
对所述待处理的时间序列进行特性分析,得到所述待处理的时间序列的特性信息;其中,所述特性信息用于表征所述待处理的时间序列的时间特性,所述时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;
从预设预测模型库中查找与所述特性信息相匹配的候选预测模型;
基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型,以通过所述最优预测模型预测未来目标时间段内所产生的交易数据。
2.根据权利要求1所述的方法,其特征在于,基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型包括:
基于所述待处理的时间序列确定数据训练样本和数据测试样本;
基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型。
3.根据权利要求2所述的方法,其特征在于,所述相匹配的候选预测模型的数量为多个;
基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型包括:
通过所述数据训练样本对每个候选预测模型进行训练;
将所述数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;其中,每个候选预测模型输出一组所述预测数据;
基于每组所述预测数据和所述数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;其中,所述目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差;
将所述目标误差最小的候选预测模型确定为所述最优预测模型。
4.根据权利要求1所述的方法,其特征在于,对所述待处理的时间序列进行特性分析包括:
将所述待处理的时间序列进行预处理,并对预处理之后得到的所述待处理的时间序列进行特性分析;其中,所述预处理包括平滑处理。
5.根据权利要求4所述的方法,其特征在于,所述预设预测模型库中的预测模型包括以下至少一种:朴素贝叶斯模型,平均模型,滑动平均模型,指数平滑模型,自回归移动平均模型;其中,所述指数平滑模型包括:一次指数平滑模型,两次指数平滑模型和三次指数平滑模型。
6.一种智能的预测模型选择装置,其特征在于,包括:
获取单元,用于获取待处理的时间序列;其中,所述待处理的时间序列为用户在执行金融交易操作之后得到的交易数据;
特性分析单元,用于对所述待处理的时间序列进行特性分析,得到所述待处理的时间序列的特性信息;其中,所述特性信息用于表征所述待处理的时间序列的时间特性,所述时间特性包括以下至少一种:周期性、非周期性、线性、非线性、自相关性和非自相关性;
查找单元,用于从预设预测模型库中查找与所述特性信息相匹配的候选预测模型;
选择单元,用于基于所述待处理的时间序列,从所述相匹配的候选预测模型中选择出最优预测模型,以通过所述最优预测模型预测未来目标时间段内所产生的交易数据。
7.根据权利要求6所述的装置,其特征在于,选择单元包括:
第一确定模块,用于基于所述待处理的时间序列确定数据训练样本和数据测试样本;
第二确定模块,用于基于所述数据训练样本和所述数据测试样本,在所述相匹配的候选预测模型中确定所述最优预测模型。
8.根据权利要求7所述的装置,其特征在于,所述相匹配的候选预测模型的数量为多个;
第二确定模块包括:
训练子模块,用于通过所述数据训练样本对每个候选预测模型进行训练;
输入子模块,用于将所述数据测试样本分别输入至每个训练之后的候选预测模型,得到多组预测数据;其中,每个候选预测模型输出一组所述预测数据;
计算子模块,用于基于每组所述预测数据和所述数据测试样本所对应的真实数据,计算每个候选预测模型的目标误差;其中,所述目标误差包括以下至少之一:均方误差,均方根误差,平均绝对误差,平均绝对百分比误差,对称平均绝对百分比误差和平均绝对比例误差;
确定子模块,用于将所述目标误差最小的候选预测模型确定为所述最优预测模型。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现如权利要求1至5任一项所述的方法。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010458512.8A CN111639798A (zh) | 2020-05-26 | 2020-05-26 | 智能的预测模型选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010458512.8A CN111639798A (zh) | 2020-05-26 | 2020-05-26 | 智能的预测模型选择方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111639798A true CN111639798A (zh) | 2020-09-08 |
Family
ID=72331359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010458512.8A Pending CN111639798A (zh) | 2020-05-26 | 2020-05-26 | 智能的预测模型选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639798A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288021A (zh) * | 2020-11-02 | 2021-01-29 | 广东柯内特环境科技有限公司 | 一种医疗废水监测数据质控方法、装置及系统 |
CN112508723A (zh) * | 2021-02-05 | 2021-03-16 | 北京淇瑀信息科技有限公司 | 基于自动择优建模的金融风险预测方法、装置和电子设备 |
CN112612393A (zh) * | 2021-01-05 | 2021-04-06 | 杭州慧钥医疗器械科技有限公司 | 界面功能的交互方法及装置 |
CN113341919A (zh) * | 2021-05-31 | 2021-09-03 | 中国科学院重庆绿色智能技术研究院 | 一种基于时序数据长度优化的计算系统故障预测方法 |
CN113793172A (zh) * | 2021-08-30 | 2021-12-14 | 深圳壹账通智能科技有限公司 | 一种配件匹配方法、装置、计算机设备及存储介质 |
CN114330908A (zh) * | 2021-12-31 | 2022-04-12 | 中国民航信息网络股份有限公司 | 一种订座需求的预测方法、装置和收益管理系统 |
WO2023236601A1 (zh) * | 2022-06-08 | 2023-12-14 | 腾讯科技(深圳)有限公司 | 参数预测方法、预测服务器、预测系统及电子设备 |
CN117273723A (zh) * | 2023-09-04 | 2023-12-22 | 上海数禾信息科技有限公司 | 结算预测方法、装置、计算机设备以及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030200134A1 (en) * | 2002-03-29 | 2003-10-23 | Leonard Michael James | System and method for large-scale automatic forecasting |
CN102968670A (zh) * | 2012-10-23 | 2013-03-13 | 北京京东世纪贸易有限公司 | 预测数据的方法和装置 |
CN104899451A (zh) * | 2015-06-12 | 2015-09-09 | 哈尔滨工业大学 | 基于统计信号处理的时间序列预测模型选择方法 |
CN104992050A (zh) * | 2015-06-12 | 2015-10-21 | 哈尔滨工业大学 | 基于统计信号处理的时间序列特性评价的预测模型选择方法 |
CN108710905A (zh) * | 2018-05-10 | 2018-10-26 | 华中科技大学 | 一种基于多模型联合的备件数量预测方法和系统 |
CN108734330A (zh) * | 2017-04-24 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 数据处理方法和装置 |
CN109816158A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 预测模型的组合方法、装置、设备及可读存储介质 |
-
2020
- 2020-05-26 CN CN202010458512.8A patent/CN111639798A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030200134A1 (en) * | 2002-03-29 | 2003-10-23 | Leonard Michael James | System and method for large-scale automatic forecasting |
CN102968670A (zh) * | 2012-10-23 | 2013-03-13 | 北京京东世纪贸易有限公司 | 预测数据的方法和装置 |
CN104899451A (zh) * | 2015-06-12 | 2015-09-09 | 哈尔滨工业大学 | 基于统计信号处理的时间序列预测模型选择方法 |
CN104992050A (zh) * | 2015-06-12 | 2015-10-21 | 哈尔滨工业大学 | 基于统计信号处理的时间序列特性评价的预测模型选择方法 |
CN108734330A (zh) * | 2017-04-24 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 数据处理方法和装置 |
CN108710905A (zh) * | 2018-05-10 | 2018-10-26 | 华中科技大学 | 一种基于多模型联合的备件数量预测方法和系统 |
CN109816158A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 预测模型的组合方法、装置、设备及可读存储介质 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288021A (zh) * | 2020-11-02 | 2021-01-29 | 广东柯内特环境科技有限公司 | 一种医疗废水监测数据质控方法、装置及系统 |
CN112288021B (zh) * | 2020-11-02 | 2022-04-29 | 广东柯内特环境科技有限公司 | 一种医疗废水监测数据质控方法、装置及系统 |
CN112612393A (zh) * | 2021-01-05 | 2021-04-06 | 杭州慧钥医疗器械科技有限公司 | 界面功能的交互方法及装置 |
CN112612393B (zh) * | 2021-01-05 | 2022-08-19 | 杭州慧钥医疗器械科技有限公司 | 界面功能的交互方法及装置 |
CN112508723A (zh) * | 2021-02-05 | 2021-03-16 | 北京淇瑀信息科技有限公司 | 基于自动择优建模的金融风险预测方法、装置和电子设备 |
CN112508723B (zh) * | 2021-02-05 | 2024-02-02 | 北京淇瑀信息科技有限公司 | 基于自动择优建模的金融风险预测方法、装置和电子设备 |
CN113341919A (zh) * | 2021-05-31 | 2021-09-03 | 中国科学院重庆绿色智能技术研究院 | 一种基于时序数据长度优化的计算系统故障预测方法 |
CN113793172A (zh) * | 2021-08-30 | 2021-12-14 | 深圳壹账通智能科技有限公司 | 一种配件匹配方法、装置、计算机设备及存储介质 |
CN114330908A (zh) * | 2021-12-31 | 2022-04-12 | 中国民航信息网络股份有限公司 | 一种订座需求的预测方法、装置和收益管理系统 |
WO2023236601A1 (zh) * | 2022-06-08 | 2023-12-14 | 腾讯科技(深圳)有限公司 | 参数预测方法、预测服务器、预测系统及电子设备 |
CN117273723A (zh) * | 2023-09-04 | 2023-12-22 | 上海数禾信息科技有限公司 | 结算预测方法、装置、计算机设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639798A (zh) | 智能的预测模型选择方法及装置 | |
CN106951984B (zh) | 一种系统健康度动态分析预测方法及装置 | |
US7107187B1 (en) | Method for modeling system performance | |
CN113518011B (zh) | 异常检测方法和装置、电子设备及计算机可读存储介质 | |
CN114580493B (zh) | 基于ai的重载铁路桥梁健康监测方法 | |
CN111881023B (zh) | 一种基于多模型对比的软件老化预测方法及装置 | |
US20220382229A1 (en) | Machining condition searching device and machining condition searching method | |
CN114417733A (zh) | 构建功耗预测模型的方法、装置、电子设备及存储介质 | |
CN111340287A (zh) | 配电柜运行状态预测方法及装置 | |
CN110795324A (zh) | 一种数据处理方法及装置 | |
CN116743637B (zh) | 一种异常流量的检测方法、装置、电子设备及存储介质 | |
CN116910274B (zh) | 基于知识图谱和预测模型的试题生成方法及系统 | |
CN114938339A (zh) | 一种数据处理方法和相关装置 | |
CN112949951A (zh) | 数据预测方法、装置、电子设备及存储介质 | |
CN113850418A (zh) | 时间序列中异常数据的检测方法和装置 | |
KR20130086083A (ko) | 리스크-프로파일 생성 장치 | |
JP2007305048A (ja) | 影響因子推定装置及び影響因子推定プログラム | |
CN116610484B (zh) | 一种模型训练方法、故障预测方法、系统、设备以及介质 | |
CN117632905B (zh) | 基于云端使用记录的数据库管理方法及系统 | |
CN113473124B (zh) | 信息获取方法、装置、电子设备及存储介质 | |
CN111507639B (zh) | 理财风险分析方法及装置 | |
CN116128367A (zh) | 一种软件质量预测方法、装置、电子设备及存储介质 | |
CN116383771B (zh) | 基于变分自编码模型的网络异常入侵检测方法和系统 | |
US20230199060A1 (en) | Correlations between workload characteristics and elapsed times | |
CN117035515A (zh) | 工作量的评估方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |