CN116306985A - 预测模型训练方法、装置、计算机设备和存储介质 - Google Patents

预测模型训练方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN116306985A
CN116306985A CN202310322982.5A CN202310322982A CN116306985A CN 116306985 A CN116306985 A CN 116306985A CN 202310322982 A CN202310322982 A CN 202310322982A CN 116306985 A CN116306985 A CN 116306985A
Authority
CN
China
Prior art keywords
information
model
data
classification
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310322982.5A
Other languages
English (en)
Inventor
周魁
皇甫晓洁
张倩妮
王航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310322982.5A priority Critical patent/CN116306985A/zh
Publication of CN116306985A publication Critical patent/CN116306985A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种预测模型训练方法、装置、计算机设备和存储介质。所述方法包括:获取历史特征样本数据;根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息;根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。采用本方法能够可提高模型的执行效率以及增强了模型的灵活性,使用该资源对象变动信息预测的模型,进一步,可以有效提高模型的预测效果的稳定性与准确性。

Description

预测模型训练方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种预测模型训练方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,其在资源交互平台的交互趋势预测方面有比较多的相关研究与应用。资源交互趋势预测本质可以是一个分类问题,即预测未来某段时间内,资源交互趋势是上升、下跌或者震荡。根据预测行为来指导资源交互平台的工作人员的进行交互操作。
在资源交互平台实现交互操作行为对预测模型的准确度的依赖非常高,然而,传统技术中,对于在资源交互平台对资源交互趋势的预测为三分类模型,基于三分类模型的特性,在预测的过程中会出现数据之间样本量不平衡以、单一模型学习能力较弱以及特征刻画能力不足等,导致目前针对资源交互平台的资源交互趋势预测准确度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高资源交互平台的资源交互趋势预测准确度的资源对象变动信息预测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种资源对象变动信息预测模型的训练方法。所述方法包括:获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
第二方面,本申请提供了一种资源对象变动信息预测方法。所述方法包括:获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
第三方面,本申请还提供了一种资源对象变动信息预测模型的训练装置。所述装置包括:样本数据获取模块,用于获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;分类类型确定模块,用于根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;模型计算模块,用于将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;模型训练模块,用于根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
第四方面,本申请还提供了一种资源对象变动信息预测装置。所述装置包括:实时数据获取模块,用于获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;特征转换模块,用于对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;变动信息预测模块,用于将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
第六方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
第七方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
上述一种资源对象变动信息预测模型的训练方法、装置、计算机设备、存储介质和计算机程序产品,通过获取历史特征样本数据;历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息;二分类置信度信息包括两种变动信息类型对应的两个二分类置信度信息;根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
以及,上述一种资源对象变动信息预测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;资源实时交互数据通过对资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对资源实时交互数据进行数据特征转换,得到资源交互平台对应的实时特征交互数据;将实时特征交互数据输入至已训练资源对象变动信息预测模型,得到资源实时交互数据对应的资源对象变动信息。
通过将资源对象变动信息预测的模型从多分类模型转化为多个二分类子模型,能够简化了模型的复杂度,同时由于子问题间互相独立,通过并行运算可提高模型的执行效率,进一步,针对二分类子模型,可选择配置不同的机器学习模型,增强了模型的灵活性。使用该资源对象变动信息预测的模型,可以有效提高模型的预测效果的稳定性与准确性。
附图说明
图1为一个实施例中一种资源对象变动信息预测模型的训练方法的应用环境图;
图2为一个实施例中一种资源对象变动信息预测模型的训练方法的流程示意图;
图3为一个实施例中二分类置信度信息得到方法的流程示意图;
图4为另一个实施例中二分类置信度信息得到方法的流程示意图;
图5为一个实施例中已训练资源对象变动信息预测模型得到方法的流程示意图;
图6为一个实施例中历史特征样本数据得到方法的流程示意图;
图7为另一个实施例中历史特征样本数据得到方法的流程示意图;
图8为一个实施例中一种资源对象变动信息预测方法的流程示意图;
图9为一个实施例中资源对象变动信息得到方法的流程示意图;
图10为一个实施例中实时预测置信度信息得到方法的流程示意图;
图11为一个实施例中样本历史交互数据的构造情况示意图;
图12为一个实施例中资源对象变动信息预测模型训练和应用的关系示意图;
图13为一个实施例中资源对象变动信息预测模型训练和应用的实现逻辑示意图;
图14为一个实施例中一种资源对象变动信息预测模型的训练装置的结构框图;
图15为一个实施例中一种资源对象变动信息预测装置的结构框图;
图16为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的一种资源对象变动信息预测模型的训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104通过获取历史特征样本数据;历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息;二分类置信度信息包括两种变动信息类型对应的两个二分类置信度信息;根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种资源对象变动信息预测模型的训练方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取历史特征样本数据。
其中,历史特征样本数据可以是资源交互平台在历史交互中产生的交互数据进行标准化以及持久化所得到的样本数据,用于训练人工智能模型。
具体地,服务器响应终端的模型训练指令,从服务器存储空间中调取资源交互平台的数据位置信息、资源交互信息以及交互量信息,由于数据位置信息、资源交互信息以及交互量信息为资源交互平台针对任一时间段所产生的数据,因此,数据位置信息、资源交互信息以及交互量信息三者之间具有对应关系。根据数据位置信息、资源交互信息以及交互量信息三者之间的对应关系,对数据位置信息、资源交互信息以及交互量信息三者进行分层处理,例如:图11所示,行情簿中主要要素包含行情时间以及买卖(BID,ASK)双方向的量(Qty)及价格(Price),而行情簿中不同层(即不同档位)的价格信息,如图11所示的行情有五层,Position对应1~5;进一步,对数据位置信息、资源交互信息以及交互量信息进行带量处理,例如:针对行情簿中有不同层除了价格Price,还添加关于量的信息,即图11所示的Qty列,最后得到样本历史交互数据。
由于样本历史交互数据为原生的行情数据,因此无法直接用于模型的训练,需要进一步数据特征转换(加工特征因子),常见的特征因子包含加权报价、报价价格变化比例、买卖压力指标等。首先,根据样本历史交互数据,从特征因子集合中选取若干个特征因子,作为对样本历史交互数据进行处理的数据特征信息序列(特征因子序列),并进一步根据数据特征信息序列,确定对样本历史交互数据进行处理的方法为正态分布转换以及持久化处理。基于正态分布转换的方法消除量纲的影响,将样本历史交互数据转换为符合标准正态分布的数据,得到去量纲样本历史交互数据。转换的过程中需要用到两个参数:均值与方差。保留参数的目的是在应用该模型时,对于实时接入的数据也需要用到该参数以进行标准化处理。将去量纲样本历史交互数据的参数信息保存下来的动作,即持久化处理,即可得到历史特征样本数据,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。
步骤204,根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型。
其中,待训练资源对象变动信息预测模型可以是资源交互平台中准备被训练的,用于预测资源交互平台的对象变动信息为上涨、下降或者震荡的模型。
其中,信息类型分类模型可以是待训练资源对象变动信息预测模型中的子模型,其中,信息类型分类模型为二分类模型,即信息类型分类模型的预测结果为两种。
其中,变动信息分类类型可以是信息类型分类模型能够预测对象变动信息的类型,例如:上涨和其它、下降和其它、震荡和其它。
具体地,基于资源交互平台的业务需求,根据经过处理后的历史特征样本数据,对数据的特征表现情况进行分类,以确定对历史特征样本数据进行预测的类型,例如:银行中需要根据历史特征样本数据的表现形式,确定对历史特征样本数据进行预测的类型为外汇行情的上涨、下降或者震荡。由于待训练资源对象变动信息预测模型中具有多个信息类型分类模型,而信息类型分类模型为二分类模型,因此针对任意一个信息类型分类模型,均需要确定针对历史特征样本数据进行预测的类型相同的变动信息分类类型,例如:银行中各个信息类型分类模型需要对历史特征样本数据进行预测,则根据对历史特征样本数据进行预测的类型,确定信息类型分类模型需要预测的变动信息分类类型为上涨和其它,则第二个信息类型分类模型需要预测的变动信息分类类型为下降和其它,则第三个信息类型分类模型需要预测的变动信息分类类型为震荡和其它。
步骤206,将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息。
其中,二分类置信度信息可以是信息类型分类模型进行预测后,估计值与总体参数在一定允许的误差范围以内的概率。
具体地,根据各个信息类型分类模型需要分别进行预测的各个变动信息分类类型,从分类机器学习模型集合中选取能够满足进行预测的各个变动信息分类类型对应的分类机器学习模型,并根据信息类型分类模型-变动信息分类类型-分类机器学习模型三者的对应关系,确定各个信息类型分类模型所采用的分类机器学习模型。
针对分类机器学习模型,可以包括待训练逻辑回归学习模型、待训练支持向量机学习模型以及待训练决策树学习模型。针对待训练逻辑回归学习模型,将历史特征样本数据输入至待训练逻辑回归学习模型,通过待训练逻辑回归学习模型的计算,得到待训练逻辑回归学习模型对应的逻辑回归二分类置信度信息;同理,针对待训练支持向量机学习模型,将历史特征样本数据输入至待训练支持向量机学习模型,通过待训练支持向量机学习模型的计算,得到待训练支持向量机学习模型对应的向量机二分类置信度信息;同理,针对待训练决策树学习模型,将历史特征样本数据输入至待训练决策树学习模型,通过待训练决策树学习模型的计算,得到待训练决策树学习模型对应的决策树二分类置信度信息。
步骤208,根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
其中,已训练资源对象变动信息预测模型可以是资源交互平台中已经被训练的,用于预测资源交互平台的对象变动信息为上涨、下降或者震荡的模型。
具体地,由于每一个信息类型分类模型均输出两个二分类置信度信息,因此对于各个信息类型分类模型,均使用该信息类型分类模型对应的两个二分类置信度信息对信息类型分类模型的模型参数进行调整,以使得各个信息类型分类模型的性能更好,则得到各个信息类型分类模型对应的已调整分类模型参数和已调参分类模型。
将已调整分类模型参数的参数信息保存下来的动作,即持久化处理,即可得到各个已调整分类模型参数对应的持久化参数,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。进一步,基于各已调整分类模型参数以及各持久化参数,重新获取资源交互平台的数据位置信息、资源交互信息以及交互量信息后,再一次对各个信息类型分类模型进行训练,直到各个信息类型分类模型输出的二分类置信度信息满足预设条件,即可完成训练,得到各已训练信息类型分类模型。针对每一次的模型训练,均进行持久化处理,并对持久化参数进行更新。
将各个已经训练好的信息类型分类模型进行组合起来,即成为了已训练资源对象变动信息预测模型。图12为一个实施例中资源对象变动信息预测模型训练和应用的关系示意图;图13为一个实施例中资源对象变动信息预测模型训练和应用的实现逻辑示意图。
上述一种资源对象变动信息预测模型的训练方法中,通过获取历史特征样本数据;历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息;二分类置信度信息包括两种变动信息类型对应的两个二分类置信度信息;根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
通过将资源对象变动信息预测的模型从多分类模型转化为多个二分类子模型,能够简化了模型的复杂度,同时由于子问题间互相独立,通过并行运算可提高模型的执行效率,进一步,针对二分类子模型,可选择配置不同的机器学习模型,增强了模型的灵活性。使用该资源对象变动信息预测的模型,可以有效提高模型的预测效果的稳定性与准确性。
在一个实施例中,如图3所示,将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息,包括:
步骤302,根据各变动信息分类类型,相对应确定各信息类型分类模型所采用的分类机器学习模型。
其中,分类机器学习模型可以是用于对历史特征样本数据实施二分类的人工智能模型。例如:待训练逻辑回归学习模型、待训练支持向量机学习模型以及待训练决策树学习模型。
具体地,根据各个信息类型分类模型需要分别进行预测的各个变动信息分类类型,从分类机器学习模型集合中选取能够满足进行预测的各个变动信息分类类型对应的分类机器学习模型,并根据信息类型分类模型-变动信息分类类型-分类机器学习模型三者的对应关系,确定各个信息类型分类模型所采用的分类机器学习模型。
步骤304,将历史特征样本数据输入至各分类机器学习模型,得到各分类机器学习模型对应的二分类置信度信息。
具体地,针对分类机器学习模型,可以包括待训练逻辑回归学习模型、待训练支持向量机学习模型以及待训练决策树学习模型。针对待训练逻辑回归学习模型,将历史特征样本数据输入至待训练逻辑回归学习模型,通过待训练逻辑回归学习模型的计算,得到待训练逻辑回归学习模型对应的逻辑回归二分类置信度信息;同理,针对待训练支持向量机学习模型,将历史特征样本数据输入至待训练支持向量机学习模型,通过待训练支持向量机学习模型的计算,得到待训练支持向量机学习模型对应的向量机二分类置信度信息;同理,针对待训练决策树学习模型,将历史特征样本数据输入至待训练决策树学习模型,通过待训练决策树学习模型的计算,得到待训练决策树学习模型对应的决策树二分类置信度信息。
本实施例中,通过确定各个信息类型分类模型对应的分类机器学习模型,可以针对不同的二分类需要预测的变动信息类型,选用对应的分类机器学习模型进行预测,能够针对具体的业务需求,灵活调整分类机器学习模型,提高了资源对象变动信息预测模型的适应性。
在一个实施例中,如图4所示,将历史特征样本数据输入至各分类机器学习模型,得到各分类机器学习模型对应的二分类置信度信息,包括:
步骤402,将历史特征样本数据输入至待训练逻辑回归学习模型,得到逻辑回归二分类置信度信息。
其中,待训练逻辑回归学习模型可以是待训练的二分类支持向量机学习模型。
其中,逻辑回归二分类置信度信息可以是通过待训练的逻辑回归学习模型进行预测而得到的二分类置信度信息。
具体地,针对待训练逻辑回归学习模型,将历史特征样本数据输入至待训练逻辑回归学习模型,通过待训练逻辑回归学习模型的计算,得到待训练逻辑回归学习模型对应的逻辑回归二分类置信度信息。
步骤404,将历史特征样本数据输入至待训练支持向量机学习模型,得到向量机二分类置信度信息。
其中,待训练支持向量机学习模型可以是待训练的二分类支持向量机学习模型。
其中,逻辑回归二分类置信度信息可以是通过待训练的支持向量机学习模型进行预测而得到的二分类置信度信息。
具体地,针对待训练支持向量机学习模型,将历史特征样本数据输入至待训练支持向量机学习模型,通过待训练支持向量机学习模型的计算,得到待训练支持向量机学习模型对应的向量机二分类置信度信息。
步骤406,将历史特征样本数据输入至待训练决策树学习模型,得到决策树二分类置信度信息。
其中,待训练支持向量机学习模型可以是待训练的二分类决策树学习模型。
其中,逻辑回归二分类置信度信息可以是通过待训练的决策树学习模型进行预测而得到的二分类置信度信息。
具体地,针对待训练决策树学习模型,将历史特征样本数据输入至待训练决策树学习模型,通过待训练决策树学习模型的计算,得到待训练决策树学习模型对应的决策树二分类置信度信息。
本实施例中,通过根据选定的各种不同的分类机器学习模型对历史特征样本数据进行预测,并对应地输出各个分类机器学习模型对应的二分类置信度信息,能够根据实际的业务情况,选择对应的分类机器学习模型,避免同一个分类机器学习模型对各种业务情况进行预测,提高了资源对象变动信息预测模型的准确率。
在一个实施例中,如图5所示,根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型,包括:
步骤502,根据各二分类置信度信息,对相应的信息类型分类模型的模型参数进行调整,得到各信息类型分类模型对应的已调整分类模型参数和已调参分类模型。
其中,已调整分类模型参数可以是已经经过参数调整的各个信息类型分类模型分别对应的模型参数。
其中,已调参分类模型可以是已经经过参数调整的各个信息类型分类模型。
具体地,由于每一个信息类型分类模型均输出两个二分类置信度信息,因此对于各个信息类型分类模型,均使用该信息类型分类模型对应的两个二分类置信度信息对信息类型分类模型的模型参数进行调整,以使得各个信息类型分类模型的性能更好,则得到各个信息类型分类模型对应的已调整分类模型参数和已调参分类模型。
步骤504,将各已调整分类模型参数进行持久化处理,得到各已调整分类模型参数对应的持久化参数。
其中,持久化参数可以是经过持久化处理的各个已调整分类模型参数。
具体地,将已调整分类模型参数的参数信息保存下来的动作,即持久化处理,即可得到各个已调整分类模型参数对应的持久化参数,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。
步骤506,基于各已调整分类模型参数以及各持久化参数,相应对各信息类型分类模型进行训练,直到二分类置信度信息满足预设条件,得到各已训练信息类型分类模型。
具体地,基于各已调整分类模型参数以及各持久化参数,重新获取资源交互平台的数据位置信息、资源交互信息以及交互量信息后,再一次对各个信息类型分类模型进行训练,直到各个信息类型分类模型输出的二分类置信度信息满足预设条件,即可完成训练,得到各已训练信息类型分类模型。针对每一次的模型训练,均进行持久化处理,并对持久化参数进行更新。
步骤508,根据各已训练信息类型分类模型,得到已训练资源对象变动信息预测模型。
具体地,将各个已经训练好的信息类型分类模型进行组合起来,即成为了已训练资源对象变动信息预测模型。
本实施例中,通过对各个信息类型分类模型的参数调整,并根据调整后的参数采取持久化处理,最后根据调整后的参数以及持久化后的参数对各个信息类型分类模型进行训练,能够保证指标评估适用于生产环境进行信号预测。
在一个实施例中,如图6所示,在获取历史特征样本数据步骤之前,还包括:
步骤602,获取资源交互平台的数据位置信息、资源交互信息以及交互量信息。
其中,资源交互平台可以是进行资源调度,资源交互的公共平台,例如:银行、交易所、保险公司以及基金公司。
其中,数据位置信息可以是资源交互平台输出的各条数据记录所对应的位置信息。
其中,资源交互信息可以是资源交互平台输出关于在资源交互平台上的各个数据位置信息对应的交互大小值,例如,外汇兑换的汇率。
其中,交互量信息可以是资源交互平台针对各个数据位置信息对应的交互量的大小,例如:A位置的外汇兑换量为一个亿。
具体地,服务器响应终端的模型训练指令,从服务器存储空间中调取资源交互平台的数据位置信息、资源交互信息以及交互量信息,由于数据位置信息、资源交互信息以及交互量信息为资源交互平台针对任一时间段所产生的数据,因此,数据位置信息、资源交互信息以及交互量信息三者之间具有对应关系。
步骤604,对数据位置信息、资源交互信息以及交互量信息进行融合,得到样本历史交互数据。
其中,样本历史交互数据可以是资源交互平台将原始数据进行融合之外,并未进行其它处理的交互数据。
具体地,对数据位置信息、资源交互信息以及交互量信息三者进行分层处理,例如:图11所示,行情簿中主要要素包含行情时间以及买卖(BID,ASK)双方向的量(Qty)及价格(Price),而行情簿中不同层(即不同档位)的价格信息,如图11所示的行情有五层,Position对应1~5;进一步,对数据位置信息、资源交互信息以及交互量信息进行带量处理,例如:针对行情簿中有不同层除了价格Price,还添加关于量的信息,即图11所示的Qty列,最后得到样本历史交互数据。
步骤606,按照预设的数据特征信息序列,对样本历史交互数据进行数据特征转换,得到历史特征样本数据。
其中,数据特征信息序列可以是将特征因子按照预设的顺序进行排序而得到的信息序列。
具体地,由于样本历史交互数据为原生的行情数据,因此无法直接用于模型的训练,需要进一步数据特征转换(加工特征因子),常见的特征因子包含加权报价、报价价格变化比例、买卖压力指标等。首先,根据样本历史交互数据,从特征因子集合中选取若干个特征因子,作为对样本历史交互数据进行处理的数据特征信息序列(特征因子序列),并进一步根据数据特征信息序列,确定对样本历史交互数据进行处理的方法为正态分布转换以及持久化处理。基于正态分布转换的方法消除量纲的影响,将样本历史交互数据转换为符合标准正态分布的数据,得到去量纲样本历史交互数据。转换的过程中需要用到两个参数:均值与方差。保留参数的目的是在应用该模型时,对于实时接入的数据也需要用到该参数以进行标准化处理。将去量纲样本历史交互数据的参数信息保存下来的动作,即持久化处理,即可得到历史特征样本数据,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。
本实施例中,通过对融合处理得到的样本历史数据进行特征转换,也就是对样本历史数据进行分层带量处理,得到历史特征样本数据,能够将数据直接输入到预测模型后对模型进行训练,减少因为输入数据而导致预测模型的额外计算,以及提高了预测模型的预测精度。
在一个实施例中,如图7所示,按照预设的数据特征信息序列,对样本历史交互数据进行数据特征转换,得到历史特征样本数据,包括:
步骤702,根据数据特征信息序列,确定针对样本历史交互数据的为正态分布转换以及持久化处理。
具体地,根据样本历史交互数据,从特征因子集合中选取若干个特征因子,作为对样本历史交互数据进行处理的数据特征信息序列(特征因子序列),并进一步根据数据特征信息序列,确定对样本历史交互数据进行处理的方法为正态分布转换以及持久化处理。
步骤704,对样本历史交互数据进行正态分布转换,得到去量纲样本历史交互数据。
其中,去量纲样本历史交互数据可以是去除量纲后的样本历史交互数据。
具体地,基于正态分布转换的方法消除量纲的影响,将样本历史交互数据转换为符合标准正态分布的数据,得到去量纲样本历史交互数据。
步骤706,对去量纲样本历史交互数据进行持久化处理,得到历史特征样本数据。
具体地,将去量纲样本历史交互数据的参数信息保存下来的动作,即持久化处理,即可得到历史特征样本数据,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。
本实施例中,通过利用正态分布处理以及持久化处理对样本历史数据去量纲处理以及数据迭代处理,能够将样本历史数据从瞬时状态转变到持久状态,提高了预测模型的预测性能。
在一个实施例中,如图8所示,提供了一种资源对象变动信息预测方法,包括以下步骤:
步骤802,获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型。
其中,资源实时交互数据可以是资源交互平台因为发生资源变动而产生的实时数据。
具体地,服务器响应终端的模型训练指令,从服务器存储空间中调取资源交互平台实时的数据位置信息、资源交互信息以及交互量信息,由于实时的数据位置信息、资源交互信息以及交互量信息为资源交互平台针对任一时刻所产生的数据,因此,实时的数据位置信息、资源交互信息以及交互量信息三者之间具有对应关系。根据实时的数据位置信息、资源交互信息以及交互量信息三者之间的对应关系,对实时的数据位置信息、资源交互信息以及交互量信息三者进行分层处理,进一步,对实时的数据位置信息、资源交互信息以及交互量信息进行带量处理,最后得到资源实时交互数据。
同时,服务器响应终端的指令,从服务器存储空间中调取已训练资源对象变动信息预测模型,该模型中包括了至少两个已经训练好的信息类型分类模型。
步骤804,对资源实时交互数据进行数据特征转换,得到资源交互平台对应的实时特征交互数据。
其中,数据特征转换可以是将资源实时交互数据进行标准化处理和持久化处理。
其中,实时特征交互数据可以是资源交互平台在实时交互中产生的交互数据进行标准化以及持久化所得到的特征数据,用于输入至人工智能模型进行预测。
具体地,由于资源实时交互数据为原生的行情数据,因此无法直接用于模型的预测,需要进一步数据特征转换(加工特征因子),常见的特征因子包含加权报价、报价价格变化比例、买卖压力指标等。首先,根据资源实时交互数据,从特征因子集合中选取若干个特征因子,作为对资源实时交互数据进行处理的数据特征信息序列(特征因子序列),并进一步根据数据特征信息序列,确定对资源实时交互数据进行处理的方法为正态分布转换以及持久化处理。基于正态分布转换的方法消除量纲的影响,将资源实时交互数据转换为符合标准正态分布的数据,得到去量纲资源实时交互数据。转换的过程中需要用到两个参数:均值与方差。保留参数的目的是在应用该模型时,对于实时接入的数据也需要用到该参数以进行标准化处理。将去量纲资源实时交互数据的参数信息保存下来的动作,即持久化处理,即可得到实时特征交互数据,其中,持久化处理以便后续模型使用时进行加载,持久化处理方式可以是生成一个参数excel表。
步骤806,将实时特征交互数据输入至已训练资源对象变动信息预测模型,得到资源实时交互数据对应的资源对象变动信息。
其中,资源对象变动信息可以是资源交互平台的资源对象进行上涨、下降或者震荡的信息。
具体地,针对已训练资源对象变动信息预测模型,包括有多个信息类型分类模型,其中每一个信息类型分类模型均有已经训练好的分类机器学习模型,分别为:已训练逻辑回归学习模型、已训练支持向量机学习模型以及已训练决策树学习模型。针对已训练逻辑回归学习模型,将实时特征交互数据输入至已训练逻辑回归学习模型,通过已训练逻辑回归学习模型的计算,得到已训练逻辑回归学习模型对应的逻辑回归实时预测置信度信息;同理,针对已训练支持向量机学习模型,将实时特征交互数据输入至已训练支持向量机学习模型,通过已训练支持向量机学习模型的计算,得到已训练支持向量机学习模型对应的向量机实时预测置信度信息;同理,针对已训练决策树学习模型,将实时特征交互数据输入至已训练决策树学习模型,通过已训练决策树学习模型的计算,得到已训练决策树学习模型对应的决策树实时预测置信度信息。
将各个已训练信息类型分类模型对应的实时预测置信度信息进行整合,得到关于实时特征交互数据针对各个不同的变动信息分类类型对应的实时预测置信度信息集合。从实时预测置信度信息集合中选取实时预测置信度信息为最大值的置信度信息作为资源实时交互数据对应的实时置信度信息。表达式如下:
预测结果={i|max(Pi)}
其中,Pi为置信度信息。
由于各个实时预测置信度信息均对应资源对象变动信息,即实时置信度信息也有相对应的资源对象变动信息。因此,输出的预测结果为实时预测置信度对应的资源对象变动信息,作为资源实时交互数据对应的资源对象变动信息。例如:银行中上涨的实时置信度信息为A,下降的实时置信度信息为B,震荡的实时置信度信息为C,且A>B>C,则将上涨的实时置信度信息A作为实时置信度信息A,而实时置信度信息为A表征的资源对象变动信息为上涨,则实时置信度信息A表征的资源对象变动信息为上涨,作为资源实时交互数据对应的资源对象变动信息为上涨。
本实施例中,上述一种资源对象变动信息预测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;资源实时交互数据通过对资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;对资源实时交互数据进行数据特征转换,得到资源交互平台对应的实时特征交互数据;将实时特征交互数据输入至已训练资源对象变动信息预测模型,得到资源实时交互数据对应的资源对象变动信息。
通过将资源对象变动信息预测的模型从多分类模型转化为多个二分类子模型,能够简化了模型的复杂度,同时由于子问题间互相独立,通过并行运算可提高模型的执行效率,进一步,针对二分类子模型,可选择配置不同的机器学习模型,增强了模型的灵活性。使用该资源对象变动信息预测的模型,可以有效提高模型的预测效果的稳定性与准确性。
在一个实施例中,如图9所示,将实时特征交互数据输入至已训练资源对象变动信息预测模型,得到资源实时交互数据对应的资源对象变动信息,包括:
步骤902,将实时特征交互数据输入至各已训练信息类型分类模型,得到各已训练信息类型分类模型对应的实时预测置信度信息。
其中,已训练信息类型分类模型可以是已经训练好,可以用于对实时特征交互数据进行预测的二分类模型。
其中,实时预测置信度信息可以是对实时特征交互数据进行预测后,针对任一变动信息分类类型对应的二分类置信度信息。
具体地,针对已训练资源对象变动信息预测模型,包括有多个信息类型分类模型,其中每一个信息类型分类模型均有已经训练好的分类机器学习模型,分别为:已训练逻辑回归学习模型、已训练支持向量机学习模型以及已训练决策树学习模型。针对已训练逻辑回归学习模型,将实时特征交互数据输入至已训练逻辑回归学习模型,通过已训练逻辑回归学习模型的计算,得到已训练逻辑回归学习模型对应的逻辑回归实时预测置信度信息;同理,针对已训练支持向量机学习模型,将实时特征交互数据输入至已训练支持向量机学习模型,通过已训练支持向量机学习模型的计算,得到已训练支持向量机学习模型对应的向量机实时预测置信度信息;同理,针对已训练决策树学习模型,将实时特征交互数据输入至已训练决策树学习模型,通过已训练决策树学习模型的计算,得到已训练决策树学习模型对应的决策树实时预测置信度信息。
步骤904,根据各已训练信息类型分类模型对应的实时预测置信度信息满足预设条件的置信度信息作为资源实时交互数据对应的实时置信度信息。
其中,实时置信度信息可以是置信度值为最大的实时预测置信度信息。
具体地,将各个已训练信息类型分类模型对应的实时预测置信度信息进行整合,得到关于实时特征交互数据针对各个不同的变动信息分类类型对应的实时预测置信度信息集合。从实时预测置信度信息集合中选取实时预测置信度信息为最大值的置信度信息作为资源实时交互数据对应的实时置信度信息。表达式如下:
预测结果={i|max(Pi)}
其中,Pi为置信度信息。
步骤906,将实时置信度信息对应的资源对象变动信息作为资源实时交互数据对应的资源对象变动信息。
具体地,由于各个实时预测置信度信息均对应资源对象变动信息,即实时置信度信息也有相对应的资源对象变动信息。因此,输出的预测结果为实时预测置信度对应的资源对象变动信息,作为资源实时交互数据对应的资源对象变动信息。例如:银行中上涨的实时置信度信息为A,下降的实时置信度信息为B,震荡的实时置信度信息为C,且A>B>C,则将上涨的实时置信度信息A作为实时置信度信息A,而实时置信度信息为A表征的资源对象变动信息为上涨,则实时置信度信息A表征的资源对象变动信息为上涨,作为资源实时交互数据对应的资源对象变动信息为上涨。
本实施例中,通过从各个已训练信息类型分类模型对应的实时预测置信度信息中选取置信度值最大对应的资源对象变动信息作为最后需要的资源对象变动信息,能够在使用多个二分类模型的情况下,达到了降低计算复杂度的同时还能提高预测的准确度。
在一个实施例中,如图11所示,将实时特征交互数据输入至各已训练信息类型分类模型,得到各已训练信息类型分类模型对应的实时预测置信度信息,包括:
步骤1002,将实时特征交互数据输入至已训练逻辑回归学习模型,得到逻辑回归实时预测置信度信息。
其中,已训练逻辑回归学习模型可以是已经训练好的逻辑回归计算模型。
其中,逻辑回归实时预测置信度信息可以是通过已经训练好的逻辑回归计算模型进行预测而得到的二分类置信度信息。
具体地,将实时特征交互数据输入至已训练逻辑回归学习模型,通过已训练逻辑回归学习模型的计算,得到已训练逻辑回归学习模型对应的逻辑回归实时预测置信度信息。
步骤1004,将实时特征交互数据输入至已训练支持向量机学习模型,得到向量机实时预测置信度信息。
其中,已训练支持向量机学习模型可以是已经训练好的支持向量机计算模型。
其中,向量机实时预测置信度信息可以是通过已经训练好的支持向量机计算模型进行预测而得到的二分类置信度信息。
具体地,将实时特征交互数据输入至已训练支持向量机学习模型,通过已训练支持向量机学习模型的计算,得到已训练支持向量机学习模型对应的向量机实时预测置信度信息。
步骤1006,将实时特征交互数据输入至已训练决策树学习模型,得到决策树实时预测置信度信息。
其中,已训练决策树学习模型可以是已经训练好的决策树计算模型。
其中,决策树实时预测置信度信息可以是通过已经训练好的决策树计算模型进行预测而得到的二分类置信度信息。
具体地,将实时特征交互数据输入至已训练决策树学习模型,通过已训练决策树学习模型的计算,得到已训练决策树学习模型对应的决策树实时预测置信度信息。
本实施例中,通过根据选定的各种不同的分类机器学习模型对特征交互数据进行预测,并对应地输出各个分类机器学习模型对应的二分类置信度信息,能够根据实际的业务情况,选择对应的分类机器学习模型,避免同一个分类机器学习模型对各种业务情况进行预测,提高了资源对象变动信息预测模型的准确率。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的资源对象变动信息预测模型的训练方法的一种资源对象变动信息预测模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源对象变动信息预测模型的训练装置实施例中的具体限定可以参见上文中对于一种资源对象变动信息预测模型的训练方法的限定;以及,本申请实施例还提供了一种用于实现上述所涉及的资源对象变动信息预测方法的一种资源对象变动信息预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源对象变动信息预测装置实施例中的具体限定可以参见上文中对于一种资源对象变动信息预测方法的限定,在此不再赘述。
在一个实施例中,如图14所示,提供了一种资源对象变动信息预测模型的训练装置,包括:样本数据获取模块1402、分类类型确定模块1404、模型计算模块1406和模型训练模块1408,其中:
样本数据获取模块1402,用于获取历史特征样本数据;历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;
分类类型确定模块1404,用于根据历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;
模型计算模块1406,用于将历史特征样本数据输入至各信息类型分类模型,得到各信息类型分类模型对应的二分类置信度信息;二分类置信度信息包括两种变动信息类型对应的两个二分类置信度信息;
模型训练模块1408,用于根据各信息类型分类模型对应的二分类置信度信息,对相应的信息类型分类模型进行训练,直到各二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
在一个实施例中,模型计算模块1406,还用于根据各变动信息分类类型,相对应确定各信息类型分类模型所采用的分类机器学习模型;将历史特征样本数据输入至各分类机器学习模型,得到各分类机器学习模型对应的二分类置信度信息。
在一个实施例中,模型计算模块1406,还用于将历史特征样本数据输入至待训练逻辑回归学习模型,得到逻辑回归二分类置信度信息;将历史特征样本数据输入至待训练支持向量机学习模型,得到向量机二分类置信度信息;将历史特征样本数据输入至待训练决策树学习模型,得到决策树二分类置信度信息。
在一个实施例中,模型训练模块1408,还用于根据各二分类置信度信息,对相应的信息类型分类模型的模型参数进行调整,得到各信息类型分类模型对应的已调整分类模型参数和已调参分类模型;将各已调整分类模型参数进行持久化处理,得到各已调整分类模型参数对应的持久化参数;基于各已调整分类模型参数以及各持久化参数,相应对各信息类型分类模型进行训练,直到二分类置信度信息满足预设条件,得到各已训练信息类型分类模型;根据各已训练信息类型分类模型,得到已训练资源对象变动信息预测模型。
在一个实施例中,样本数据获取模块1402,还用于获取资源交互平台的数据位置信息、资源交互信息以及交互量信息;对数据位置信息、资源交互信息以及交互量信息进行融合,得到样本历史交互数据;按照预设的数据特征信息序列,对样本历史交互数据进行数据特征转换,得到历史特征样本数据。
在一个实施例中,样本数据获取模块1402,还用于根据数据特征信息序列,确定针对样本历史交互数据的为正态分布转换以及持久化处理;对样本历史交互数据进行正态分布转换,得到去量纲样本历史交互数据;对去量纲样本历史交互数据进行持久化处理,得到历史特征样本数据。
在一个实施例中,如图15所示,提供了一种资源对象变动信息预测装置,包括:实时数据获取模块1502、特征转换模块1504和变动信息预测模块1506,其中:
实时数据获取模块1502,用于获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;已训练资源对象变动信息预测模型为根据一种资源对象变动信息预测模型的训练方法训练得到的;资源实时交互数据通过对资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;
特征转换模块1504,用于对资源实时交互数据进行数据特征转换,得到资源交互平台对应的实时特征交互数据;
变动信息预测模块1506,用于将实时特征交互数据输入至已训练资源对象变动信息预测模型,得到资源实时交互数据对应的资源对象变动信息。
在一个实施例中,变动信息预测模块1506,还用于将实时特征交互数据输入至各已训练信息类型分类模型,得到各已训练信息类型分类模型对应的实时预测置信度信息;根据各已训练信息类型分类模型对应的实时预测置信度信息满足预设条件的置信度信息作为资源实时交互数据对应的实时置信度信息;将实时置信度信息对应的资源对象变动信息作为资源实时交互数据对应的资源对象变动信息。
在一个实施例中,变动信息预测模块1506,还用于将实时特征交互数据输入至已训练逻辑回归学习模型,得到逻辑回归实时预测置信度信息;将实时特征交互数据输入至已训练支持向量机学习模型,得到向量机实时预测置信度信息;将实时特征交互数据输入至已训练决策树学习模型,得到决策树实时预测置信度信息。
上述一种资源对象变动信息预测模型的训练装置以及一种资源对象变动信息预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储服务器数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种资源对象变动信息预测模型的训练方法以及一种资源对象变动信息预测方法。
本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (14)

1.一种资源对象变动信息预测模型的训练方法,其特征在于,所述方法包括:
获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;
根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;
将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;
根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息,包括:
根据各所述变动信息分类类型,相对应确定各所述信息类型分类模型所采用的分类机器学习模型;
将所述历史特征样本数据输入至各所述分类机器学习模型,得到各所述分类机器学习模型对应的二分类置信度信息。
3.根据权利要求2所述的方法,其特征在于,所述分类机器学习模型包括待训练逻辑回归学习模型、待训练支持向量机学习模型以及待训练决策树学习模型;所述将所述历史特征样本数据输入至各所述分类机器学习模型,得到各所述分类机器学习模型对应的二分类置信度信息,包括:
将所述历史特征样本数据输入至所述待训练逻辑回归学习模型,得到逻辑回归二分类置信度信息;
将所述历史特征样本数据输入至所述待训练支持向量机学习模型,得到向量机二分类置信度信息;
将所述历史特征样本数据输入至所述待训练决策树学习模型,得到决策树二分类置信度信息。
4.根据权利要求1所述的方法,其特征在于,所述根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型,包括:
根据各所述二分类置信度信息,对相应的所述信息类型分类模型的模型参数进行调整,得到各所述信息类型分类模型对应的已调整分类模型参数和已调参分类模型;
将各所述已调整分类模型参数进行持久化处理,得到各所述已调整分类模型参数对应的持久化参数;
基于各所述已调整分类模型参数以及各所述持久化参数,相应对各所述已调参分类模型进行训练,直到所述二分类置信度信息满足预设条件,得到各所述已训练信息类型分类模型;
根据各所述已训练信息类型分类模型,得到所述已训练资源对象变动信息预测模型。
5.根据权利要求1所述的方法,其特征在于,在所述获取历史特征样本数据步骤之前,还包括:
获取资源交互平台的数据位置信息、资源交互信息以及交互量信息;
对所述数据位置信息、所述资源交互信息以及所述交互量信息进行融合,得到所述样本历史交互数据;
按照预设的数据特征信息序列,对所述样本历史交互数据进行数据特征转换,得到所述历史特征样本数据。
6.根据权利要求5所述的方法,其特征在于,所述按照预设的数据特征信息序列,对所述样本历史交互数据进行数据特征转换,得到所述历史特征样本数据,包括:
根据所述数据特征信息序列,确定针对所述样本历史交互数据的为正态分布转换以及持久化处理;
对所述样本历史交互数据进行所述正态分布转换,得到去量纲样本历史交互数据;
对所述去量纲样本历史交互数据进行持久化处理,得到所述历史特征样本数据。
7.一种资源对象变动信息预测方法,其特征在于,所述方法包括:
获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据如权利要求1至6中任一项所述资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;
对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;
将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
8.根据权利要求7所述的方法,其特征在于,所述将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息,包括:
将所述实时特征交互数据输入至各已训练信息类型分类模型,得到各所述已训练信息类型分类模型对应的实时预测置信度信息;
根据各所述已训练信息类型分类模型对应的实时预测置信度信息满足预设条件的置信度信息作为所述资源实时交互数据对应的实时置信度信息;
将所述实时置信度信息对应的所述资源对象变动信息作为所述资源实时交互数据对应的资源对象变动信息。
9.根据权利要求8所述的方法,其特征在于,所述已训练信息类型分类模型包括已训练逻辑回归学习模型、已训练支持向量机学习模型以及已训练决策树学习模型;所述将所述实时特征交互数据输入至各所述已训练信息类型分类模型,得到各所述已训练信息类型分类模型对应的实时预测置信度信息,包括:
将所述实时特征交互数据输入至所述已训练逻辑回归学习模型,得到逻辑回归实时预测置信度信息;
将所述实时特征交互数据输入至所述已训练支持向量机学习模型,得到向量机实时预测置信度信息;
将所述实时特征交互数据输入至所述已训练决策树学习模型,得到决策树实时预测置信度信息。
10.一种资源对象变动信息预测模型的训练装置,其特征在于,所述装置包括:
样本数据获取模块,用于获取历史特征样本数据;所述历史特征样本数据包括通过将样本历史交互数据进行数据特征转换得到的特征数据;
分类类型确定模块,用于根据所述历史特征样本数据,确定待训练资源对象变动信息预测模型中的各信息类型分类模型对应的变动信息分类类型;所述变动信息分类类型包括针对资源对象变动信息中的其中两种变动信息类型;
模型计算模块,用于将所述历史特征样本数据输入至各所述信息类型分类模型,得到各所述信息类型分类模型对应的二分类置信度信息;所述二分类置信度信息包括所述两种变动信息类型对应的两个二分类置信度信息;
模型训练模块,用于根据各所述信息类型分类模型对应的二分类置信度信息,对相应的所述信息类型分类模型进行训练,直到各所述二分类置信度信息满足预设条件,得到已训练资源对象变动信息预测模型。
11.一种资源对象变动信息预测装置,其特征在于,所述装置包括:
实时数据获取模块,用于获取资源交互平台的资源实时交互数据以及已训练资源对象变动信息预测模型;所述已训练资源对象变动信息预测模型为根据如权利要求1至6中任一项所述资源对象变动信息预测模型的训练方法训练得到的;所述资源实时交互数据通过对所述资源交互平台进行实时获取得到的数据位置信息、资源交互信息以及交互量信息进行融合得到的;
特征转换模块,用于对所述资源实时交互数据进行数据特征转换,得到所述资源交互平台对应的实时特征交互数据;
变动信息预测模块,用于将所述实时特征交互数据输入至所述已训练资源对象变动信息预测模型,得到所述资源实时交互数据对应的资源对象变动信息。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
CN202310322982.5A 2023-03-29 2023-03-29 预测模型训练方法、装置、计算机设备和存储介质 Pending CN116306985A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310322982.5A CN116306985A (zh) 2023-03-29 2023-03-29 预测模型训练方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310322982.5A CN116306985A (zh) 2023-03-29 2023-03-29 预测模型训练方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN116306985A true CN116306985A (zh) 2023-06-23

Family

ID=86799535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310322982.5A Pending CN116306985A (zh) 2023-03-29 2023-03-29 预测模型训练方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN116306985A (zh)

Similar Documents

Publication Publication Date Title
CN107622326B (zh) 用户分类、可用资源预测方法、装置及设备
CN111242319A (zh) 模型预测结果的解释方法和装置
CN115392594B (zh) 一种基于神经网络和特征筛选的用电负荷模型训练方法
CN115796548A (zh) 一种资源分配方法、装置、计算机设备、存储介质及产品
CN116306985A (zh) 预测模型训练方法、装置、计算机设备和存储介质
CN114219184A (zh) 产品交易数据预测方法、装置、设备、介质和程序产品
CN110827148B (zh) 基于降维技术优化的循环神经网络的股市数据分析方法
CN117151884A (zh) 资产管理数据处理方法、装置、计算机设备和存储介质
CN114707488B (zh) 数据处理方法、装置、计算机设备及存储介质
CN118132091A (zh) 业务模型的处理方法、装置、计算机设备和存储介质
US20230334362A1 (en) Self-adaptive multi-model approach in representation feature space for propensity to action
CN117435279A (zh) 个人资源管理方法、装置、计算机设备和存储介质
CN116976486A (zh) 申诉请求的处理方法、装置、设备和存储介质
CN116629694A (zh) 基于电网工程的esg指标体系算法模型确定方法和装置
CN117132335A (zh) 资源合约中资源交易值的确定方法、装置和计算机设备
CN117113131A (zh) 分类模型的确定方法、装置、计算机设备和存储介质
CN117459576A (zh) 基于边缘计算的数据推送方法、装置和计算机设备
CN116468531A (zh) 账户信息处理方法、装置、计算机设备和存储介质
CN117993369A (zh) 审计报表生成方法、装置、计算机设备和存储介质
CN115482112A (zh) 数据处理方法、装置、计算机设备和存储介质
CN115578186A (zh) 授信额度预测方法、装置、计算机设备、存储介质和产品
CN118195769A (zh) 产品逾期状态预测方法、装置、计算机设备、存储介质和计算机程序产品
CN116452308A (zh) 风险评估方法、装置、计算机设备、存储介质和程序产品
CN118035423A (zh) 信息查询方法、装置、计算机设备和存储介质
CN117094292A (zh) 表单文件的处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination