CN112767167B - 一种基于集成学习的投资交易风险趋势预测方法及装置 - Google Patents

一种基于集成学习的投资交易风险趋势预测方法及装置 Download PDF

Info

Publication number
CN112767167B
CN112767167B CN202110169175.5A CN202110169175A CN112767167B CN 112767167 B CN112767167 B CN 112767167B CN 202110169175 A CN202110169175 A CN 202110169175A CN 112767167 B CN112767167 B CN 112767167B
Authority
CN
China
Prior art keywords
risk
learner
transaction data
weak
risk level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110169175.5A
Other languages
English (en)
Other versions
CN112767167A (zh
Inventor
洑佳红
杨振华
李明洁
李玙霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110169175.5A priority Critical patent/CN112767167B/zh
Publication of CN112767167A publication Critical patent/CN112767167A/zh
Application granted granted Critical
Publication of CN112767167B publication Critical patent/CN112767167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请提供的一种基于集成学习的投资交易风险趋势预测方法及装置,可用于金融领域或其他领域,方法包括:将投资交易过程中的交易数据输入至多个弱学习器,弱学习器输出交易数据对应的风险等级,将弱学习器输出的风险等级输入至集成学习器,集成学习器输出综合风险等级,集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,综合风险等级为每个弱学习器输出的风险等级进行加权得到;该方法可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,采用集成学习的思想,提高信用债投资交易风险的准确性。

Description

一种基于集成学习的投资交易风险趋势预测方法及装置
技术领域
本申请涉及金融领域,具体涉及一种基于集成学习的投资交易风险预测方法及装置。
背景技术
随着我国债券市场的发展,债券市场开放程度也逐步加快,经济结构转型升级叠加经济下行压力加大,债券市场风险不断积累,因此涌现了各种对债券类投资交易过程中的信用风险、市场风险的计量分析工具。在信用风险领域,例如基于KMV模型的对企业债的信用风险领域研究,运用Knight不确定性的研究政府债券的信用风险。市场风险方面,例如基于CVar的对债券回购市场利率的风险度量,利用久期衡量利率风险等手段。这些工具和方法的共同特点都是依据理论数据或交易员投资经验建立风险评估模型进行风险计量分析,并仅适用于特定的债券种类。伴随着债券类交易数据的不断积累,我们期望对信用债投资交易风险评估的手段能从利用模型评估信用债当前状况转向挖掘债券类投资交易过程中历史数据与当前信用债投资交易风险状况的映射关系,采用机器学习算法有监督的训练预测模型。
为了获得更好的预测性能,本装置在利用现有机器学习算法支持向量机(SVM)训练信用债风险预测模型的基础上,创新地采用了集成学习的思想,不仅能解决当前信用债投资交易风险评估模型依赖主观人为因素的缺陷,还提高了SVM机器学习建立风险预测模型的可靠性。
发明内容
针对现有技术中的问题,本申请提供一种基于集成学习的投资交易风险预测方法及装置,采用集成学习的思想,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,提高信用债投资交易风险的准确性。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种基于集成学习的投资交易风险趋势预测方法,包括:
获取投资交易过程中的交易数据;
将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合;
将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到;
根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
进一步地,所述投资交易风险趋势预测方法还包括:
利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
进一步地,所述利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器,包括:
将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练;
将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;
将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值。
进一步地,所述投资交易风险趋势预测方法还包括:
对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
第二方面,本申请提供一种基于集成学习的投资交易风险趋势预测装置,包括:
数据采集单元:获取投资交易过程中的交易数据;
弱学习器单元:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合;
集成学习器单元:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到;
风险预测单元:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
进一步地,所述投资交易风险趋势预测装置还包括:
训练单元:利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
进一步地,所述训练单元包括:
弱学习器训练组件:将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练;
弱学习器测试组件:将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;
集成学习器训练组件:将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值。
进一步地,所述投资交易风险趋势预测装置还包括:
数据预处理单元:对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的投资交易风险趋势预测方法
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的投资交易风险趋势预测方法。
由上述技术方案可知,本申请提供的一种基于集成学习的投资交易风险预测方法及装置,方法包括:将投资交易过程中的交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合;将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到;根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作;该方法可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,采用集成学习的思想,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面集成学习器能够支持多种现有机器学习算法,可扩展性强。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中的一种基于集成学习的投资交易风险预测方法的风险预测流程示意图。
图2是本申请实施例中的一种基于集成学习的投资交易风险预测方法中步骤100之前的流程示意图。
图3是本申请实施例中的一种基于集成学习的投资交易风险预测方法中步骤001的流程示意图。
图4是本申请实施例中的一种基于集成学习的投资交易风险预测装置结构示意图。
图5是本申请实施例中一种基于集成学习的投资交易风险预测装置的训练组件的结构示意图。
图6是本申请实施例中一种基于集成学习的投资交易风险预测装置的数据处理单元的结构示意图。
图7是本申请实施例中一种基于集成学习的投资交易风险预测装置的弱学习器单元结构示意图。
图8是本申请实施例中一种基于集成学习的投资交易风险预测方法的步骤002至步骤013的流程示意图。
图9是本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请公开的一种基于集成学习的投资交易风险预测方法及装置,可用于金融领域,也可用于除金融领域之外的任意领域,本申请公开的一种基于集成学习的投资交易风险预测方法及装置的应用领域不做限定。
在本申请的一个或多个实施例中,投资过程中的每组交易数据包括但不限于以下字段{交易时间,金额,债券类型,发行时间,发行对象},每组交易数据对应的风险等级标签为风险提升、风险下降以及风险持平。
考虑到当前信用债投资交易风险评估模型依赖主观人为因素,预测结果可靠性低的问题,本申请提供一种基于集成学习的投资交易风险预测方法、投资交易风险预测装置、电子设备和计算机可读存储介质,采用集成学习的思想,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面集成学习器能够支持多种现有机器学习算法,可扩展性强。
基于上述内容,本申请还提供一种用于实现本申请一个或多个实施例中提供的投资交易风险预测方法的投资交易风险预测装置,该投资交易风险预测装置可以与客户端设备之间通信连接,所述客户终端设备可以设有多个,投资交易风险预测装置具体可以通过应用服务器访问所述客户终端设备。
其中,所述投资交易风险预测装置可以自客户终端设备接收投资交易风险预测指令,并自该投资交易风险预测指令中获取需要进行风险预测的债券投资交易信息,所述投资交易风险预测装置根据该债券投资交易信息,获取投资交易过程中的交易数据,并将交易数据输入至预测模型,所述预测模型输出该债券投资的风险等级,而后,所述投资交易风险预测装置可以将投资风险预测结果发送至客户端设备进行显示,客户端根据投资风险预测结果给出风向对抗操作,以使用户根据客户端设备获得投资风险预测结果,做出对应的风险应对措施。
可以理解的是,所述客户端设备可以包括智能手机、平板电子设备、便携式计算机、台式电脑以及个人数字助理(PDA)等。
在另一实际应用情形中,进行投资交易风险预测的部分可以在如上述内容所述的分类处理中心执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器,用于进行投资交易风险预测的具体处理。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。例如,通信单元可以将投资交易风险预测指令发送至分类处理中心的服务器,以便服务器根据投资交易风险预测指令进行投资交易风险预测。通信单元还可以接收服务器返回的识别结果。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
本申请提供的一种基于集成学习的投资交易风险预测方法、投资交易风险预测装置、电子设备和计算机可读存储介质,可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,采用集成学习的思想,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面本装置的集成学习器能够支持多种现有机器学习算法,可扩展性强。
具体通过下述多个实施例及应用实例分别进行说明。
为了解决当前信用债投资交易风险评估模型依赖主观人为因素,预测结果可靠性低的问题,本申请提供一种基于集成学习的投资交易风险预测方法的实施例,参见图1,所述投资交易风险预测方法具体包括有如下内容:
步骤100:获取投资交易过程中的交易数据。
可以理解的是,信用债券亦称"无担保债券"。没有以指定的财产抵押为保障,完全以公司的良好信誉而发行的债券。信用债券持有者对发行人所有未用于其他债务进行抵押的资产具有一般债权人的求偿权。同时,信用债券持有者对那些已抵押资产超出其保障债券所需要的部分也有求偿权。与有担保债券相比,信用债券的持有人承担的风险较大,因而往往要求较高的利率。在预测债权类投资风险时,需要获取投资交易过程中的交易数据来进行预判,每条交易数据包括但不限于以下数据:交易时间、交易金额、债券类型、发行时间以及发行对象等。步骤100在交易数据获取后,还包括对交易数据进行预处理。在获取交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,这需要对交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据采用同类均值插补法进行缺失值补全,处理完的交易数据构成一个数据仓,用于对投资交易的风险进行预测。
步骤200:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合。
可以理解的是,债券投资的风险是指债券预期收益变动的可能性及变动幅度,债券投资的风险是普遍存在的。每条交易数据都对应一个风险等级,风险等级包括风险下降、风险上升以及风险持平。所述弱学习器具体为SVM学习器,SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。弱学习器从步骤100中获取到交易数据,弱学习器输出交易数据对应的预测风险等级。风险等级标签的建立目的为将原有对当前交易风险状态的预测改进为对风险变化趋势的预测。
步骤300:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到。
可以理解的是,集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。弱学习器输出的风险等级作为集成学习器的输入。在步骤100之前还包括对弱学习器和集成学习器进行训练,训练过程中集成学习器对每个弱学习器输出的风险等级的权重进行赋值,弱学习器的训练测试结果越准确,其结果的权重越高。集成学习器输出的风险预测结果为每个弱学习器输出的预测风险等级进行加权后的结果。例如,在学习器训练过程中,集成学习器给第一弱学习器的输出结果的权重赋值为0.5,给弱学习器的输出结果的权重赋值为1,在风险预测时,第一弱学习器的输出结果为A,第二弱学习器的输出结果为B,将A和B输入至集成学习器,集成学习器进行赋值并加权,其输出结果为0.5×A+1×B。
步骤400:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
可以理解的是,债券风险等级发生变化后,会对投资者的投资收益产生影响,带来意外的收益或承受更多的风险,因而投资者要密切注意影响债券风险等级评估的各种因素的变化,推测债券等级的变化方向,进而预测其价格变化并从中获利。根据集成学习器输出的结果,预判出债券风险趋势,为投资者提供投资参考,同时给出规避风险或是投资建议。投资者可在预测某债券风险趋势即将下降时,抢先买入债券,也可在推测某债券风险趋势即将下降时,抢先卖出手中持有的债券。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险预测方法,采用集成学习的思想,可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,一方面,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面,集成学习器能够支持多种现有机器学习算法,可扩展性强。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测方法的一个实施例中,提供一种学习器训练过程的优选方式,参见图2,在所述投资交易风险趋势预测方法中的步骤100之前具体包含有如下内容:
步骤001:利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
可以理解的是,对学习器进行训练,是为了让弱学习器预测的结果更准确,同时,集成学习器根据弱学习器的训练结果对弱学习器的输出结果进行权重赋值,进一步提高风险预测的准确性。在学习器训练之前,需要对每一条交易数据需增加一个风险等级标签,标签集包括风险提升、风险下降以及风险持平,如果该笔交易对应的风险评估值比前一笔交易的风险评估值有降低,则该笔交易增加“风险下降”标签,风险评估值为0-100的分值,需要专家或交易员对每笔交易进行打分。专家规则可根据不同维度的交易数据去判断交易的风险评估值。保证数据仓库中每一条交易数据包含但不限于以下字段:交易时间、交易金额、债券类型、发行时间、发行对象以及风险等级。利用已标注风险等级的历史交易数据对弱学习器和集成学习器进行有监督的训练,有监督训练,又称监督学习,是一个机器学习中的方法,可以由训练资料中学到或建立一个模式(函数/learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类),全面提升债券类投资交易风险预测模型的可靠性。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测方法,利用已知结果的历史数据对弱学习器和集成学习器进行有监督的训练,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,进一步提高了风险预测的可靠性。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测方法的一个实施例中,可以对弱学习器以及集成学习器再进行有监督的训练,参见图3,在所述投资交易风险趋势预测方法中的步骤001具体包含有如下内容:
步骤011:将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练。
可以理解的是,弱学习器采用的是SVM算法,但不局限于SVM算法。弱学习器采用有监督训练,将第一历史交易数据集抽样划分为K个训练子集,将K个训练子集一一对应作为K个弱学习器的输入,对弱学习器进行有监督的训练,弱学习器根据每条交易数据以及每条交易数据对应的风险等级进行学习,找到交易数据与风险等级之间的规律。
步骤012:将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合。
可以理解的是,采用第二历史交易数据集作为预测集,随机抽样的方式将第二历史交易数据集划分为K个测试子集,将K个测试子集输入至训练后的K个弱学习器中,对训练后的弱学习器进行测试,每组交易数据与弱学习器一一对应,K个弱学习器输出K个风险等级测试结果,所有风险等级测试结果构成风险等级测试结果集,第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合。例如,第二历史交易数据集包括A、B、C、D四组交易数据,将第二历史交易数据集随机抽样生成{A、D}、{B、C}两个测试子集,A对应的风险等级为A′,B对应的风险等级为B′,C对应的风险等级为C′,D对应的风险等级为D′,则A′、B′、C′、D′构成原始风险等级集合{A′、B′、C′、D′},将{A、D}、{B、C}输入至两个弱学习器中,每个测试子集与弱学习器一一对应,第一弱学习器输出预测子集{A、D}应的风险等级{a、d},第二弱学习器输出预测子集{B、C}对应的风险等级{b、c},其中,{a、d}、{b、c}构成风险等级测试结果集{a、b、c、d},原始风险等级集合{A′、B′、C′、D′}和风险等级测试结果集{a、b、c、d}将作为集成学习器的输入。
步骤013:将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值。
可以理解的是,将原始风险等级集合与风险等级测试结果集输入至集成学习器,对集成学习器进行训练,集成学习器根据每笔交易数据的原始风险等级和预测风险等级,对每个弱学习器的输出结果的权重进行赋值。例如,将原始风险等级集合{A′、B′、C′、D′}以及风险等级测试结果集{a、b、c、d}输入至集成学习器中,假设原始风险等级集合中A′=1,B′=2,C′=3,D′=4,风险等级测试结果集中a=2,b=2,c=1,d=5,集成学习器根据原始风险等级和测试风险等级,对每个弱学习器的输出结果的权重进行赋值,弱学习器的输出的测试风险等级越接近原始风险等级,则该弱学习器权重越高,第一弱学习器输出结果为{a,d},其中A的原始风险等级为1,测试风险等级为2,D的原始风险等级为4,测试风险等级为5,第一弱学习器输出结果为{b,c},其中,B的原始风险等级为2,测试风险等级为2,C的原始风险等级为3,测试风险等级为1,因此,第二弱学习器的输出结果更为准确,则将第一弱学习器的输出结果的权重设为0.3,将第二弱学习器的输出结果的权重设为1。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测方法,采用集成学习的思想,进一步对弱学习器的输出结果进行集成,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,提高投资风险预测的可靠性。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测方法的一个实施例中,提供一种投资交易风险趋势预测的优选方式,参见图3,在所述投资交易风险趋势预测方法中的步骤011之前还具体包含有如下内容:
步骤002:对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
可以理解的是,在获取历史交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,这需要对历史交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据,采用同类均值插补法进行缺失值补全,处理完的历史交易数据构成一个数据仓。采用随机抽样的方式,将数据仓库中的历史交易数据划分产生两个子集第一历史交易数据集和第二历史交易数据集。第一历史交易数据集将作为弱学习器的训练集,第二历史交易数据集将作为弱学习器的测试集和集成学习器的训练集。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测方法,对交易数据进行预处理,并进行抽样拆分,能避免每个弱学习器的输入为同一交易数据,提高了弱学习器预测的准确性,同时将弱学习器的输出作为集成学习器的输入,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,提高投资风险预测的可靠性。
下面结合图8,对本申请实施例提供的一种基于集成学习的投资交易风险趋势预测方法的步骤002至步骤01的弱学习器和集成学习器训练过程具体说明:
步骤S01:获取已标注历史风险等级标签的投资历史交易数据;
步骤S02:采用随机抽样的方式将投资历史交易数据划分为投资交易数据训练集和投资交易数据预测集,投资交易数据预测集中的所有交易数据的风险等级标签构成原始风险等级集合;
步骤S03:采用随机抽样的方式将投资交易数据训练集划分为n个投资交易数据训练子集;
步骤S04:将n个投资交易数据训练子集输入至n个弱学习器中,对弱学习器进行训练,投资交易数据训练子集与弱学习器一一对应;
步骤S05:采用随机抽样的方式将投资交易数据预测集划分为n个投资交易数据预测子集;
步骤S06:将n个投资交易数据预测子集输入至训练后的n个弱学习器中,弱学习器输出交易数据对应的预测风险等级,所有输出的预测风险等级构成风险等级预测结果集;
步骤S07:将原始风险等级集合和风险等级预测结果集输入至集成学习器中,集成学习器根据原始风险等级和预测风险等级,对弱学习器输出的结果的权重进行赋值。
第二方面,为了解决当前信用债投资交易风险评估模型依赖主观人为因素,预测结果可靠性低的问题,本申请提供一种基于集成学习的投资交易风险预测装置的实施例,参见图4,所述投资交易风险预测装置具体包含有如下内容:
数据采集单元1:获取投资交易过程中的交易数据。
可以理解的是,信用债券亦称"无担保债券"。没有以指定的财产抵押为保障,完全以公司的良好信誉而发行的债券。信用债券持有者对发行人所有未用于其他债务进行抵押的资产具有一般债权人的求偿权。同时,信用债券持有者对那些已抵押资产超出其保障债券所需要的部分也有求偿权。与有担保债券相比,信用债券的持有人承担的风险较大,因而往往要求较高的利率。在预测债权类投资风险时,需要获取投资交易过程中的交易数据来进行预判,每条交易数据包括但不限于以下数据:交易时间、交易金额、债券类型、发行时间以及发行对象等。数据采集单元1接收到投资交易风险预测指令,自动获取交易过程中的交易数据,也可以用户通过客户端设备输入交易数据进行预测。在获取交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,数据采集单元1还包括数据预处理组件,对交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据采用同类均值插补法进行缺失值补全,处理完的交易数据构成一个数据仓,用于对投资交易的风险进行预测。
弱学习器单元2:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合。
可以理解的是,所述弱学习器具体为SVM学习器,SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。债券投资的风险是指债券预期收益变动的可能性及变动幅度,债券投资的风险是普遍存在的。每条交易数据都对应一个风险等级,风险等级包括风险下降、风险上升以及风险持平。数据采集单元1将交易数据输入至弱学习器单元2,弱学习器单元2输出交易数据对应的风险等级。弱学习器单元2包括多个弱学习器21,参见图7,多个弱学习器21均为同类SVM学习器。风险等级标签的建立目的为将原有对当前交易风险状态的预测改进为对风险变化趋势的预测。
集成学习器单元3:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到。
可以理解的是,集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。集成学习器单元3通过将多个单一学习器进行结合,常可获得比单一学习器显著优越的泛化性能。弱学习器单元2输出的风险等级作为集成学习器的输入。在步骤100之前还包括对弱学习器和集成学习器进行训练,训练过程中集成学习器对每个弱学习器输出的风险等级的权重进行赋值,弱学习器的训练测试结果越准确,其结果的权重越高。集成学习器输出的风险预测结果为每个弱学习器输出的预测风险等级进行加权后的结果。例如,在学习器训练过程中,集成学习器给第一弱学习器的输出结果的权重赋值为0.5,给弱学习器的输出结果的权重赋值为1,在风险预测时,第一弱学习器的输出结果为A,第二弱学习器的输出结果为B,将A和B输入至集成学习器,集成学习器进行赋值并加权,其输出结果为0.5×A+1×B。弱学习器单元2输出的风险等级作为集成学习器单元3的输入,集成学习器单元3中的集成学习器对弱学习器单元2输出的风险等级的权重进行赋值,并将弱学习器单元2输出的风险等级进行加权,得到最终的投资交易风险等级。
风险预测单元4:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
可以理解的是,债券风险等级发生变化后,会对投资者的投资收益产生影响,带来意外的收益或承受更多的风险,因而投资者要密切注意影响债券风险等级评估的各种因素的变化,推测债券等级的变化方向,进而预测其价格变化并从中获利。风险预测单元4根据集成学习器单元3输出的综合风险等级,预判出债券风险趋势,为投资者提供投资参考,同时给出规避风险或是投资建议。投资者可在预测某债券风险趋势即将下降时,抢先买入债券,也可在推测某债券风险趋势即将下降时,抢先卖出手中持有的债券。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险预测装置,采用集成学习的思想,可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面集成学习器能够支持多种现有机器学习算法,可扩展性强。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测装置的一个实施例中,提供一种学习器训练过程的优选方式,参见图4,所述投资交易风险趋势预测装置还包括:
训练单元5:利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
可以理解的是,训练单元5是为了让弱学习器预测的结果更准确,同时,集成学习器根据弱学习器的训练结果对弱学习器的输出结果进行权重赋值,进一步提高风险预测的准确性。在学习器训练之前,需要对每一条交易数据需增加一个风险等级标签,标签集包括风险提升、风险下降以及风险持平,如果该笔交易对应的风险评估值比前一笔交易的风险评估值有降低,则该笔交易增加“风险下降”标签,风险评估值为0-100的分值,需要专家或交易员根据交易数据对每笔交易进行打分。专家规则可根据不同维度的交易数据去判断交易的风险评估值。保证数据仓库中每一条交易数据包含但不限于以下字段:交易时间、交易金额、债券类型、发行时间、发行对象以及风险等级。利用已标注风险等级的历史交易数据对弱学习器和集成学习器进行有监督的训练,有监督训练,又称监督学习,是一个机器学习中的方法,可以由训练资料中学到或建立一个模式(函数/learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类),全面提升债券类投资交易风险预测模型的可靠性。训练单元5可以从预先下载好的数据库中获取历史交易数据,也可以用户在客户端设备上输入历史交易数据。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测装置,利用已知结果的历史数据对弱学习器和集成学习器进行有监督的训练,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,进一步提高了风险预测的可靠性。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测装置的一个实施例中,可以对弱学习器以及集成学习器再进行有监督的训练,参见图5,所述训练单元5包括:
弱学习器训练组件51:将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练。
可以理解的是,弱学习器训练组件51采用的是SVM算法,但不局限于SVM算法。弱学习器训练组件51由若干个弱学习器组成,其采用有监督的训练,将第一历史交易数据集抽样划分为K个训练子集,将K个训练子集一一对应作为K个弱学习器的输入,对弱学习器进行有监督的训练,弱学习器根据每条交易数据以及每条交易数据对应的风险等级进行学习,找到交易数据与风险等级之间的变化规律。抽样划分能够保证每个弱学习器获取的历史交易数据不同,使得弱学习器的学习效果更好,更全面,提高投资交易风险趋势预测装置预测的准确性。
弱学习器测试组件52:将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合。
可以理解的是,弱学习器测试组件52采用第二历史交易数据集作为预测集,弱学习器测试组件52由多个弱学习器组成。采用随机抽样的方式将第二历史交易数据集划分为K个测试子集,将K个测试子集输入至训练后的K个弱学习器中,对训练后的弱学习器进行测试,每组交易数据与弱学习器一一对应,K个弱学习器输出K个风险等级测试结果,所有风险等级测试结果构成风险等级测试结果集,第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合。例如,第二历史交易数据集包括A、B、C、D四组交易数据,将第二历史交易数据集随机抽样生成两个测试子集{A、D}、{B、C},A对应的风险等级为A′,B对应的风险等级为B′,C对应的风险等级为C′,D对应的风险等级为D′,则A′、B′、C′、D′构成原始风险等级集合{A′、B′、C′、D′},将{A、D}、{B、C}输入至两个弱学习器中,每个测试子集与弱学习器一一对应,第一弱学习器输出预测子集{A、D}应的风险等级{a、d},第二弱学习器输出预测子集{B、C}对应的风险等级{b、c},其中,{a、d}、{b、c}构成风险等级测试结果集{a、b、c、d},原始风险等级集合{A′、B′、C′、D′}和风险等级测试结果集{a、b、c、d}将作为集成学习器的输入。
集成学习器训练组件53:将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值。
可以理解的是,将原始风险等级集合与风险等级测试结果集输入至集成学习器训练组件53,对集成学习器进行训练,集成学习器根据每笔交易数据的原始风险等级和预测风险等级,对每个弱学习器的输出结果的权重进行赋值。例如,将原始风险等级集合{A′、B′、C′、D′}以及风险等级测试结果集{a、b、c、d}输入至集成学习器中,假设原始风险等级集合中A′=1,B′=2,C′=3,D′=4,风险等级测试结果集中a=2,b=2,c=1,d=5,集成学习器根据原始风险等级和测试风险等级,对每个弱学习器的输出结果的权重进行赋值,弱学习器的输出的测试风险等级越接近原始风险等级,则该弱学习器权重越高,第一弱学习器输出结果为{a,d},其中A的原始风险等级为1,测试风险等级为2,D的原始风险等级为4,测试风险等级为5,第一弱学习器输出结果为{b,c},其中,B的原始风险等级为2,测试风险等级为2,C的原始风险等级为3,测试风险等级为1,因此,第二弱学习器的输出结果更为准确,则将第一弱学习器的输出结果的权重设为0.3,将第二弱学习器的输出结果的权重设为1。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测装置,采用集成学习的思想,进一步对弱学习器的输出结果进行集成,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,提高投资风险预测的可靠性。
为了进一步提高用于债券投资风险预测的弱学习器和集成学习器的应用准确性,在本申请提供的一种基于集成学习的投资交易风险趋势预测装置的一个实施例中,提供一种投资交易风险趋势预测的优选方式,参见图4,所述投资交易风险趋势预测装置还包括:
历史数据预处理单元6:对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
可以理解的是,在获取历史交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,这需要对历史交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据,历史数据预处理单元6采用同类均值插补法进行缺失值补全,处理完的历史交易数据构成一个数据仓。历史数据预处理单元6采用随机抽样的方式,将数据仓库中的历史交易数据划分产生两个子集第一历史交易数据集和第二历史交易数据集。第一历史交易数据集将作为弱学习器的训练集,第二历史交易数据集将作为弱学习器的测试集和集成学习器的训练集。历史数据预处理单元6包括训练集生成组件61和预测集生成组件62,参见图6,两个组件均采用随机采样的方式生成子集,训练集生成组件输出的训练集用做弱学习器单元中的弱学习器的训练样本集,预测集生成组件的输出的预测集作为训练完成后的弱学习器的预测集和集成学习器的训练集。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险趋势预测装置,对交易数据进行预处理,并进行抽样拆分,能避免每个弱学习器的输入为同一交易数据,提高了弱学习器预测的准确性,同时将弱学习器的输出作为集成学习器的输入,能避免单个弱学习器因过拟合导致的预测准确性降低的问题,提高投资风险预测的可靠性。
下面结合图8,对本申请实施例提供的一种基于集成学习的投资交易风险趋势预测装置的训练单元5训练过程具体说明:
步骤S01:获取已标注历史风险等级标签的投资历史交易数据;
步骤S02:采用随机抽样的方式将投资历史交易数据划分为投资交易数据训练集和投资交易数据预测集,投资交易数据预测集中的所有交易数据的风险等级标签构成原始风险等级集合;
步骤S03:采用随机抽样的方式将投资交易数据训练集划分为n个投资交易数据训练子集;
步骤S04:将n个投资交易数据训练子集输入至n个弱学习器中,对弱学习器进行训练,投资交易数据训练子集与弱学习器一一对应;
步骤S05:采用随机抽样的方式将投资交易数据预测集划分为n个投资交易数据预测子集;
步骤S06:将n个投资交易数据预测子集输入至训练后的n个弱学习器中,弱学习器输出交易数据对应的预测风险等级,所有输出的预测风险等级构成风险等级预测结果集;
步骤S07:将原始风险等级集合和风险等级预测结果集输入至集成学习器中,集成学习器根据原始风险等级和预测风险等级,对弱学习器输出的结果的权重进行赋值。
从硬件层面来说,为了解决当前信用债投资交易风险评估模型依赖主观人为因素,预测结果可靠性低的问题,本申请提供一种基于集成学习的投资交易风险预测方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
图9为本申请实施例的电子设备9600的系统构成的示意框图。如图9所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图9是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在一实施例中,投资交易风险预测功能可以被集成到中央处理器中。其中,中央处理器可以被配置为进行如下控制:
步骤100:获取投资交易过程中的交易数据。
可以理解的是,信用债券亦称"无担保债券"。没有以指定的财产抵押为保障,完全以公司的良好信誉而发行的债券。信用债券持有者对发行人所有未用于其他债务进行抵押的资产具有一般债权人的求偿权。同时,信用债券持有者对那些已抵押资产超出其保障债券所需要的部分也有求偿权。与有担保债券相比,信用债券的持有人承担的风险较大,因而往往要求较高的利率。在预测债权类投资风险时,需要获取投资交易过程中的交易数据来进行预判,每条交易数据包括但不限于以下数据:交易时间、交易金额、债券类型、发行时间以及发行对象等。步骤100在交易数据获取后,还包括对交易数据进行预处理。在获取交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,这需要对交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据采用同类均值插补法进行缺失值补全,处理完的交易数据构成一个数据仓,用于对投资交易的风险进行预测。
步骤200:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合。
可以理解的是,债券投资的风险是指债券预期收益变动的可能性及变动幅度,债券投资的风险是普遍存在的。每条交易数据都对应一个风险等级,风险等级包括风险下降、风险上升以及风险持平。所述弱学习器具体为SVM学习器,SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。弱学习器从步骤100中获取到交易数据,弱学习器输出交易数据对应的预测风险等级。风险等级标签的建立目的为将原有对当前交易风险状态的预测改进为对风险变化趋势的预测。
步骤300:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到。
可以理解的是,集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。弱学习器输出的风险等级作为集成学习器的输入。在步骤100之前还包括对弱学习器和集成学习器进行训练,训练过程中集成学习器对每个弱学习器输出的风险等级的权重进行赋值,弱学习器的训练测试结果越准确,其结果的权重越高。集成学习器输出的风险预测结果为每个弱学习器输出的预测风险等级进行加权后的结果。例如,在学习器训练过程中,集成学习器给第一弱学习器的输出结果的权重赋值为0.5,给弱学习器的输出结果的权重赋值为1,在风险预测时,第一弱学习器的输出结果为A,第二弱学习器的输出结果为B,将A和B输入至集成学习器,集成学习器进行赋值并加权,其输出结果为0.5×A+1×B。
步骤400:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
可以理解的是,债券风险等级发生变化后,会对投资者的投资收益产生影响,带来意外的收益或承受更多的风险,因而投资者要密切注意影响债券风险等级评估的各种因素的变化,推测债券等级的变化方向,进而预测其价格变化并从中获利。根据集成学习器输出的结果,预判出债券风险趋势,为投资者提供投资参考,同时给出规避风险或是投资建议。投资者可在预测某债券风险趋势即将下降时,抢先买入债券,也可在推测某债券风险趋势即将下降时,抢先卖出手中持有的债券。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险预测方法,采用集成学习的思想,可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面集成学习器能够支持多种现有机器学习算法,可扩展性强。
在另一个实施方式中,投资交易风险预测装置可以与中央处理器9100分开配置,例如可以将投资交易风险预测装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现投资交易风险预测功能。
如图9所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图9中所示的所有部件;此外,电子设备9600还可以包括图9中没有示出的部件,可以参考现有技术。
如图9所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的投资交易风险预测方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的投资交易风险预测方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取投资交易过程中的交易数据。
可以理解的是,信用债券亦称"无担保债券"。没有以指定的财产抵押为保障,完全以公司的良好信誉而发行的债券。信用债券持有者对发行人所有未用于其他债务进行抵押的资产具有一般债权人的求偿权。同时,信用债券持有者对那些已抵押资产超出其保障债券所需要的部分也有求偿权。与有担保债券相比,信用债券的持有人承担的风险较大,因而往往要求较高的利率。在预测债权类投资风险时,需要获取投资交易过程中的交易数据来进行预判,每条交易数据包括但不限于以下数据:交易时间、交易金额、债券类型、发行时间以及发行对象等。步骤100在交易数据获取后,还包括对交易数据进行预处理。在获取交易数据的过程中,容易导致一些交易数据部分缺失或重复,或者获取到一些脏数据,这需要对交易数据进行预处理,删除一些重复的交易数据或者脏数据,对于部分缺失的交易数据采用同类均值插补法进行缺失值补全,处理完的交易数据构成一个数据仓,用于对投资交易的风险进行预测。
步骤200:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合。
可以理解的是,债券投资的风险是指债券预期收益变动的可能性及变动幅度,债券投资的风险是普遍存在的。每条交易数据都对应一个风险等级,风险等级包括风险下降、风险上升以及风险持平。所述弱学习器具体为SVM学习器,SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。弱学习器从步骤100中获取到交易数据,弱学习器输出交易数据对应的预测风险等级。风险等级标签的建立目的为将原有对当前交易风险状态的预测改进为对风险变化趋势的预测。
步骤300:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到。
可以理解的是,集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。弱学习器输出的风险等级作为集成学习器的输入。在步骤100之前还包括对弱学习器和集成学习器进行训练,训练过程中集成学习器对每个弱学习器输出的风险等级的权重进行赋值,弱学习器的训练测试结果越准确,其结果的权重越高。集成学习器输出的风险预测结果为每个弱学习器输出的预测风险等级进行加权后的结果。例如,在学习器训练过程中,集成学习器给第一弱学习器的输出结果的权重赋值为0.5,给弱学习器的输出结果的权重赋值为1,在风险预测时,第一弱学习器的输出结果为A,第二弱学习器的输出结果为B,将A和B输入至集成学习器,集成学习器进行赋值并加权,其输出结果为0.5×A+1×B。
步骤400:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作。
可以理解的是,债券风险等级发生变化后,会对投资者的投资收益产生影响,带来意外的收益或承受更多的风险,因而投资者要密切注意影响债券风险等级评估的各种因素的变化,推测债券等级的变化方向,进而预测其价格变化并从中获利。根据集成学习器输出的结果,预判出债券风险趋势,为投资者提供投资参考,同时给出规避风险或是投资建议。投资者可在预测某债券风险趋势即将下降时,抢先买入债券,也可在推测某债券风险趋势即将下降时,抢先卖出手中持有的债券。
从上述描述可知,本申请实施例提供的一种基于集成学习的投资交易风险预测方法,采用集成学习的思想,可应用于信用债投资交易风险多趋势预测,预测模型的建立无需依靠专家经验,避免了预测的主观性,将投资交易风险的预测模型建立在动态挖掘历史数据对当前的风险趋势的隐藏映射关系上,提高信用债投资交易风险的准确性,一方面能避免单个弱学习器因过拟合导致的预测准确性降低的问题,另一方面集成学习器能够支持多种现有机器学习算法,可扩展性强。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于集成学习的投资交易风险趋势预测方法,其特征在于,包括:
获取投资交易过程中的交易数据;
将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合;
将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到;
根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作;
所述投资交易风险趋势预测方法还包括:
利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器;
所述利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器,包括:
将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练;所述第一历史交易数据集作为弱学习器的训练集;
将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;所述第二历史交易数据集作为弱学习器的测试集和集成学习器的训练集;
将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值;
采用第二历史交易数据集作为预测集,随机抽样的方式将第二历史交易数据集划分为K个测试子集,将K个测试子集输入至训练后的K个弱学习器中,对训练后的弱学习器进行测试,每组交易数据与弱学习器一一对应,K个弱学习器输出K个风险等级测试结果,所有风险等级测试结果构成风险等级测试结果集,第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;
将原始风险等级集合与风险等级测试结果集输入至集成学习器,对集成学习器进行训练,集成学习器根据原始风险等级和测试风险等级,对每个弱学习器的输出结果的权重进行赋值,弱学习器的输出的测试风险等级越接近原始风险等级,则该弱学习器权重越高。
2.根据权利要求1所述的投资交易风险趋势预测方法,其特征在于,所述投资交易风险趋势预测方法还包括:
对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
3.一种基于集成学习的投资交易风险趋势预测装置,其特征在于,包括:
数据采集单元:获取投资交易过程中的交易数据;
弱学习器单元:将所述交易数据输入至多个弱学习器中,其中,所述弱学习器输出所述交易数据对应的风险等级,所有交易数据的风险等级构成一风险等级集合;
集成学习器单元:将所述风险等级集合输入至集成学习器中,其中,所述集成学习器输出综合风险等级,所述集成学习器用于对每个弱学习器输出的风险等级的权重进行赋值,所述综合风险等级为所述集成学习器对每个弱学习器输出的风险等级进行加权得到;
风险预测单元:根据所述综合风险等级预测出投资交易的风险趋势,以根据所述风险趋势执行对应的风险对抗操作;
所述投资交易风险趋势预测装置还包括:
训练单元:利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器;
所述训练单元包括:
弱学习器训练组件:将第一历史交易数据集输入至多个弱学习器中,对所述弱学习器进行训练;所述第一历史交易数据集作为弱学习器的训练集;
弱学习器测试组件:将第二历史交易数据集输入至训练后的多个弱学习器中,其中,所述弱学习器输出历史交易数据对应的风险等级测试结果,所有所述风险等级测试结果构成风险等级测试结果集,所述第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;所述第二历史交易数据集作为弱学习器的测试集和集成学习器的训练集;
集成学习器训练组件:将所述风险等级测试结果集以及所述原始风险等级集合输入至一集成学习器中,对所述集成学习器进行训练,其中,所述集成学习器对每个弱学习器的输出结果的权重进行赋值;
采用第二历史交易数据集作为预测集,随机抽样的方式将第二历史交易数据集划分为K个测试子集,将K个测试子集输入至训练后的K个弱学习器中,对训练后的弱学习器进行测试,每组交易数据与弱学习器一一对应,K个弱学习器输出K个风险等级测试结果,所有风险等级测试结果构成风险等级测试结果集,第二历史交易数据集中的所有交易数据的原始风险等级构成一原始风险等级集合;
将原始风险等级集合与风险等级测试结果集输入至集成学习器,对集成学习器进行训练,集成学习器根据原始风险等级和测试风险等级,对每个弱学习器的输出结果的权重进行赋值,弱学习器的输出的测试风险等级越接近原始风险等级,则该弱学习器权重越高。
4.根据权利要求3所述的投资交易风险趋势预测装置,其特征在于,所述投资交易风险趋势预测装置还包括:
数据预处理单元:对所述历史交易数据进行预处理;其中,利用已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器包括:利用预处理后的已标注风险等级的历史交易数据训练所述弱学习器以及所述集成学习器。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1或2所述的投资交易风险趋势预测方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1或2所述的投资交易风险趋势预测方法。
CN202110169175.5A 2021-02-07 2021-02-07 一种基于集成学习的投资交易风险趋势预测方法及装置 Active CN112767167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110169175.5A CN112767167B (zh) 2021-02-07 2021-02-07 一种基于集成学习的投资交易风险趋势预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110169175.5A CN112767167B (zh) 2021-02-07 2021-02-07 一种基于集成学习的投资交易风险趋势预测方法及装置

Publications (2)

Publication Number Publication Date
CN112767167A CN112767167A (zh) 2021-05-07
CN112767167B true CN112767167B (zh) 2024-04-19

Family

ID=75705273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110169175.5A Active CN112767167B (zh) 2021-02-07 2021-02-07 一种基于集成学习的投资交易风险趋势预测方法及装置

Country Status (1)

Country Link
CN (1) CN112767167B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516551A (zh) * 2021-05-26 2021-10-19 中国工商银行股份有限公司 信用债投资交易风险预测方法及装置
CN113792935B (zh) * 2021-09-27 2024-04-05 武汉众邦银行股份有限公司 小微企业信贷违约概率预测方法、装置、设备及存储介质
CN116681291B (zh) * 2023-08-02 2023-11-07 杭州小策科技有限公司 一种基于集成模型的风控预测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910071A (zh) * 2017-01-11 2017-06-30 中国建设银行股份有限公司 用户身份的验证方法及装置
CN109118095A (zh) * 2018-08-20 2019-01-01 深圳市中电数通智慧安全科技股份有限公司 基于机器学习的动态火灾风险评估方法、装置及服务器
CN109784779A (zh) * 2019-03-04 2019-05-21 广州杰赛科技股份有限公司 财务风险预测方法、装置及存储介质
CN109816245A (zh) * 2019-01-25 2019-05-28 北京海致星图科技有限公司 用于对公授信客户风险预警的风险传导评估系统及方法
CN109948932A (zh) * 2019-03-20 2019-06-28 杭州虹晟信息科技有限公司 基于大数据的风险监控分析系统
WO2020086334A1 (en) * 2018-10-26 2020-04-30 Microsoft Technology Licensing, Llc Machine learning system for taking control actions
CN111882426A (zh) * 2020-07-21 2020-11-03 中国工商银行股份有限公司 业务风险分类器训练方法、装置、设备及存储介质
CN111932267A (zh) * 2020-07-27 2020-11-13 中国工商银行股份有限公司 企业金融服务风险预测方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910071A (zh) * 2017-01-11 2017-06-30 中国建设银行股份有限公司 用户身份的验证方法及装置
CN109118095A (zh) * 2018-08-20 2019-01-01 深圳市中电数通智慧安全科技股份有限公司 基于机器学习的动态火灾风险评估方法、装置及服务器
WO2020086334A1 (en) * 2018-10-26 2020-04-30 Microsoft Technology Licensing, Llc Machine learning system for taking control actions
CN109816245A (zh) * 2019-01-25 2019-05-28 北京海致星图科技有限公司 用于对公授信客户风险预警的风险传导评估系统及方法
CN109784779A (zh) * 2019-03-04 2019-05-21 广州杰赛科技股份有限公司 财务风险预测方法、装置及存储介质
CN109948932A (zh) * 2019-03-20 2019-06-28 杭州虹晟信息科技有限公司 基于大数据的风险监控分析系统
CN111882426A (zh) * 2020-07-21 2020-11-03 中国工商银行股份有限公司 业务风险分类器训练方法、装置、设备及存储介质
CN111932267A (zh) * 2020-07-27 2020-11-13 中国工商银行股份有限公司 企业金融服务风险预测方法及装置

Also Published As

Publication number Publication date
CN112767167A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN112767167B (zh) 一种基于集成学习的投资交易风险趋势预测方法及装置
US20180330437A1 (en) System and method for online evaluation and underwriting of loan products
CN111080123A (zh) 用户风险评估方法及装置、电子设备、存储介质
CN111275546B (zh) 金融客户欺诈风险识别方法及装置
CN112785086A (zh) 信贷逾期风险预测方法及装置
US10529018B1 (en) Credit scoring and pre-approval engine integration
US20210312541A1 (en) Computer systems and methods for generating valuation data of a private company
CN111340616A (zh) 线上贷款的审批方法、装置、设备及介质
WO2019246291A1 (en) Method and device for cash advance recognition
CN111932267A (zh) 企业金融服务风险预测方法及装置
CN110992190A (zh) 基于用户画像的资产配置方法及装置
CN111736940A (zh) 智能柜台的业务界面展示方法及装置
CN114266664A (zh) 一种交易信息预测方法、装置、计算机设备和存储介质
JP6490271B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN111553685B (zh) 确定交易路由通道的方法、装置、电子设备和存储介质
CN109951859B (zh) 无线网络连接推荐方法、装置、电子设备及可读介质
CN111429282A (zh) 基于反洗钱模型迁移的交易反洗钱方法及装置
CN112163861B (zh) 交易风险要素特征提取方法及装置
CN113393320B (zh) 企业金融服务风险预测方法及装置
CN110795638A (zh) 用于输出信息的方法和装置
van der Schans et al. Time-dependent black–litterman
CN114971240A (zh) 一种阅读行为风险评估处理方法及装置
CN114240100A (zh) 贷款评估方法、装置、计算机设备和存储介质
CN113095203A (zh) 双录数据质检中的客户签名检测方法及装置
CN111932018B (zh) 银行业务绩效贡献信息预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant