CN109961368A - 基于机器学习的数据处理方法及装置 - Google Patents

基于机器学习的数据处理方法及装置 Download PDF

Info

Publication number
CN109961368A
CN109961368A CN201910205262.4A CN201910205262A CN109961368A CN 109961368 A CN109961368 A CN 109961368A CN 201910205262 A CN201910205262 A CN 201910205262A CN 109961368 A CN109961368 A CN 109961368A
Authority
CN
China
Prior art keywords
index
target
industry
issuing subject
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910205262.4A
Other languages
English (en)
Inventor
盖书文
戴伟
奚奇
杨晓晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN201910205262.4A priority Critical patent/CN109961368A/zh
Publication of CN109961368A publication Critical patent/CN109961368A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Abstract

本发明的实施例提供了一种基于机器学习的数据处理方法、装置、电子设备以及存储介质,属于计算机技术领域。该方法包括:利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。本发明实施例的技术方案利用机器学习模型,能够自动预测目标发债主体的基本面指标,提高了数据处理的效率和准确性。

Description

基于机器学习的数据处理方法及装置
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种基于机器学习的数据处理方法、基于机器学习的数据处理装置、电子设备以及计算机可读存储介质。
背景技术
在现有技术中,固定收益类资产(例如债券)的信用风险分析主要是通过人工来实现的,或者即使有一些软件系统可以提供债券投资分析,也还是不能满足用户需求。原因是现有的软件系统具有以下缺点:
第一,偏市场分析,缺乏企业信用债决策支持系统。目前国内信用债市场刚刚兴起,还处于探索阶段,固定收益类的投资分析管理系统较为匮乏。
第二,开发的决策支持软件系统的开发人员缺乏金融市场及投资业务的相关经历经验,开发出的科技产品与实际脱离较为严重,导致市场上大多数软件系统实用性差。
第三,底层数据库不够完善,其系统页面存在严重数据缺失情况,数据量难以满足业务和模型需求。正确的决策离不开关键信息的支持,因此,若无相当的数据量支持是无法做好决策支持系统的。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种基于机器学习的数据处理方法、基于机器学习的数据处理装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明实施例的第一方面,提供了一种基于机器学习的数据处理方法,包括:利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
根据本发明实施例的第二方面,提供一种基于机器学习的数据处理方法,包括:指标获取模块,配置为利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;指标生成模块,配置为根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;指标发送模块,配置为将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
根据本发明实施例的第三方面,提供一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述任意一项所述的基于机器学习的数据处理方法。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的基于机器学习的数据处理方法。
在本发明的一些实施例所提供的技术方案中,一方面,利用训练好的机器学习模型获取目标发债主体所属行业的目标行业指标和目标发债主体指标,并根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标,可以通过机器学习实现自动对固定收益类资产例如债券进行信用风险分析,将传统分析中大量人工整理、分析的工作进行系统化和智能化,提高了数据处理的效率和准确性,提升投研分析的能力,同时实现了从传统投研体系到智能投研体系的产业升级,节约了投研人员的分析时间,降低投研成本,能够帮助用户解决投研人员不足、投研能力较弱等问题;另一方面,通过将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端,还可以实现可视化,输出智能化的资产管理服务能力,帮助机构实现资产端和资金端的匹配,以辅助投资者作出投资决策,提前发现投资风险。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明的一些实施例的基于机器学习的数据处理方法的流程示意图;
图2示出了根据本发明的另一些实施例的基于机器学习的数据处理方法的流程示意图;
图3示出了根据本发明的一些实施例的行业重分类表的示意图;
图4示出了基于图1的步骤S110的在一些实施例中的流程示意图;
图5示出了基于图4的步骤S112的在一些实施例中的流程示意图;
图6示出了基于图4的步骤S115的在一些实施例中的流程示意图;
图7示出了根据本发明的一些实施例的基本面分析中行业量化分析的架构示意图;
图8示出了基于图1的步骤S110的在另一些实施例中的流程示意图;
图9示出了基于图8的步骤S117的在一些实施例中的流程示意图;
图10示出了根据本发明的一些实施例的基本面分析中财务量化分析的架构示意图;
图11示出了基于图8的步骤S118的在一些实施例中的流程示意图;
图12示出了根据本发明的一些实施例的基本面分析中舆情监控的架构示意图;
图13示出了基于图8的步骤S119的在一些实施例中的流程示意图;
图14示出了根据本发明的一些实施例的基本面分析中发债主体治理量化分析的架构示意图;
图15示出了根据本发明的又一些实施例的基于机器学习的数据处理方法的流程示意图;
图16示出了根据本发明的一些实施例的ABS分析的架构示意图;
图17示出了根据本发明的一些实施例的设置ABS项目的参数的界面示意图;
图18示出了根据本发明的一些实施例的计算交易结构评分的界面示意图;
图19示出了根据本发明的一些实施例的基于机器学习的数据处理方法的整体架构示意图;
图20示出了根据本发明的再一些实施例的基于机器学习的数据处理方法的流程示意图;
图21示出了根据本发明的一些示例性实施例的基于机器学习的数据处理装置的示意框图;
图22示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明的一些实施例的基于机器学习的数据处理方法的流程示意图。本发明实施例提供的方法可以由任意的具备计算处理能力的电子设备执行,例如用户终端和/或服务器端,本发明对此不作限定。在下面的举例说明中,以所述方法由服务器端执行为例。
如图1所示,本发明实施例提供的基于机器学习的数据处理方法可以包括以下步骤。
在步骤S110中,利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标。
需要说明的是,这里提及的机器学习模型可以包括下文中提到的基于机器学习的一个或者多个模型,并可以根据具体的需求选择合适的机器学习模型。
本发明实施例中,可以首先利用机器学习的分类模型对所有发债主体进行行业重分类,生成行业重分类表,在该表中列出了所有的行业以及分属于各个行业下的发债主体。根据该行业重分类表,在待分析的目标发债主体确定后,即可获知其所属的行业。
需要说明的是,本发明实施例中的发债主体是以发行债券的企业、公司、单位等为例进行举例说明的,但实际上,本发明实施例提供的方法可以应用于任意的固定收益资产。其中,所述固定收益资产是指投资于银行定期存款、协议存款、国债、金融债、企业债、可转换债券、债券型基金等固定收益类资产。
在步骤S120中,根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标。
本发明实施例中,可以根据目标发债主体的自身情况,例如自身的财务状况、股权结构和负面舆情(对应所述目标发债主体指标),和其所属行业的行业情况(对应所述目标行业指标),对所述目标发债主体进行基本面分析,获得所述目标发债主体的基本面指标(下面均以基本面评分为例进行举例说明)。
在步骤S130中,将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
本发明实施方式提供的基于机器学习的数据处理方法,一方面,利用训练好的机器学习模型获取目标发债主体所属行业的目标行业指标和目标发债主体指标,并根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标,可以通过机器学习实现自动对固定收益类资产例如债券进行信用风险分析,将传统分析中大量人工整理、分析的工作进行系统化和智能化,提高了数据处理的效率和准确性,提升投研分析的能力,同时实现了从传统投研体系到智能投研体系的产业升级,节约了投研人员的分析时间,降低投研成本,能够帮助用户解决投研人员不足、投研能力较弱等问题;另一方面,通过将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端,还可以实现可视化,输出智能化的资产管理服务能力,帮助机构实现资产端和资金端的匹配,以辅助投资者作出投资决策,提前发现投资风险。
图2示出了根据本发明的另一些实施例的基于机器学习的数据处理方法的流程示意图。当前公布的企业行业分类是很久之前的信息,由于目前企业经营范围的迭代更新很快,可能对企业行业分类不准,因此,会造成对目标发债主体所属行业的行业评分不准的问题。本发明实施例对发债主体所属行业进行了重分类。
如图2所示,本发明实施例提供的基于机器学习的数据处理方法与上述实施例的区别在于,还可以包括以下步骤。
在步骤S210中,获取所述目标发债主体的当前业务收入信息。
在步骤S220中,根据所述当前业务收入信息识别所述目标发债主体的主营业务信息。
本发明实施例中,可以自动从目标发债主体例如企业披露的当前业务收入信息(例如可以是最近几年或者几个月内的业务收入报表)中识别其当前的主营业务,从而可以对该目标发债主体属于哪一类行业进行重新定义。
在步骤S230中,将所述主营业务信息输入至训练完成的基于机器学习的分类模型中,预测所述目标发债主体所属行业。
本发明实施例设计了基于机器学习的分类模型,对所有发债主体进行行业重分类,可以准确的获得该目标发债主体所属行业,从而可以用于准确的分析该目标发债主体在其所属行业中的地位以及合理的排名打分信息,并可以用于下文中准确地确定各行业的行业特征。
本发明实施例中,所述基于机器学习的分类模型例如可以采用支持向量机、决策树、神经网络等任意一种或者多种机器学习算法实现。
具体的,这里以支持向量机为例进行举例说明。在进行机器学习之前可以预先给学习目标打好标签,即标签化,便于计算机识别。预先定义企业的主营业务与行业之间的联系。例如假设行业A的标签y=10000,而对应的主营业务可能有x=1(业务1)或2(业务2)等等,这是一组关系;同理,另外一个行业B的标签可能是y=20000,对应的主营业务则在之前基础上顺延x=3(业务3)或4(业务4)等等。预先训练一个关系y=f(x)。标签化之后,输入到支持向量机里面去训练模型,所谓训练模型就是在求解f(x)这个方程的参数。训练好了之后,导入目标发债主体的主营业务信息进入训练好的模型中,输出结果即可完成目标发债主体的分类。若将所有发债主体的主营业务信息分别输入至训练好的分类模型中,即可生成行业重分类表。
图3示出了根据本发明的一些实施例的行业重分类表的示意图。如图3所示,利用上述分类模型,可以实现对每一级分类都分别学习和重分类。
图4示出了基于图1的步骤S110的在一些实施例中的流程示意图。本发明实施例中,对于上述基本面评分中,可以包括对目标发债主体所属行业进行分析,获得目标发债主体的行业评分即所述目标行业指标。
如图4所述,在本发明实施例中,上述步骤S110还可以进一步包括以下步骤。
在步骤S111中,基于所属行业下的发债主体的债券数据,获得所属行业的目标行业利差数据。
本发明实施例中,可以通过以下公式计算行业利差:
行业利差=行业到期收益率-基准到期收益率 (1)
其中,上述公式(1)中,所述行业到期收益率等于该行业所有发债主体的存续债券到期收益率的中位数;所述基准到期收益率可以采用中债国开收益率曲线,但本发明并不限定于此。
需要说明的是,行业利差是根据所属行业下的所有发债主体的所有债券数据统计计算得到,是针对行业的。与所属行业下的所有发债主体有关,但对于同一行业而言,同一个行业下的所有发债主体的行业利差是相同的。
在步骤S112中,获得所属行业的目标行业特征数据。
本发明实施例中,可以确定所述目标发债主体所属行业的行业特征。
在步骤S113中,获得所属行业下市场占有率前预设数量的发债主体数据。
例如,所述预设数量可以为十,但本发明并不限定于此,可以根据需求设计合理的取值。在下面的实施例中,以确定所属行业的市场占有率占前十的发债主体为例进行说明。
在步骤S114中,基于所属行业下的发债主体的市场占有率,获得所属行业的目标行业分化度数据。
本发明实施例中,可以根据以下公式计算行业分化度:
行业分化度=
前20%发债主体的市场占有率/后80%发债主体的市场占有率(2)
例如,对于目标发债主体而言,其所属行业中市场占有率为前20%的发债主体的市场占有率之和与该行业中市场占有率为后80%的发债主体的市场占有率之和的比值,为目标行业分化度。但本发明并不限定于此,上述的20%和80%的划分仅仅是一个举例说明。
需要说明的是,同一个行业下可能存在多个发债主体,对于这多个发债主体而言,其行业分化度是相同的。行业分化度是根据该行业所有发债主体的市场占有率计算获得的。
例如,如果某个行业的前十大占据整个行业的市场占有率的90%,且前十大中的80%的市场占有率由前两家发债主体占有了,则计算出该行业的行业分化度较高。
在步骤S115中,获得所属行业的目标行业风险数据。
本发明实施例中,可以根据上述获得的目标行业分化度、以及采用下面实施例中的方法获得所属行业下的每个发债主体的财务评分以及所属行业下的每个发债主体的财务数据,计算获得目标发债主体的目标行业风险。
在步骤S116中,将所属行业的目标行业利差数据、目标行业特征数据、市场占有率前预设数量的发债主体数据、目标行业分化度数据和目标行业风险数据输入至训练完成的基于机器学习的行业量化模型中,输出所述目标行业指标。
本发明实施例中,可以根据上述获得的目标发债主体的目标行业利差、目标行业特征数据、目标行业分化度、行业前十大和目标行业风险,计算获得所述目标发债主体的行业评分即所述目标行业指标。
例如,可以通过以下公式计算行业评分:
z=c1*行业利差+c2*行业特征+c3%行业分化度+c4*行业前十大+c5*行业风险(3)
其中,上述公式(3)中,z是行业评分,c1-c5是权重系数。可以根据业务经验对过去几年各行业的行业评分进行预打分,再通过粒子群算法预先求解c1-c5五个权重系数,进而可以根据上述公式(3)得到目标行业指标。
图5示出了基于图4的步骤S112的在一些实施例中的流程示意图。本发明实施例中,在获取上述行业评分的过程中,可以进一步包括确定各个行业的行业特征。
如图5所述,在本发明实施例中,上述步骤S112还可以进一步包括以下步骤。
在步骤S1121中,获得各行业的财务指标数据。
在步骤S1122中,对比各行业的财务指标数据,获得所属行业的异常值。
在步骤S1123中,根据所属行业的异常值确定所属行业的目标行业特征数据。
第二步,,以及各个发债主体的行业特征值。例如假设京东是一个发债主体,其被划分至互联网行业,则预先确定互联网行业的各项行业特征,并确定京东在各项行业特征下的特征值。
本发明实施例中,各行业的行业特征的确定过程可以如下:预先获得各行业的财务指标数据;根据异常数据算法判断某一行业与其他行业的财务指标数据相比的异常或者特殊财务指标数据,进而将该异常或者特殊财务指标数据对应的指标作为该行业的行业特征。可以将该目标发债主体对应的行业特征与所属行业的行业特征作对比,分析该目标发债主体是否存在异常。
图6示出了基于图4的步骤S115的在一些实施例中的流程示意图。
如图6所述,在本发明实施例中,上述步骤S115还可以进一步包括以下步骤。
在步骤S1151中,获得所属行业下的发债主体的财务指标。
在步骤S1152中,获得所属行业下的发债主体的财务数据。
在步骤S1153中,将所属行业的目标行业分化度数据、发债主体的财务指标和财务数据输入至训练完成的基于机器学习的行业风险模型中,输出所述目标行业风险数据。下面结合图7对其进行说明。
图7示出了根据本发明的一些实施例的基本面分析中行业量化分析的架构示意图。
如图7所示,输入至行业利差模型的行业利差输入可以是各行业下的所有发债主体的债券数据,经过该行业利差模型输出行业利差。
本发明实施例中,输入至行业特征值模型的行业特征输入1是原始全量数据,包括该行业下所有发债主体的财务报表数据,输入至行业特征值模型的行业特征输入2是本发明实施例想要提取特征的目标财务指标,把一些具有显著经济意义的指标提取框定了范围,这样可以避免算法把一些杂乱的、却异常的指标囊括进结果中,其中,行业特征输入2可以是依赖财务和信用评价人员的专业化且丰富的业务经验通过财务科目筛选出来的,可以用于后续分析发债主体的财务指标是否异常。这里的行业特征可以是一个综合值。
具体地,行业特征是根据行业特征输入1和行业特征输入2来确定的:首先将所有发债主体进行行业重分类;然后根据各行业分类下的所有发债主体确定全部发债主体的财务指标值即行业特征输入2;再通过异常数据算法对比各个行业的财务指标值找到异常值,进而确定各个行业的行业特征。
需要说明的是,本发明实施例中的财务科目和财务数据基本是一个概念,财务数据包含财务科目的概念。
本发明实施例中,输入至行业分化度模型的行业分化度输入可以包括各行业下所有发债主体的企业名称、财报日期、行业分类和营业收入,行业分化度模型根据输入的数据可以计算出各行业下各发债主体的市场占有率,将各行业下的发债主体按照市场占有率从高到低进行降序排列,即可获得市场占有率前20%的发债主体和市场占有率后80%的发债主体,从而可以输出行业分化度。
本发明实施例中,输入至行业前十大模型的行业前十大输入可以包括各行业下的各发债主体的企业名称、财报日期、行业分类和营业收入以及各行业的周期性和轻重资产类型的描述,行业前十大模型根据输入的数据可以计算出各行业下各发债主体的市场占有率,将各行业下的发债主体按照市场占有率从高到低进行降序排列,即可输出各行业内市场占有率在前十大的企业或者发债主体。
本发明实施例中,输入至行业风险模型的行业风险输入1是行业分化度输出,行业风险输入2可以包括各行业下的所有发债主体的全量财务科目数据,行业风险输入3可以包括下面实施例的方法计算出的各行业下的所有发债主体的财务评分,该行业风险模型根据3个输入可以计算出各行业的经营性净资产回报率、长短期偿债能力和自由现金流,从而可以根据以下公式计算出行业风险:
行业风险=a1*行业经营+a2*行业财务状况 (4)
行业经营=zscore(行业分化度) (5)
行业财务状况=b1*行业经营性净资产回报率+b2*行业长短期偿债
能力+b3*行业自由现金流 (6)
上述公式中,a1和a2,b1至b3均为权重系数,可以在模型训练阶段通过预选打标签并基于算法训练估计获得。
本发明实施例中,行业量化模型基于行业重分类表、行业利差输出、行业特征输出、行业分化都输出、行业前十大输出和行业风险输出来输出目标发债主体所属行业的整体的行业评分。
图8示出了基于图1的步骤S110的在另一些实施例中的流程示意图。本发明实施例中,在上述基本面评分中,可以包括生成目标发债主体自身状况的目标发债主体指标。
如图8所述,在本发明实施例中,上述步骤S110还可以进一步包括以下步骤。
在步骤S117中,获得所述目标发债主体的财务指标(财务评分)。
在步骤S118中,获得所述目标发债主体的舆情指标。
在下面的举例说明中,以获得目标发债主体的负面舆情指标(负面舆情评分)为例进行举例说明,但本发明不限定于此。
在步骤S119中,获得所述目标发债主体的股权结构指标(股权结构评分)。
在步骤S1110中,根据所述目标发债主体的财务指标、舆情指标和股权结构指标获得所述目标发债主体指标。
图9示出了基于图8的步骤S117的在一些实施例中的流程示意图。本发明实施例中,可以对目标发债主体的财务状况进行分析,获得目标发债主体的财务评分。
如图9所述,在本发明实施例中,上述步骤S117还可以进一步包括以下步骤。
在步骤S1171中,将所述目标发债主体的财务数据输入至第一财务模型,输出第一衍生财务指标。
在步骤S1172中,将所述目标发债主体的财务数据、发行债券的时间与票面利率信息、授信信息、担保数据和所述第一衍生财务指标输入至第二财务模型,输出第二衍生财务指标。
在步骤S1173中,根据所述第二衍生财务指标获得所述目标发债主体在所属行业中的排名信息。
在步骤S1174中,根据所述排名信息计算所述目标发债主体的财务指标。
在示例性实施例中,所述第二衍生财务指标可以包括财报质量指标、偿债能力指标、运营效率指标、盈利能力指标和现金流状况指标等。下面结合图10对其进行说明。
图10示出了根据本发明的一些实施例的基本面分析中财务量化分析的架构示意图。
如图10所示,财务-函数1对应上述第一财务模型,财务-函数2对应上述第二财务模型,财务-函数3对应第三财务模型。首先将目标发债主体的财务数据作为函数1的输入,可以包括该目标发债主体的历史所有年报且是审核过的,其中包含时间信息,第一财务模型对历史数据进行清洗和整理,提取出真实有效的数据,利用财务-函数1可以计算出财务指标预测结果即第一衍生财务指标,作为函数2输入4。其中,财务-函数1是一组模型,内嵌了统计、回归等算法,可以基于过去的历史数据用回归算法得出一些提前预测的第一衍生财务指标,例如可以包括营业收入和管理费用等财务科目的预测。
然后将函数2输入4、函数2输入1、函数2输入2、函数2输入3和函数2输入5输入至第二财务模型,其中,函数2输入1可以包括目标发债主体的历史财务科目数据(可以包括该目标发债主体的历史所有年报),函数2输入2可以包括该目标发债主体历史发现债券的时间与票面利率,函数2输入3可以包括该目标发债主体的授信与授信使用情况(例如可以包括公司名称、公司编码、截止日期、授信额度合计、已使用额度和未使用额度等信息),函数2输入5可以包括该目标发债主体对外提供担保数据,这里利用财务-函数2可以计算输出指标(图中示出两个进行举例说明,但本发明并不限定于此)。其中,财务-函数2是根据财务科目之间的内在联系,构建了一些新的第二衍生财务指标并输出。所述第二衍生财务指标是指通过财务科目间的现实含义经过计算,得到具有新的现实含义的财务指标。例如,利息偿付能力=(货币资金*折扣率+交易性金融资产+持有至到期投资+应收账款-利息费用)/一年内应偿本金等等。
本发明实施例中,第二财务模型还可以根据第一财务模型的输出再加上该目标发债主体的关联信息(可以包括该目标发债主体历史公开的所有财务科目信息)等大量数据,可以计算出都有的创新指标结果。其中,创新指标是指当前市场上未被人使用的指标,是本发明实施例中根据财务科目与企业经营的客观联系,通过核算的方式构建的创新指标。这些指标能够不受企业财务造假的误导,进而还原企业的真实经营状况和信用风险。例如,根据丰富的审计经验设计了判断财务造假的指标,例如,收入规范度=(销售商品、提供劳务收到的现金+Δ应收账款+Δ应收票据-Δ预收账款)/(营业收入-1),若收入规范度<17%则判定是正常范围内的报表。
本发明实施例中,第三财务模型是一组数据处理模型,可以包括分类、分组、归一化和打分的过程,通过机器学习及量化算法,对函数2输出的指标进行分数化处理,可以对每个指标进行打分,并根据日期和行业进行分类统计,对这些指标进行分组,各个指标的权重可以通过机器学习模型训练的方式完成估算,最终输出该目标发债主体的财务评分。
本发明实施例中,可以估计出五个维度的得分,假设分别是score1至score5,对应财报质量、偿债能力、运营效率、盈利能力和现金流状况,总分q=a1*score1+a2*score2+a3*score3+a4*score4+a5*score5,首先业务人员对行业内熟悉企业的总分a进行打分,然后根据这些打分的企业,利用粒子群算法去学习和估计a1、a2、a3、a4和a5的值,进而得到最终的公式。
本发明实施例中,财务-函数3可以根据财务-函数2的输出结果对行业内的企业进行排序,然后根据排名进行打分,如排第m名的得分=(N-m)/N*100,其中,N和m均为大于等于1的正整数,N为行业内的发债主体数。
图11示出了基于图8的步骤S118的在一些实施例中的流程示意图。本发明实施例中,对目标发债主体的负面舆情进行分析,获得目标发债主体的负面舆情评分。
如图11所述,在本发明实施例中,上述步骤S118还可以进一步包括以下步骤。
在步骤S1181中,获取所述目标发债主体的公告文件信息和负面新闻信息。
在步骤S1182中,将所述目标发债主体的公告文件信息和负面新闻信息输入至训练完成的基于机器学习的负面舆情量化模型,输出所述目标发债主体的舆情指标。下面图12的举例说明中,以所述负面舆情量化模型采用朴素贝叶斯模型为例进行说明。
图12示出了根据本发明的一些实施例的基本面分析中舆情监控的架构示意图。
如图12所示,首先建立一个数据库,将正面和负面相关词汇放入数据库中的正、负两个语料库中,再使用分词、词性标注等方法训练朴素贝叶斯模型,然后将目标发债主体的公告文件和负面新闻文件导入至训练好的朴素贝叶斯模型中,对负面舆情进行打分,输出目标发债主体的负面舆情评分结果。
继续参考图12,还可以多维度统计负面舆情,例如从重要性、负面类型和时间序列等方面进行统计。其中,负面类型例如可以包括信用风险类、经营风险类和市场风险类等。
图13示出了基于图8的步骤S119的在一些实施例中的流程示意图。本发明实施例中,可以对目标发债主体的股权结构进行分析,获得目标发债主体的股权结构评分。
如图13所述,在本发明实施例中,上述步骤S119还可以进一步包括以下步骤。
在步骤S1191中,构建股权图谱,在所述股权图谱上的每一个节点代表一个发债主体,每一条边代表一个发债主体与其他关联发债主体之间的关系。
在步骤S1192中,根据所述股权图谱获得所述目标发债主体的股权结构信息。
在步骤S1193中,根据所述股权结构信息获得所述目标发债主体的股权结构指标。下面结合图14对其进行说明。
图14示出了根据本发明的一些实施例的基本面分析中发债主体治理量化分析的架构示意图。
如图14所示,股权图谱主要根据各发债主体的股权结构和彼此之间的关系,将大数据和机器学习相结合,即通过客观事物的联系以图的形式展示出来,能够帮助客户直观地看见主体之间的关系,并且利用该股权图谱可以得出该目标发债主体的股权结构评分。这里可以通过知识网络图谱技术构建股权图谱,在股权图谱上的每一个节点代表一个发债主体例如公司,该公司具有工商信息等属性;每一条边则是与其他关联公司的关系,边的属性则有对外投资、任职、股东等关系;通过设计算法,对每个发债主体的大量关系及属性数据进行数理统计计算,构建评价公式,完成权重估计即可。
这里的评价公式例如可以为控股股东/实际控制人股权集中度=控股股东/实际控制人(包括一致行动人)股权占比等等,判断逻辑:1>第一大股东持股比例越高证明对公司的支持程度越高;2>对于民企而言股权占比高实际控制人能做股权质押作为最后的融资手段。分别计算出母公司支持力度、母公司经营风险、公司经营质量、公司预期、公司经营风险、对外投资的质量、子公司的质量、对子公司的控制力和企业类型等方面的量化值(例如,从0到100),再通过专家打分的方式进行加权平均处理。
其中,公司股权量化模型的输入是股权图谱中所有的数据。算法可以以统计线性算法为主,权重估计方式可以通过人工打标签加智能算法训练估计的方式确定。
本发明实施例中,综合上述获得的目标发债主体的行业评分、财务评分、负面舆情评分和股权结构评分,可以获得目标发债主体的基本面评分。
具体的,可以是将目标发债主体的行业评分、财务评分、负面舆情评分和股权结构评分直接相加获得其基本面评分,也可以预先设置行业评分、财务评分、负面舆情评分和股权结构评分的权重,甚至可以根据行业的不同,设置不同的权重,最后进行加权求和获得目标发债主体的基本面评分。
利用本发明实施例提供的量化模型方法论回测结果精确,通过人工智能债券投资决策引擎在舆情、法律以及财务分析等层面可以提前发现问题企业,帮助投资者规避潜在风险。例如:XX环保的财报质量在同行业其中排名较低,在同行业61家企业中排名第51名。从偿债能力来看其资本结构劣于行业均值,融资能力波动巨大;从运营能力来看,其资金使用效率在2016-2017年急剧下降;同时,盈利能力及现金流分析指标也从2016年开始迅速恶化。从股权图谱查看关联方交易结果效果显著,XX环保自2014年就开始利用关联交易虚增收入利润。若使用本发明实施例提供的方法,投资者可以提前1-2年知悉发债主体偿债能力的变化,及早做出投资判断。
图15示出了根据本发明的又一些实施例的基于机器学习的数据处理方法的流程示意图。
如图15所示,本发明实施例提供的基于机器学习的数据处理方法与上述其他实施例相比,其不同之处在于,还可以包括以下步骤。
在步骤S1501中,若所述目标发债主体发行的债券采用ABS(Asset BackedSecuritization)融资方式,则对所述债券的底层资产产生的现金流进行分析,获得所述目标发债主体的分层指标。
其中,ABS融资方式是以项目所属的资产为支撑的证券化融资方式,即以项目所拥有的资产为基础,以项目资产可以带来的预期收益为保证,通过在资本市场发行债券来募集资金的一种项目融资方式。
若某项债券是ABS融资方式(可能存在部分债券是ABS融资方式,部分债券不是ABS融资方式,则对于非ABS融资方式的债券而言,可以没有图15实施例中的步骤),则对该项债券的发债主体进行ABS投资分析,即对该项债券的底层资产产生的现金流进行分析获得该项债券对应的发债主体的分层评分(分层指标),同时对交易结构进行量化获得交易结构评分和发债主体的基本面评分(基本面评分可以直接采用上述实施例的结果)。
其中,这里的底层资产是指被证券化的资产,如应收账款等;底层资产产生的现金流是指借款人在未来偿还借款产生的现金流。
在步骤S1502中,基于所述债券对应的ABS项目的交易结构,获得所述ABS项目的交易结构指标。
继续参考图15,所述方法还可以包括以下步骤。
在步骤S1503中,根据所述目标发债主体的基本面指标、所述分层指标和所述交易结构指标,判断所述目标发债主体发行的债券是否优质债券。
本发明实施例中,根据上述实施例提供的方法,可以获得所有发债主体的基本面评分、交易结构评分和分层评分,进而可以根据各个发债主体的基本面评分和交易结构评分、分层评分,得到各个发债主体的最终评分,对所有发债主体按照最终评分的高低进行降序排列,以供投资者从所有债券中筛选出排名靠前的一个或者多个拟投资的债券作为优质债券。
在步骤S1504中,将优质债券添加至备选池中。
在步骤S1505中,根据所述备选池中的优质债券构建投资组合。
在步骤S1506中,对所述投资组合进行模拟测试,获得模拟持仓结果。
在步骤S1507中,根据所述模拟持仓结果确定目标债券。
本发明实施例中,将筛选出来的优质债券加入到备选池中,再将备选池中的优质债券加入到投资组合中,对投资组合进行投前的模拟测试,计算投资组合的各种指标,根据模拟持仓的各项指标结果确定真实投资的目标债券。
图16示出了根据本发明的一些实施例的ABS分析的架构示意图。
如图16所示,为机器学习模型应用在ABS上的架构图,通过决策树等算法,结合全市场ABS数据,计算出对应的违约率等信息,再根据用户在界面中录入的数据,调用模型(这个模型由3个子模型组成,交易结构是一个统计模型,现金流模型是统计概率、机器学习模型和计算机仿真技术,基本面分析与上述BOND基本一致)得出交易结构、现金流的分层、基本面等评分。
这里的静态池现金流是指以每月或季度为单位记录的发债主体发放出去的一笔新增贷款,观察后续每一个月或季度该笔贷款的还款情况。例如,目标发债主体1月产生贷款,然后记录后续的2月、3月等不同月份的还款情况。
如图16所示,对底层资产设置现金流分析方案,对不同的现金流分析方案调用现金流模型进行计算,获得不同的现金流分析方案的现金流分析结果,将不同的现金流分析结果进行比对,选取投资人认可的那个现金流分析方案作为最终的现金流分析方案,然后根据确定的最终的现金流分析方案获得分层评分。
由于每个ABS的情况都不尽相同,因此可能存在多种投资分析方案。而分析方案是指对于一些参数的设定,比如费用率的设定、还款方式(有过手摊还、固定本金、到期换本等多种方式)的设定等。每一种方案对于基础资产现金流流入及流出兑付的影响都不同。
本发明实施例中,收集了公开市场上所有的ABS历史信用表现数据,作为因变量,并结合每一个ABS项目的基础资产特征作为输入变量,据此,构建了基于机器学习模型的ABS信用估计模型,用于估计新的ABS信用风险状况。信用风险状况就是指ABS底层资产的违约率、早偿率和回收率。这里计算出新的ABS信用风险状况,用在了分层评分的计算过程中,未来现金流的估计需要根据未来现金流流入减去违约率、早偿率带来的损失以及回收率带来的返还来确定最终的现金流流入计划。
其中,在预测底层资产的违约率方面,本发明实施例分别提供了统计概率模型和机器学习模型来供使用者计算ABS的违约率等信用指标;得到信用指标之后,还需要去模拟未来的现金流流入和兑付ABS证券本金和利息的过程,进而模拟出最终的现金流进和出的情况。
其中,现金流模型的输入是基础资产的违约率、早偿率、回收率、各档证券本金及利率、基础资产无风险情况下的现金流入情况、目标评级等。可计算出最终基础资产产生的收入对于各档证券本息的覆盖情况,一般而言,某档证券覆盖倍数大于1,则说明能够完成本息的兑付。覆盖倍数越大,评分越高。其中,基础资产的违约率、早偿率、回收率是ABS信用风险状况,违约率和早偿率计算方法相同,回收率是根据静态池逾期还款动态变化统计估计得到。各档证券是指ABS的分层。在ABS中,通常分为优先层,中间层和次级层,每一层面临的风险是不同的,因此需要分层评分,分层评分是指各档证券的评分。ABS产品的一般兑付顺序如下:兑付优先层利息、中间层利息、优先层本金、中间层本金、次级层本金。所有根据兑付顺序,优先层的风险天然小于中间层,而中间层的风险则小于次级。当基础资产产生一定损失的时候,先影响次级本金的兑付。基础资产通过目标评级的压力测试即可得到目标评级,例如该档证券在AAA下的现金流覆盖系数大于1,则该当证券获得AAA评级(AAA评级代表了一种极端情况下的违约率)。
其中,主体基本面分析,在选择行业和选择主体后,调用基本面量化模型输出基本面评分。若某一发债主体是系统中已有的发债主体,则直接从BOND分析库里提取数据用于此处。
需要说明的是,现金流的分层评分、交易结构评分和基本面评分之间的分析相对独立。其中现金流的分层评分是纯量化过程,交易结构评分是定性和定量相结合的评价过程。
图17示出了根据本发明的一些实施例的设置ABS项目的参数的界面示意图。
如图17所示,用户可以通过如图所示的界面,在界面中录入的数据。因为每一个ABS都是独立的、不同的,因此,需要根据用户自己的目标ABS,去完成ABS信用估计模型需要使用到的一些要素和参数。
图18示出了根据本发明的一些实施例的计算交易结构评分的界面示意图。
本发明实施例中,交易结构是ABS所特有的一种结构,该结构是由各种项目参与人,如有资质的券商、会计师事务所、信托、律师所事务所等机构构成,共同发挥作用,确保ABS资产剥离的合理性、合法性和有效性,保护投资人和发行人双方的利益。同时也对发行人的一些增信措施进行披露解读。因此,合法性和发行人增信措施的力度会显著影响投资人的风险。
本发明实施例中,交易结构量化模型是一个统计模型,交易结构的评价过程可以如下:根据发行说明书披露的信息勾选图18中的界面上有的项目,再点击“计算”按钮,根据项目进行加权平均打分即可得到交易结构评分。
图19示出了根据本发明的一些实施例的基于机器学习的数据处理方法的整体架构示意图。
如图19所示,本发明实施例提供的基于机器学习的数据处理方法可以从基本面(BOND)、资产证券化(ABS)、投资组合三个方面进行投资分析。其中,BOND分析主要是对发行债券的发债主体本身的财务状况、股权结构、负面舆情(股权结构和负面舆情包含在法律中的)以及所在行业这四个大板块进行量化分析,然后通过机器学习对每部分进行打分,最后得出一个总体分数,真实还原该发债主体的基本面情况。ABS分析主要是针对现金流进行分析,得出分层评分和覆盖率,对发债主体进行基本面打分(ABS对主体评分的逻辑与BOND基本一致,只是ABS除基本面分析外,还需要额外对底层资产产生的现金流进行分析)。投资组合分析主要是对投前、投中、投后进行分析。
图20示出了根据本发明的再一些实施例的基于机器学习的数据处理方法的流程示意图。
如图20所示,与上述其他实施例相比,本发明实施例提供的基于机器学习的数据处理方法的不同之处在于,还可以包括以下步骤。
在步骤S2001中,备选池筛选。
在步骤S2002中,加入投资组合。
在步骤S2003中,判断投资组合是否存在;若存在,则进入步骤S2004;若不存在,则跳转到步骤S2006。
在步骤S2004中,投资组合设置。
在步骤S2005中,模拟持仓测试。
在步骤S2006中,若不存在投资组合,则新建投资组合。
在步骤S2007中,对上述步骤S2006新建的投资组合进行投前收益测算。
在步骤S2008中,基于上述步骤S2004设置的投资组合和步骤S2005模拟持仓结果,进行真实持仓跟踪。
在步骤S2009中,报表展示。
本发明实施例中,先分析BOND和ABS,通过归一化评分的方式,得出各个行业的相对排名,从全市场债券和ABS中选择排名靠前的发债主体,筛选优质债券和ABS作为拟投资的债券和ABS加入到备选池中,进而可以规避投资风险。然后将备选池中的债券和ABS加入到投资组合中,投资组合的建立可以通过收益测算分别建立平层和结构化组合。一个投资组合在投资前,投资人可以根据情况设计平层和结构化的项目组合,平层即风险根据出资比例分摊;结构化则是存在优先和次级的结构,次级先承担风险,次级亏损完后再亏损优先级的本金。对于已经创建好的组合进行投前的模拟测试,这里可以是一些基本的债券指标计算,如久期、凸度和到期收益率等。结合数据算法计算组合的各种指标,根据模拟持仓的结果进行真实投资,即市场进行同步真实操作,出资金购买资产,然后利用BOND和ABS分析在后续的投资管理中持续跟踪表现,最后在报表中显示投资后的组合信息,有利于投资人提前发现风险时及时止损。
其中,可以从模拟持仓的结果中选择模拟测试的各项指标最好的债券进行真实购买。这里备选池充当了一个缓冲的作用,备选池中的债券都是被风险管理部门允许投资的债券,当投资经理需要寻找新债券投资的时候,可以迅速通过备选池择券进行投资操作。
本发明实施方式提供的基于机器学习的数据处理方法,通过集成计算机编程技术、数据库设计技术、统计算法和机器学习模型,构建了各种量化和分析模型,利用大量发债主体的历史经营数据,结合统计算法与机器学习模型构建了各种财务分析模型;基于发债主体间的大数据知识图谱,构建了能够识别发债主体关联风险的数学模型;并利用自然语言处理技术,对发债主体新闻舆情进行了分类建模,从而形成了一个庞大的债券投资决策支持系统,能够帮助投资人识别债券信用风险,提高投前与投后的管理效率,可以面向固定收益市场,为金融机构提供覆盖交易前、中、后全流程投资、信用分析及组合管理系统解决方案,帮助机构投资者更好地评估主体投资价值和资产池标的质量,提供风险预警服务,助力投资效率提升。
此外,在本发明的实施例中,还提供了一种基于机器学习的数据处理装置。参照图21所示,该基于机器学习的数据处理装置2100可以包括:指标获取模块2110、指标生成模块2120以及指标发送模块2130。
其中,指标获取模块2110可以配置为利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标。指标生成模块2120可以配置为根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标。指标发送模块2130可以配置为将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
在示例性实施例中,基于机器学习的数据处理装置2100还可以包括:业务获取模块,可以配置为获取所述目标发债主体的当前业务收入信息;业务识别模块,可以配置为根据所述当前业务收入信息识别所述目标发债主体的主营业务信息;行业预测模块,可以配置为将所述主营业务信息输入至训练完成的基于机器学习的分类模型中,预测所述目标发债主体所属行业。
在示例性实施例中,指标获取模块2110可以包括:利差获得单元,可以配置为基于所属行业下的发债主体的债券数据,获得所属行业的目标行业利差数据;特征获得单元,可以配置为获得所属行业的目标行业特征数据;主体获得单元,可以配置为获得所属行业下市场占有率前预设数量的发债主体数据;分化获得单元,可以配置为基于所属行业下的发债主体的市场占有率,获得所属行业的目标行业分化度数据;风险获得单元,可以配置为获得所属行业的目标行业风险数据;行业评分单元,可以配置为将所属行业的目标行业利差数据、目标行业特征数据、市场占有率前预设数量的发债主体数据、目标行业分化度数据和目标行业风险数据输入至训练完成的基于机器学习的行业量化模型中,输出所述目标行业指标。
在示例性实施例中,所述特征获得单元可以包括:行业财务子单元,可以配置为获得各行业的财务指标数据;异常获得子单元,可以配置为对比各行业的财务指标数据,获得所属行业的异常值;特征确定子单元,可以配置为根据所属行业的异常值确定所属行业的目标行业特征数据。
在示例性实施例中,所述风险获得单元可以包括:主体财务指标子单元,可以配置为获得所属行业下的发债主体的财务指标;主体财务数据子单元,可以配置为获得所属行业下的发债主体的财务数据;行业风险输出子单元,可以配置为将所属行业的目标行业分化度数据、发债主体的财务指标和财务数据输入至训练完成的基于机器学习的行业风险模型中,输出所述目标行业风险数据。
在示例性实施例中,指标获取模块2110可以包括:目标财务指标单元,可以配置为获得所述目标发债主体的财务指标;目标舆情指标单元,可以配置为获得所述目标发债主体的舆情指标;股权结构指标单元,可以配置为获得所述目标发债主体的股权结构指标;主体指标获得单元,可以配置为根据所述目标发债主体的财务指标、舆情指标和股权结构指标获得所述目标发债主体指标。
在示例性实施例中,所述目标财务指标单元可以包括:第一衍生财务指标输出子单元,可以配置为将所述目标发债主体的财务数据输入至第一财务模型,输出第一衍生财务指标;第二衍生财务指标输出子单元,可以配置为将所述目标发债主体的财务数据、发行债券的时间与票面利率信息、授信信息、担保数据和所述第一衍生财务指标输入至第二财务模型,输出第二衍生财务指标;主体排名信息获得子单元,可以配置为根据所述第二衍生财务指标获得所述目标发债主体在所属行业中的排名信息;目标财务指标计算子单元,可以配置为根据所述排名信息计算所述目标发债主体的财务指标。
在示例性实施例中,所述第二衍生财务指标可以包括财报质量指标、偿债能力指标、运营效率指标、盈利能力指标和现金流状况指标等。
在示例性实施例中,所述目标舆情指标单元可以包括:舆情信息获取子单元,可以配置为获取所述目标发债主体的公告文件信息和负面新闻信息;舆情指标输出子单元,可以配置为将所述目标发债主体的公告文件信息和负面新闻信息输入至训练完成的基于机器学习的负面舆情量化模型,输出所述目标发债主体的舆情指标。
在示例性实施例中,所述股权结构指标单元可以包括:股权图谱构建子单元,可以配置为构建股权图谱,在所述股权图谱上的每一个节点代表一个发债主体,每一条边代表一个发债主体与其他关联发债主体之间的关系;股权结构获得子单元,可以配置为根据所述股权图谱获得所述目标发债主体的股权结构信息;股权结构指标子单元,可以配置为根据所述股权结构信息获得所述目标发债主体的股权结构指标。
在示例性实施例中,基于机器学习的数据处理装置2100还可以包括:分层指标获得模块,可以配置为若所述目标发债主体发行的债券采用ABS融资方式,则对所述债券的底层资产产生的现金流进行分析,获得所述目标发债主体的分层指标;交易结构指标获得模块,可以配置为基于所述债券对应的ABS项目的交易结构,获得所述ABS项目的交易结构指标。
在示例性实施例中,基于机器学习的数据处理装置2100还可以包括:债券判断模块,可以配置为根据所述目标发债主体的基本面指标、所述分层指标和所述交易结构指标,判断所述目标发债主体发行的债券是否优质债券;债券选择模块,可以配置为将优质债券添加至备选池中;投资构建模块,可以配置为根据所述备选池中的优质债券构建投资组合;模拟测试模块,可以配置为对所述投资组合进行模拟测试,获得模拟持仓结果;债券确定模块,可以配置为根据所述模拟持仓结果确定目标债券。
由于本发明的示例实施例的基于机器学习的数据处理装置2100的各个功能模块与上述基于机器学习的数据处理方法的示例实施例的步骤对应,因此在此不再赘述。
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
下面参考图22,其示出了适于用来实现本发明实施例的电子设备的计算机系统2200的结构示意图。图22示出的电子设备的计算机系统2200仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图22所示,计算机系统2200包括中央处理单元(CPU)2201,其可以根据存储在只读存储器(ROM)2202中的程序或者从存储部分2208加载到随机访问存储器(RAM)2203中的程序而执行各种适当的动作和处理。在RAM 2203中,还存储有系统操作所需的各种程序和数据。CPU 2201、ROM 2202以及RAM 2203通过总线2204彼此相连。输入/输出(I/O)接口2205也连接至总线2204。
以下部件连接至I/O接口2205:包括键盘、鼠标等的输入部分2206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分2207;包括硬盘等的存储部分2208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分2209。通信部分2209经由诸如因特网的网络执行通信处理。驱动器2210也根据需要连接至I/O接口2205。可拆卸介质2211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器2210上,以便于从其上读出的计算机程序根据需要被安装入存储部分2208。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分2209从网络上被下载和安装,和/或从可拆卸介质2211被安装。在该计算机程序被中央处理单元(CPU)2201执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块和/或单元和/或子单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的模块和/或单元和/或子单元也可以设置在处理器中。其中,这些模块和/或单元和/或子单元的名称在某种情况下并不构成对该模块和/或单元和/或子单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的基于机器学习的数据处理方法。
例如,所述电子设备可以实现如图1中所示的:步骤S110,利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;步骤S120,根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;步骤S130,将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备或装置的若干模块或者单元或者子单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元或者子单元的特征和功能可以在一个模块或者单元或者子单元中具体化。反之,上文描述的一个模块或者单元或者子单元的特征和功能可以进一步划分为由多个模块或者单元或者子单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (15)

1.一种基于机器学习的数据处理方法,其特征在于,包括:
利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;
根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;
将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取所述目标发债主体的当前业务收入信息;
根据所述当前业务收入信息识别所述目标发债主体的主营业务信息;
将所述主营业务信息输入至训练完成的基于机器学习的分类模型中,预测所述目标发债主体所属行业。
3.根据权利要求1所述的方法,其特征在于,获取目标发债主体所属行业的目标行业指标,包括:
基于所属行业下的发债主体的债券数据,获得所属行业的目标行业利差数据;
获得所属行业的目标行业特征数据;
获得所属行业下市场占有率前预设数量的发债主体数据;
基于所属行业下的发债主体的市场占有率,获得所属行业的目标行业分化度数据;
获得所属行业的目标行业风险数据;
将所属行业的目标行业利差数据、目标行业特征数据、市场占有率前预设数量的发债主体数据、目标行业分化度数据和目标行业风险数据输入至训练完成的基于机器学习的行业量化模型中,输出所述目标行业指标。
4.根据权利要求3所述的方法,其特征在于,获得所属行业的目标行业特征数据,包括:
获得各行业的财务指标数据;
对比各行业的财务指标数据,获得所属行业的异常值;
根据所属行业的异常值确定所属行业的目标行业特征数据。
5.根据权利要求3所述的方法,其特征在于,获得所属行业的目标行业风险数据,包括:
获得所属行业下的发债主体的财务指标;
获得所属行业下的发债主体的财务数据;
将所属行业的目标行业分化度数据、发债主体的财务指标和财务数据输入至训练完成的基于机器学习的行业风险模型中,输出所述目标行业风险数据。
6.根据权利要求1所述的方法,其特征在于,获取目标发债主体指标,包括:
获得所述目标发债主体的财务指标;
获得所述目标发债主体的舆情指标;
获得所述目标发债主体的股权结构指标;
根据所述目标发债主体的财务指标、舆情指标和股权结构指标获得所述目标发债主体指标。
7.根据权利要求6所述的方法,其特征在于,获得所述目标发债主体的财务指标,包括:
将所述目标发债主体的财务数据输入至第一财务模型,输出第一衍生财务指标;
将所述目标发债主体的财务数据、发行债券的时间与票面利率信息、授信信息、担保数据和所述第一衍生财务指标输入至第二财务模型,输出第二衍生财务指标;
根据所述第二衍生财务指标获得所述目标发债主体在所属行业中的排名信息;
根据所述排名信息计算所述目标发债主体的财务指标。
8.根据权利要求7所述的方法,其特征在于,所述第二衍生财务指标包括财报质量指标、偿债能力指标、运营效率指标、盈利能力指标和现金流状况指标。
9.根据权利要求6所述的方法,其特征在于,获得所述目标发债主体的舆情指标,包括:
获取所述目标发债主体的公告文件信息和负面新闻信息;
将所述目标发债主体的公告文件信息和负面新闻信息输入至训练完成的基于机器学习的负面舆情量化模型,输出所述目标发债主体的舆情指标。
10.根据权利要求6所述的方法,其特征在于,获得所述目标发债主体的股权结构指标,包括:
构建股权图谱,在所述股权图谱上的每一个节点代表一个发债主体,每一条边代表一个发债主体与其他关联发债主体之间的关系;
根据所述股权图谱获得所述目标发债主体的股权结构信息;
根据所述股权结构信息获得所述目标发债主体的股权结构指标。
11.根据权利要求1所述的方法,其特征在于,还包括:
若所述目标发债主体发行的债券采用ABS融资方式,则对所述债券的底层资产产生的现金流进行分析,获得所述目标发债主体的分层指标;
基于所述债券对应的ABS项目的交易结构,获得所述ABS项目的交易结构指标。
12.根据权利要求11所述的方法,其特征在于,还包括:
根据所述目标发债主体的基本面指标、所述分层指标和所述交易结构指标,判断所述目标发债主体发行的债券是否优质债券;
将优质债券添加至备选池中;
根据所述备选池中的优质债券构建投资组合;
对所述投资组合进行模拟测试,获得模拟持仓结果;
根据所述模拟持仓结果确定目标债券。
13.一种基于机器学习的数据处理装置,其特征在于,包括:
指标获取模块,配置为利用训练完成的机器学习模型,获取目标发债主体所属行业的目标行业指标和目标发债主体指标;
指标生成模块,配置为根据所述目标行业指标和所述目标发债主体指标生成所述目标发债主体的基本面指标;
指标发送模块,配置为将所述基本面指标发送至客户端,以使所述基本面指标显示于所述客户端。
14.一种电子设备,其特征在于,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至12中任一项所述的基于机器学习的数据处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的基于机器学习的数据处理方法。
CN201910205262.4A 2019-03-18 2019-03-18 基于机器学习的数据处理方法及装置 Pending CN109961368A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910205262.4A CN109961368A (zh) 2019-03-18 2019-03-18 基于机器学习的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910205262.4A CN109961368A (zh) 2019-03-18 2019-03-18 基于机器学习的数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN109961368A true CN109961368A (zh) 2019-07-02

Family

ID=67024355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910205262.4A Pending CN109961368A (zh) 2019-03-18 2019-03-18 基于机器学习的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN109961368A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532269A (zh) * 2019-08-30 2019-12-03 深圳市原点参数科技有限公司 一种基于机器学习财务报表跨国会计准则转换方法
CN110910241A (zh) * 2019-11-28 2020-03-24 中国建设银行股份有限公司 现金流评估方法、装置、服务器设备及存储介质
CN111105311A (zh) * 2019-12-19 2020-05-05 第一创业证券股份有限公司 债券主体的动态信用评级方法及装置
CN111383312A (zh) * 2020-03-20 2020-07-07 厦门渊亭信息科技有限公司 一种基于粒子系统的大规模知识图谱可视化方法及装置
CN111709825A (zh) * 2020-06-10 2020-09-25 中国工商银行股份有限公司 异常产品识别方法及系统
CN111966905A (zh) * 2020-08-19 2020-11-20 中航信托股份有限公司 一种项目预警方法及装置
CN112766788A (zh) * 2021-01-29 2021-05-07 北京明略软件系统有限公司 高新技术企业评价方法、系统、计算机设备及存储介质
CN112949910A (zh) * 2021-02-05 2021-06-11 中国建设银行股份有限公司 一种自下而上的企业资产质量变化观测方法和装置
CN113362115A (zh) * 2021-06-29 2021-09-07 平安资产管理有限责任公司 基于机器学习的交易资源分析方法、装置、设备和介质
CN113392185A (zh) * 2021-06-10 2021-09-14 中国联合网络通信集团有限公司 舆情预警方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120316916A1 (en) * 2009-12-01 2012-12-13 Andrews Sarah L Methods and systems for generating corporate green score using social media sourced data and sentiment analysis
CN105719073A (zh) * 2016-01-18 2016-06-29 苏州汇誉通数据科技有限公司 一种企业信用评价系统及方法
CN107527124A (zh) * 2017-10-13 2017-12-29 众安信息技术服务有限公司 生成行业基本面组合预测模型的方法和装置
CN109388712A (zh) * 2018-09-21 2019-02-26 平安科技(深圳)有限公司 一种基于机器学习的行业分类方法及终端设备
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120316916A1 (en) * 2009-12-01 2012-12-13 Andrews Sarah L Methods and systems for generating corporate green score using social media sourced data and sentiment analysis
CN105719073A (zh) * 2016-01-18 2016-06-29 苏州汇誉通数据科技有限公司 一种企业信用评价系统及方法
CN107527124A (zh) * 2017-10-13 2017-12-29 众安信息技术服务有限公司 生成行业基本面组合预测模型的方法和装置
CN109388712A (zh) * 2018-09-21 2019-02-26 平安科技(深圳)有限公司 一种基于机器学习的行业分类方法及终端设备
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532269A (zh) * 2019-08-30 2019-12-03 深圳市原点参数科技有限公司 一种基于机器学习财务报表跨国会计准则转换方法
CN110532269B (zh) * 2019-08-30 2023-06-09 深圳市原点参数信息技术有限公司 一种基于机器学习财务报表跨国会计准则转换方法
CN110910241B (zh) * 2019-11-28 2023-01-17 中国建设银行股份有限公司 现金流评估方法、装置、服务器设备及存储介质
CN110910241A (zh) * 2019-11-28 2020-03-24 中国建设银行股份有限公司 现金流评估方法、装置、服务器设备及存储介质
CN111105311A (zh) * 2019-12-19 2020-05-05 第一创业证券股份有限公司 债券主体的动态信用评级方法及装置
CN111383312A (zh) * 2020-03-20 2020-07-07 厦门渊亭信息科技有限公司 一种基于粒子系统的大规模知识图谱可视化方法及装置
CN111383312B (zh) * 2020-03-20 2023-03-31 厦门渊亭信息科技有限公司 一种基于粒子系统的大规模知识图谱可视化方法
CN111709825A (zh) * 2020-06-10 2020-09-25 中国工商银行股份有限公司 异常产品识别方法及系统
CN111709825B (zh) * 2020-06-10 2023-09-08 中国工商银行股份有限公司 异常产品识别方法及系统
CN111966905A (zh) * 2020-08-19 2020-11-20 中航信托股份有限公司 一种项目预警方法及装置
CN112766788A (zh) * 2021-01-29 2021-05-07 北京明略软件系统有限公司 高新技术企业评价方法、系统、计算机设备及存储介质
CN112949910A (zh) * 2021-02-05 2021-06-11 中国建设银行股份有限公司 一种自下而上的企业资产质量变化观测方法和装置
CN113392185A (zh) * 2021-06-10 2021-09-14 中国联合网络通信集团有限公司 舆情预警方法、装置、设备及存储介质
CN113392185B (zh) * 2021-06-10 2023-06-23 中国联合网络通信集团有限公司 舆情预警方法、装置、设备及存储介质
CN113362115A (zh) * 2021-06-29 2021-09-07 平安资产管理有限责任公司 基于机器学习的交易资源分析方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN109961368A (zh) 基于机器学习的数据处理方法及装置
KR100766149B1 (ko) 컴퓨터로 구현되는 자산 샘플링 방법, 시스템 및 컴퓨터
US20040015376A1 (en) Method and system to value projects taking into account political risks
US8355974B2 (en) Account level liquidity charge determination
KR100746107B1 (ko) 자산 포트폴리오의 기술 속성 상관 방법, 상관 시스템 및 상관 컴퓨터
KR20010102452A (ko) 가치를 찾고 위험을 줄이기 위한 방법 및 시스템
Da Silva et al. Selecting audit samples using Benford's Law
KR20200111518A (ko) 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템
CN106339940A (zh) 一种对财务采集值进行检验并计算信贷额度的方法
CN112700149A (zh) 一种投资组合风险评估系统、方法及计算机设备
US20110125623A1 (en) Account level cost of funds determination
Alrjoub et al. The Impact Of Financial Performance On Earnings Management Practice Behavior (An Empirical Study on Financial Companies in Jordan)
Usurelu et al. Challenges and controversies related to IFRS 15 implementation
Mazzocchetti et al. Systemic financial risk indicators and securitised assets: an agent-based framework
Feltenstein et al. “The Impact of Micro-simulation and CGE modeling on Tax Reform and Tax Advice in Developing Countries”: A Survey of Alternative Approaches and an Application to Pakistan
JP2003233703A (ja) 経営指標処理システム
KR20200111064A (ko) 기업의 채무상환능력 평가시스템
Ortolano et al. Green bonds capital returns: the impact of market and macroeconomic variables
US8595114B2 (en) Account level interchange effectiveness determination
Dai et al. Evaluation Method of Customs' Price Evaluation Risks in China's Coastal Special Economic Zones
Guerra et al. Value creation and investment projects: An application of fuzzy sensitivity analysis to project financing transactions
CN115221212A (zh) 基金投资数据管理系统及方法
Niknya et al. Financial distress prediction of Tehran Stock Exchange companies using support vector machine
Feltenstein et al. Modeling tax reform in developing countries
CN111899112A (zh) 一种不动产信托项目管理方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190702