基金估值数据的数据质量的确定方法、装置和服务器
技术领域
本说明书属于互联网技术领域,尤其涉及一种基金估值数据的数据质量的确定方法、装置和服务器。
背景技术
在金融投资领域,基金不同于股票,负责操作基金的公司或机构通常会每隔一段时间(例如每隔一周)才能统计并对外公布该段时间内所负责操作的基金的净值数据具体的变化情况。因此,用户往往是无法实时获取得到所购买或关注的基金的净值数据的。但是,为了能更好地进行投资决策,用户又需要及时地了解基金的净值数据的变化情况。
为了满足用户的上述需求,为用户的投资决策提供参考依据,通常第三方机构(例如某理财平台)会根据负责操作基金的公司或机构近期所公示的投资信息(例如基金所涉及的投资分布、重仓持股等),结合当前的股市大盘的行情变化情况,对该基金在每个时间点的净值数据进行预测,得到相应的基金估值数据,并提供给用户参考。用户可以根据上述基金的估值数据了解该基金当前变化情况,进而能够及时、准确地确定是否需要增加针对该基金的投资,或者是否需要减少针对该基金的投资等。
但是,不同的第三方机构由于所依据的数据源不同,或预测时所使用的算法(例如预测算法或模型)不相同等,所生成的基金估值数据也会存在差异。其中,有的第三方机构给出的基金估值数据可能与该基金真实的净值数据偏差较小,数据质量相对较高,对于用户的投资决策具有较高的参考价值。而有的第三方机构给出的基金估值数据可能与该基金真实的净值数据偏差较大,数据质量相对较差,可能会对用户的投资决策产生误导,甚至造成用户的投资损失。因此,亟需一种能够能高效、准确地确定出基金估值数据的数据质量,及时发现不准确的、偏差大的基金估值数据的方法。
发明内容
本说明书目的在于提供一种基金估值数据的数据质量的确定方法、装置和服务器,以高效、准确地确定出基金估值数据的数据质量,及时发现不准确的基金估值数据。
本说明书提供的一种基金估值数据的数据质量的确定方法、装置和服务器是这样实现的:
一种基金估值数据的数据质量的确定方法,包括:获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
一种数据质量的确定方法,包括:获取待测的数据,其中,所述待测的数据包含有多个节点的数据值的预测值;根据所述待测的数据,确定待测的数据的波动参数;确定所述待测的数据的类型特征;根据所述待测的数据的类型特征、波动参数和预设的规则集,确定所述待测的数据的数据质量是否符合预设的质量要求。
一种基金估值数据的数据质量的确定装置,包括:获取模块,用于获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;第一确定模块,用于根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;第二确定模块,用于确定所述待测的基金估值数据的类型特征;第三确定模块,用于根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
一种数据质量的确定装置,包括:获取模块,用于获取待测的数据,其中,所述待测的数据包含有多个节点的数据值的预测值;第一确定模块,用于根据所述待测的数据,确定待测的数据的波动参数;第二确定模块,用于确定所述待测的数据的类型特征;第三确定模块,用于根据所述待测的数据的类型特征、波动参数和预设的规则集,确定所述待测的数据的数据质量是否符合预设的质量要求。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
本说明书提供的一种基金估值数据的数据质量的确定方法、装置和服务器,由于通过先确定出待测的基金估值数据的类型特征,再利用预设的规则集,根据基金估值数据的类型特征,有针对性对待测的基金估值数据的波动参数进行判定,以确定出待测的基金估值数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题,达到能高效、准确地确定出基金估值数据的数据质量,及时发现不准确、偏差大的基金估值数据,减少在对基金估值数据的监控中的误差,降低了用户的投资风险。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是在一个场景示例中,应用本说明书实施例提供的基金估值数据的数据质量的确定方法对某理财平台提供的A基金的估值数据的数据质量进行监控的一种实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的基金估值数据的数据质量的确定方法对某理财平台提供的A基金的估值数据的数据质量进行监控的一种实施例的示意图;
图3是本说明书实施例提供的基金估值数据的数据质量的确定方法的流程的一种实施例的示意图;
图4是本说明书实施例提供的数据质量的确定方法的流程的一种实施例的示意图;
图5是本说明书实施例提供的服务器的结构的一种实施例的示意图;
图6是本说明书实施例提供的基金估值数据的数据质量的确定装置的结构的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
考虑到现有方法在对某基金估值数据的数据质量进行评价时,大多是将某个业内信任度较高的指定机构提供的相关基金估值数据作为参照标准,根据某基金估值数据与参照标准的差异情况来对某基金估值数据的数据质量进行判断。
但是,提供上述参照标准的指定机构也是第三机构,所提供的相关基金估值数据实际上也是针对基金净值数据的预测数据,本身就存在误差。此外,不同的第三方机构由于所基于的基金投资信息不同,或者所使用的预测算法不同,得到的基金估值数据存在差异也是正常的。因此,基于上述方法来对某基金估值数据的数据质量进行确定显然是不合理的,也容易出现误差。
针对上述情况,本说明书具体分析发现:针对同一类型的基金,由于配置方案和配置规则存在一定的共性,相应的基金估值数据的波动变化特征(包括短期的变化幅度和长期的变化趋势等)往往会也存在一些共有的规律。例如,对于债券型的基金估值数据出现拉直线(即连续多个时间点的基金净值的预测值几乎不变)是正常的。而对于股票型的基金估值数据或者指数型的基金估值数据出现上述拉直线则是不正常的,很有可能是估值预测过程中出现了异常,导致得到的基金估值数据的数据质量较差。又例如,对于分级型基金和非分级型基金这两种不同类型的基金,由于受不同的操作规则的约束,导致在正常情况下,分级型基金的估值数据一分钟内的涨跌值允许的波动幅度范围往往会大于非分级型基金的估值数据一分钟内的涨跌值允许的波动幅度范围等等。
正是注意到不同类型的基金的估值数据的波动变化特征存在上述规律特点,考虑可以根据某基金估值数据的本身的数据波动变化情况,结合长时间段训练得到的预设的规则集,区分不同类型特征的基金估值数据,有针对性地利用上述预设的规则集对某基金估值数据的波动参数进行评价,以确定该基金估值数据的数据质量。从而解决现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题。
本说明书实施方式提供的基金估值数据的数据质量的确定方法可以应用于包括监控服务器的监控系统中。具体的,所述监控服务器可以获取得到不同来源处(即不同第三方机构)提供的基金估值数据作为待测的基金估值数据,并按照以下程序对上述待测的基金估值数据的数据质量进行监控:根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在本实施方式中,所述监控服务器可以是一种应用于业务处理系统一侧,能够实现数据传输、数据处理等功能的后台业务服务器。具体的,所述监控服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施方式中,并不具体限定所述监控服务器所包含的服务器的数量。所述监控服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。对此,本说明书不作限定。
在一个场景示例中,可以参阅图1所示,网络业务平台A可以应用本说明书实施例提供的基金估值数据的数据质量的确定方法对第三方机构提供的基金估值数据进行监控。
在本场景示例中,上述网络业务平台A具体可以理解为一种基于网络的基金投资平台。在该平台上,会展示出各个基金的历史净值数据和相关的公示信息。同时,该平台还与多个第三方机构合作,在平台上展示出由第三方机构预测的各个基金的当前估值数据,以及历史估值数据。用户可以参考各个基金的当前估值数据,以及历史估值数据、历史净值数据、相关公示信息等,确定合适的投资策略,在该平台上进行相应的基金投资。
该平台为了避免某些第三方机构所提供的基金的估值数据与基金的净值数据偏差过大,数据质量较差,存在较为明显的数据错误,导致对用户产生误导,影响用户的投资决策,在该网络业务平台的数据处理系统中,还接入上述应用基金估值数据的数据质量的确定方法的监控系统。进而可以通过上述监控系统中的监控服务器对所接入的来源于第三方机构的资金估值数据的数据质量进行实时监控,以便及时地发现数据质量较差、可能与基金净值数据的偏差较大的基金估值数据,避免用户被这类基金估值数据所误导,降低平台用户的投资风险。
具体的,该平台的数据处理系统在接收并向用户展示第三方机构提供基金估值数据的同时,会将上述基金估值数据作为待测的基金估值数据输送至监控服务器,由监控服务器根据待测的基金估值数据的类型特征,结合待测的基金估值数据的短期的变化幅度和长期的变化趋势等波动变化特征,对待测的基金估值数据的数据质量进行评价确定。
下面以与该网络业务平台所接收到的由第三方机构Y机构提供的X基金估值数据为例,说明监控服务器如何确定待测的基金估值数据的数据质量。
监控服务器在通过网络业务平台A的数据处理系统获取得到了Y机构提供的X基金估值数据后,可以先根据X基金估值数据所对应的X基金的相关公示信息,确定该基金估值数据的类型特征。具体的,根据相关公示信息确定X基金的第一类型为股票型基金,确定X基金的第二类型为分级型基金;进而可以综合上述第一类型、第二类型,确定X基金估值数据的类型特征为:股票型分级基金。
同时,监控服务器可以根据X基金估值数据所包含的多个时间点的基金净值的预测值,分别计算各个时间点的基金净值的预测值与相邻的时间点的基金净值的预测值的差值,得到多个差值,再将上述多个差值中数值最大的差值作为X基金估值数据的波动参数。
其中,上述波动参数具体可以理解为一种描述X基金估值数据的短期变化幅度的参数数据。
在确定出X基金估值数据的类型特征和波动参数后,进一步,监控服务器可以从预先通过对大量历史基金估值数据、历史基金净值数据进行训练所建立的预设的规则集中筛选出与股票型分级基金这一类型特征对应的判定阈值作为匹配的判定阈值。
其中,上述预设的规则集具体可以理解为用于判断不同类型特征的待测的基金估值数据的数据质量的判定依据的集合。具体的,上述预设规则集中可以包含有针对不同类型特征的基金估值数据的判定阈值。其中,上述多个判定阈值中的各个判定阈值分别与一种类型特征对应。具体的,上述多个判定阈值中的各个判定阈值可以分别理解为用于判定针对各个类型特征的基金估值数据的短期变化特征是否正常,是否符合预设的质量要求的警戒阈值。如果一个基金估值数据的短期变化特征(例如波动参数)大于对应类型特征的判定阈值,则可认为该基金估值数据的短期变化幅度已经超过了该类型特征的基金估值数据的短期变化幅度的正常的数值范围。即,该基金估值数据的短期变化特征存在异常,因此,该基金估值数据的数据质量具有较大概率不符合预设的质量要求。
再将该匹配的判定阈值与X基金估值数据的波动参数进行比较。如果X基金估值数据的波动参数大于上述匹配的判定阈值,则判断X基金估值数据的短期变化幅度不符合该类型特征的基金估值数据的波动变化特征,进而可以确定Y机构提供的该X基金估值数据的数据质量不符合预设的质量要求,可能存在较大的偏差。
如果X基金估值数据的波动参数小于等于上述匹配的判定阈值,即X基金估值数据短期的变化幅度相对较小。又考虑到对于某一些类型特征的基金,如果基金估值数据长期几乎保持不变,例如,很长时间段都呈拉直线的状态,这时所得到基金估值数据可能也是不准确、存在异常的。
考虑到上述情况,在确定X基金估值数据的波动参数小于等于匹配的判定阈值,即确定X基金估值数据短期的变化幅度符合所对应类型特征的基金数据的短期变化特征后,进一步为了能够更加精确地X基金估值数据的数据质量进行确定,还可以再从另一个维度,例如,从基金数据相对较长期的变化趋势的角度,进一步对X基金估值数据的数据质量是否符合预设的质量要求进行判断确定。
具体的,监控服务器在确定X基金估值数据的波动参数小于等于匹配的判定阈值的情况下,进一步可以先从预设的规则集中调取预设的拉直线基金名单数据。上述预设的规则集中除了包含有多个判定阈值外,还可以包含有预设的拉直线基金名单数据。
其中,上述预设的拉直线基金名单数据具体可以理解为一种基金列表,该基金列表中包含有多个历史基金净值数据在某一预设时间段内出现过拉直线现象的基金的基金名称或基金编号等信息。其中,上述拉直线现象具体可以理解为在某一预设时间段内连续的多个时间点的基金的净值数据波动变化率相对较小,甚至几乎不变。
具体实施前,监控服务器可以预先通过对所获取的大量历史基金净值数据进行统计分析,确定出各个基金净值数据在某一个时间段内多个连续的多个时间点(例如连续3天)的净值数据的波动变化率(例如净值数据的增长率或降低率等);再根据上述波动变化率,从多个基金中选择出波动变化率相对较小(例如小于1%)的基金的基金名称或基金编号添加至基金列表中,以建立上述预设的拉直线基金名单数据。
在本场景示例中,监控服务器可以在所调取的预设的拉直线基金名单数据中进行检索,检索上述预设的拉直线基金名单数据中是否存在与X基金的相同的基金名称,如果在预设的拉直线名单数据中检索到了X基金,则判断X基金与预设的拉直线基金名单数据匹配。因此,即使X基金估值数据在连续多个时间点的波动变化较小,甚至几乎不变,参照该基金历史上的净值数据的变化情况,这也是合理的。这时可以确定基于X基金估值数据的较长期的变化趋势的角度,该基金估值数据也是可信的,即Y机构提供的X基金估值数据的数据质量是符合预设的质量要求的,具有较高的参考价值。
如果在预设的拉直线名单数据中没有检索到X基金,则判断X基金与预设的拉直线基金名单数据不匹配。这时,可以先对X基金估值数据具体的较长期的变化趋势进行分析,以准确地确定出X基金估值数据是否出现了拉直线现象。
具体的,可以先根据X基金估值数据所包含的多个时间点的基金净值的预测值,通过数据计算,确定出连续的预设个数个时间点(例如连续20个时间点)的基金净值的预测值的波动变化率;再将该预测值的波动变化率与预设的变化率阈值(例如1%)进行比较。如果该预测值的波动变化率小于等于上述预设的变化率阈值,则可以确定X基金估值数据确实出现了拉直线的现象。这时,可以根据X基金估值数据的类型特征,判断该基金估值数据出现拉直线的现象是否合理。例如,在本场景示例中,由于X基金数据的类型特征为股票型分级基金。而正常情况下,股票型基金的基金估值数据往往是不会出现拉直线的。因此,这时可以以股票型分级基金X基金估值数据出现了拉直线这一不合理的现象为依据,从较长期的变化趋势的角度上,确定Y机构所提供的X基金估值数据不合理,可能存在异常,即确定X估值基金数据的数据质量不符合预设的质量要求。
在确定出Y机构所提供的X基金估值数据的数据质量不符合预设的质量要求后,监控服务器可以向A网络业务平台的数据处理系统发送警示信息。A网络业务平台的数据处理系统根据上述警示信息可以确定出Y机构所提供的X基金估值数据的数据质量不符合预设的质量要求,可能存在数据异常,存在较高的风险与X基金真实的净值数据存在较大偏差。为了避免误导用户,导致用户的投资损失,A网络业务平台的数据处理系统可以撤销在该平台展示给用户的由Y机构提供的X基金估值数据,或者参阅图2所示,在该平台所展示给用户的由Y机构提供的X基金估值数据的界面上显示提示信息,以提示用户该估值数据存在较高的误差风险,请用户谨慎参考等。
如果该预测值的波动变化率大于上述预设的变化率阈值,则可以确定X基金估值数据实际上并没有出现了拉直线的现象。这时,可以判断X基金估值数据从较长期的变化趋势的角度来看,并没有出现异常。且该基金估值数据的波动参数也小于匹配的判定阈值,即从短期变化幅度的角度来看,也可没有出现异常。综合上述两个维度的判断结果,可以确定出上述Y机构提供的X基金估值数据是正常、准确度较高的,其数据质量是符合预设的质量要求的。
这时,监控服务器不会发送警示信息,A网络业务平台会正常向用户展示由Y机构提供的X基金估值数据。
按照上述方式,监控服务器可以对A网络业务平台所接入的不同第三方机构提供的不同基金估值数据的数据质量分别进行确定和监控,在发现数据质量不符合预设要求的基金估值数据时,及时地向A网络业务平台的数据处理系统发送警示信息。A网络业务平台的数据处理系统可以根据警示信息,及时地撤销平台所展示的对应的基金估值数据,或者及时提醒用户该基金估值数据存在较高风险,从而避免用户被数据质量相对较差的基金估值数据所误导,导致投资失误。
由上述场景示例可见,本说明书提供的基金数据的数据质量的确定方法,由于通过先确定出待测的基金估值数据的类型特征,再利用预设的规则集,根据基金估值数据的类型特征,有针对性对待测的基金估值数据的波动参数进行判定,以确定出待测的基金估值数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题,达到能高效地确定出基金估值数据的数据质量,及时发现不准确的基金估值数据,减少在对基金估值数据的监控中的误差,降低了用户的投资风险;还通过在确定待测的基金估值数据的波动参数小于等于所述匹配的判定阈值的情况下,利用预设的拉直线基金名单数据,从基金估值数据的变化趋势的角度对待测的基金估值数据的数据质量进行判断,提高了确定的基金估值数据的数据质量的准确度。
在另一个场景示例中,为了进一步提高所确定的基金估值数据的数据质量的准确度,避免错误地发出警示信息。又考虑到同一数据来源处(即同一个第三方机构)在预测不同的基金估值数据时所依据的数据源,以及所使用的预测算法往往也会具有一定共性的。具体的,表现为不同来源处的基金估值数据还具有不同的来源特征。
因此,对于较为信任的机构,例如Y机构,监控服务器在按照上述方式确定Y机构提供的X基金估值数据的波动参数大于所述匹配的判定阈值后,不会立即确定X基金估值数据的数据质量不符合预设的质量要求,直接进行警示。而是会接着对Y机构所提供的其他基金估值数据的波动参数和对应的匹配的判定阈值分别进行比较。再结合除X基金估值数据以外的其他基金估值数据的波动参数和对应的匹配的判定阈值的比较结果,来最终确定X基金估值数据的数据质量是否符合预设的质量要求。
具体的,例如,在确定X基金估值数据的波动参数大于所述匹配的判定阈值的情况下,监控服务器可以先确定该X基金估值数据的数据来源为Y机构。再调用预设的来源名单数据进行检索。
其中,上述预设的来源名单数据具体可以理解为一种指定来源处的列表。在该列表中包含多个关注的数据来源(例如A网路业务平台相对较信任的机构等)所对应的机构名称或机构编号。
如果监控服务器在预设的来源名单数据中检索到与Y机构相同的机构名称时,则可以判断X基金估值数据的数据来源Y机构与预设的来源名单数据匹配。因此,可以确定Y机构为A网络业务平台较为信任的机构。
通常这类机构所提高的基金估值数据的数据质量出现问题的几率往往会相对较小。因此,监控服务器在确定X基金估值数据的波动参数大于所述匹配的判定阈值后,不会立即判断X基金估值数据的数据质量较差,直接进行警示。而是会有针对性地调取A网络业务平台所接入的Y机构所提供的其他的基金估值数据:Q基金估值数据、W基金估值数据、E基金估值数据。并按照上述相同方式分别确定Q基金估值数据的波动参数是否大于对应的匹配的判定阈值,W基金估值数据的波动参数是否大于对应的匹配的判定阈值,E基金估值数据的波动参数是否大于匹配的判定阈值。其中,上述3个基金估值数据Q基金估值数据、W基金估值数据的波动参数都大于对应的匹配的判定阈值。因此,可以将上述Q基金估值数据、W基金估值数据分别确定为参考基金估值数据。
进一步,监控服务器统计与X基金估值数据同一数据来源的参考基金估值数据的数量为2。再检测上述参考基金估值数据的数量是否大于预设的数量阈值(例如1)。如果上述参考基金估值数据的数量大于预设的数量阈值,则可以认为即使Y机构为A网络业务平台较为信任的机构,但Y机构提供的X基金估值数据的数据质量仍有较大的概率存在异常,因而可以最终确定Y机构提供的该X基金估值数据的数据质量不符合预设的质量要求,并发送警示信息。
如果上述参考基金估值数据的数量小于等于预设的数量阈值,则可以认为Y机构提供的X基金估值数据的数据质量还是值得信赖的。这时可以不立即对Y机构提供的X基金估值数据进行警示,而对该X基金估值数据的数据质量进行确定监控。这样可以避免频繁、错误地发出警示信息,降低报警噪声。
由上述场景示例可见,本说明书提供的基金估值数据的数据质量的确定方法还通过确定待测的基金估值数据的数据来源,根据待测的基金估值数据的数据来源,有针对性地结合同一数据来源的多个基金估值数据,对待测的基金估值数据的数据质量进行确定,降低了报警噪声,进一步提高了确定基金估值数据的数据质量的准确度。
参阅图3所示,本说明书实施例提供了一种基金估值数据的数据质量的确定方法,其中,该方法具体应用于监控服务器一侧。具体实施时,该方法可以包括以下内容:
S31:获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值。
在本实施例中,上述待测的基金估值数据具体可以理解为由第三方机构(例如基金预测咨询公司或者某网络理财业务平台等)根据负责操作基金的公司或机构公示的投资信息(例如基金所涉及到的投资分布、重仓持股等),结合股市大盘的行情变化,对待测的基金在各个时间点的净值进行预测,得到的各个时间点的基金净值的预测值,所组成的估值数据。其中,上述待测的基金估值数据包括有该基金在多个时间点的净值的预测值。
在本实施例中,具体实施时,监控服务器可以通过爬虫爬取的方式获取第三方机构预测的待测的基金估值数据。当然,需要说明的是,上述所列举的爬虫爬取只是一种示意性说明。具体实施时,根据具体场景和处理要求,也可以采用其他合适的方式获取待测的基金估值数据。对此,本说明书不作限定。
S33:根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数。
在本实施例中,上述待测的基金估值数据的波动参数具体可以理解为一种能描述待测的基金估值数据短期变化幅度的参数数据。通过上述待测的基金估值数据的波动参数,可以从待测的基金估值数据的短期变化的维度(例如涨跌突变等)上,反映出待测基金估值数据的变化特征。
在本实施例中,上述根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数,具体实施时,可以包括以下内容:根据所述待测的基金估值数据,确定待测的基金估值数据所包含的多个时间点中各个时间点的基金净值的预测值;根据所述待测的基金估值数据所包含的多个时间点中各个时间点的基金净值的预测值,分别计算各个时间点与相邻的时间点的基金净值的预测值的差值,得到多个差值;从所述多个差值中筛选出数值最大的差值作为所述待测的基金估值数据的波动参数。
S35:确定所述待测的基金估值数据的类型特征。
在本实施例中,上述类型特征具体可以理解为根据所述待测的基金估值数据所对应的基金类型所确定的特征参数。需要说明的是,对于不同类型的基金,基金估值数据的波动变化特征往往不同;对同一中类型的基金,基金估值数据的波动变化特征往往会存在一定共性。因此,后续可以利用类型特征为依据,区分不同类型的待测的基金估值数据,有针对性地进行数据质量的判断,以提高判断的准确度。
在本实施例中,上述确定所述待测的基金估值数据的类型特征,具体实施时,可以包括以下内容:确定所述待测的基金估值数据所对应的基金的第一类型,其中,所述第一类型具体可以包括以下至少之一:债券型基金、股票型基金、指数型基金和混合型基金等;确定所述待测的基金估值数据所对应的基金的第二类型,其中,所述第二类型具体可以包括:分级型基金,或,非分级型基金等;根据所述待测的基金估值数据所对应的基金的第一类型、第二类型,确定所述待测的基金估值数据的类型特征。其中,上述所列举的第一类型、第二类型只是一种示意性说明。具体实施时,根据具体情况,上述第一类型、第二类型还可以包含有其他类型。对此,本说明书不作限定。
在本实施例中,需要说明地是,为了能够更加准确地判断待测的基金估值数据的数据质量,本例中将两种不同的分类方式结合,综合两种分类方式得到的分类结果,即第一类型和第二类型来最终确定待测的基金估值数据的类型特征。这样后续可以在一个更加精细的分类中,更加有针对性对待测的基金估值数据的数据质量进行判断。当然,需要说明的是,为了提高效率、减少数据处理量,在可容忍的误差范围内,也可以仅采用上述两种分类方式中的一种,得到的分类结果,来确定上述类型特征。例如,可以将待测的基金估值数据的第一类型作为上述待测的基金估值数据的类型特征。还可以采用除上述所列举的两种分类方式以外的分类方式进行分类,来确定上述类型特征。但要求所采用的分类方式得到类型特征与后续使用的预设的规则集对应。
S37:根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在本实施例中,上述预设的规则集具体可以理解为用于判断不同类型特征的待测的基金估值数据的数据质量的判定依据的集合。具体的,上述预设规则集中可以包含有针对不同类型特征的基金估值数据的判定阈值。其中,上述多个判定阈值中的各个判定阈值分别与一种类型特征对应。具体的,上述多个判定阈值中的各个判定阈值可以分别理解为用于判定针对各个类型特征的基金估值数据的短期变化特征是否正常,是否符合预设的质量要求的警戒阈值。如果一个基金估值数据的短期变化特征(例如波动参数)大于对应类型特征的判定阈值,则可认为该基金估值数据的短期变化幅度已经超过了该类型特征的基金估值数据的短期变化幅度的正常的数值范围。即,该基金估值数据的短期变化特征存在异常,因此,该基金估值数据的数据质量具有较大概率不符合预设的质量要求。
在本实施例中,上述多个判定阈值具体可以是事先获取对应多种类型特征的多个历史基金估值数据,并对不同类型特征的历史基金数据的短期变化特征分别进行统计、分析所确定得到的。
在本实施例中,待测的基金估值数据的数据质量符合预设的质量要求具体可以理解为待测的基金估值数据的数据质量相对较高,具有较大的概率准确度较好,与对应的基金净值数据的偏离程度较小,对用户的基金投资具有较高的参考价值。相反,待测的基金估值数据的数据质量不符合预设的质量要求具体可以理解为待测的基金估值数据的数据质量相对较低,具有较大的概率准确度较差,与对应的基金净值数据的偏离程度较大,对用户的基金投资可能会具有较大的误导性。
在本实施例中,上述根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求,具体实施时,可以包括以下内容:根据所述待测的基金估值数据的类型特征,从所述多个判定阈值中筛选出匹配的判定阈值;检测所述待测的基金估值数据的波动参数是否大于所述匹配的判定阈值;在确定所述待测的基金估值数据的波动参数大于所述匹配的判定阈值的情况下,确定所述待测的基金估值数据的数据质量不符合预设的质量要求。
在本实施例中,由于预设的规则集中所包含的多个判定阈值分别与一种类型特征对应,并分别携带有所对应的类型特征的标签。因此,具体实施时,监控服务器可以通过检索判定阈值所携带的标签,从多个判定阈值找到标签与待测的基金估值的数据的类型特征匹配的判定阈值,作为匹配的判定阈值。
在本实施例中,如果监控服务器通过检测,确定待测的基金估值数据的波动参数大于所述匹配的判定阈值时,可以判断待测的基金估值数据的短期变化特征已经超过该类型特征的基金估值数据的警戒阈值,即该基金估值数据的短期的变化幅度对于该类型特征的基金估值数据而言是不合理的,不符合正常情况,具有较大概率出现了异常。因此,可以判断该待测的基金估值数据的数据质量不符合预设的质量要求。
在本实施例中,相应的,如果监控服务器通过检侧,确定待测的基金估值数据的波动该参数小于等于所述匹配的判定阈值时,可以判断待测的基金估值数据的短期变化特征处于该类型特征的基金估值数据的正常数值范围内,即该基金估值数据的短期的变化幅度对于该类型特征的基金估值数据而言是合理的,符合正常情况。因此,可以判断该待测的基金估值数据的数据质量符合预设的质量要求。
在本实施例中,具体实施时,监控服务器在确定待测的基金估值数据的数据质量符合预设的质量要求后,不进行报警,可以对该基金估值数据的数据质量继续进行监控。例如,每隔一个时间周期再次按照上述方式确定待测的基金估值数据的数据质量是否符合预设的质量要求,从而可以进行长期的数据质量的监控,以便及时发现数据质量不符和预设质量要求的估值数据。
在本实施例中,具体实施时,监控服务器在确定待测的基金估值数据的数据质量不符合预设的质量要求后,可以及时地进行报警。例如,可以发送警示信息,提醒该待测的基金估值数据的数据质量不符合预设的质量要求,有相对较大的概率偏离了所对应的基金净值数据,存在较高风险。这时,展示该待测的基金估值数据的业务平台可以根据上述警示信息,撤销该基金估值数据的展示,避免对平台用户的误导。平台用户可以根据上述警示信息,在投资决策时,会更加谨慎地参考该基金估值数据,或者不参考该基金估值数据。提供该基金估值数据的第三方机构可以根据上述警示信息,对该基金估值数据预测过程中涉及到的数据源、预测算法等进行核验,以便及时发现导致异常的原因,并作相应的调整、修改,以提高所预测得到的基金估值数据的数据质量。
由上可见,本说明书实施例提供的基金估值数据的数据质量的确定方法,由于通过先确定出待测的基金估值数据的类型特征,再利用预设的规则集,根据基金估值数据的类型特征,有针对性对待测的基金估值数据的波动参数进行判定,以确定出待测的基金估值数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题,达到能高效地确定出基金估值数据的数据质量,及时发现不准确的基金估值数据,减少在对基金估值数据的监控中的误差,降低了用户的投资风险。
在一个实施例中,上述确定所述待测的基金估值数据的类型特征,具体可以包括以下内容:确定所述待测的基金估值数据所对应的基金的第一类型,其中,所述第一类型包括以下至少之一:债券型基金、股票型基金、指数型基金和混合型基金;确定所述待测的基金估值数据所对应的基金的第二类型,其中,所述第二类型包括:分级型基金,或,非分级型基金;根据所述待测的基金估值数据所对应的基金的第一类型、第二类型,确定所述待测的基金估值数据的类型特征。
在本实施例中,需要说明的是,上述所列举的第一类型、第二类型只是为了更好地说明本说明实施例。具体实施时,根据具体情况,可以采用其他合适的分类方式,包含其他相应的类型。对此,本说明书不作限定。
在本实施例中,所述预设的规则集具体可以包括:多个判定阈值,和/或,预设的拉直线基金名单数据等。需要说明的是,上述所列举的预设的规则集所包含的判定依据的具体内容只是一种示意性说明。具体实施时,根据具体场景和处理要求,上述规则集也还可以包含有其他类型的判定依据。对此,本说明书不作限定。
在本实施例中,上述预设的拉直线基金名单数据具体可以理解为一种基金列表,该基金列表中包含有多个历史基金净值数据在某一预设时间段内出现过拉直线现象的基金的基金名称或基金编号等身份信息。其中,上述拉直线现象(或状态)具体可以理解为在某一预设时间段内连续的多个时间点的基金的净值数据波动变化率相对较小,甚至几乎不变,即在一个较长期(相对于短期)的数据变化趋势相对较小。
在本实施例中,需要说明的是,对于不同类型的基金估值数据,对应的较长期的数据变化特征也是不相同;同一类型的基金估值数据,较长期的数据变化特征也会具有一定的共性。例如,对于债券型基金估值数据,出现拉直线现象是正常的,但对于股票型或指数型基金估值数据,出现拉直线的线下则是异常的。因此,具体实施时,还可以通过上述预设的拉直线基金名单数据分析待测的基金估值数据出现拉直线现象,即较长期的变化趋势相对较小是否正常,从而可以从基金估值数据较长期的变化特征的维度,来确定该待测的基金估值数据的数据质量是否符合预设的质量要求。
在本实施例中,上述预设的拉直线基金名单数据具体可以是事先获取大量历史基金净值数据,并对上述历史基金净值数据在某一预设时间段内整体波动变换率进行统计分析,从中筛选出波动变化率相对较小(例如小于预设的变化率阈值)的基金,根据所筛选出的基金的基金名称或基金编号等信息,建立得到的基金列表。
在一个实施例中,根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求,具体实施时,可以包括以下内容:根据所述待测的基金估值数据的类型特征,从所述多个判定阈值中筛选出匹配的判定阈值;检测所述待测的基金估值数据的波动参数是否大于所述匹配的判定阈值;在确定所述待测的基金估值数据的波动参数大于所述匹配的判定阈值的情况下,确定所述待测的基金估值数据的数据质量不符合预设的质量要求。
在本实施例中,通过确定待测的基金估值数据的波动参数是否大于上述匹配的判定阈值,可以从基金估值数据的短期变化特征的维度,来判断待测的基金估值数据的短期变化幅度在对应类型特征的基金估值数据中是否存在异常。如果待测的基金估值数据的波动参数大于上述匹配的判定阈值,则可以认为待测的基金估值数据的短期变化幅度在同一类型特征的基金估值数据中存在异常。进而可以判断,待测的基金估值数据具有较大概率不够准确、误差较大,偏离了基金净值数据。因此待测的基金估值数据的数据质量不符合预设的质量要求。
在一个实施例中,在确定待测的基金估值数据的短期变化特征不存在异常后,为了更加准确地确定待测的基金估值数据是否符合预设的质量要求。还可以从较长期的变化特征维度对待测的基金估值数据的较长期的变化趋势进行检测、判定。
在本实施例中,具体的,在检测所述待测的基金估值数据的波动参数是否大于所述匹配的判定阈值后,所述方法还可以包括以下内容:在确定所述待测的基金估值数据的波动参数小于等于所述匹配的判定阈值的情况下,检测所述待测的基金估值数据所对应的基金是否与所述预设的拉直线基金名单数据匹配;在确定所述待测的基金估值数据所对应的基金与所述预设的拉直线基金名单数据匹配的情况下,确定所述待测的基金估值数据的数据质量符合预设的质量要求。
在本实施例中,上述检测所述待测的基金估值数据所对应的基金是否与所述预设的拉直线基金名单数据匹配,具体实施时,可以包括:检测所述预设的拉直线基金名单数据中是否存在与待测的基金估值数据所对应的基金的基金名称或基金编号等身份信息相同的基金。
如果所述预设的拉直线基金名单数据中存在与待测的基金估值数据所对应的基金的基金名称或基金编号等身份信息相同的基金,则认为待测的基金估值数据所对应的基金与预设的拉直线基金名单数据匹配,即待测的基金估值数据所对应的基金位于预设的拉直线基金名单数据中。进而可以确定对于待测的基金估值数据而言,由于该基金净值数据历史上呈出现拉直线的现象,因此该基金估值数据即使较长期的变化趋势相对较小。例如,即使后来确定真出现了拉直线的现象也是合理、正常的。又由于之前已经确定该待测基金估值数据的短期变化特征,即波动参参数正常。所以在确定该待测基金估值数据所对应的基金与预设的拉直线基金名单数据匹配后,可以不用再对该基金估值数据的较长期变化特征进行确定和分析,可以判断该基金估值数据的数据质量符合预设的质量要求,提高了判定的效率。
如果所述预设的拉直线基金名单数据中不存在与待测的基金估值数据所对应的基金的基金名称或基金编号等身份信息相同的基金,则认为待测的基金估值数据所对应的基金与预设的拉直线基金名单数据不匹配,即待测的基金估值数据所对应的基金并不位于预设的拉直线基金名单数据中。进而可以确定对于待测的基金估值数据而言,由于该基金净值数据历史上没有呈出现过拉直线的现象。因此,该基金估值数据正常情况下较长期的变化趋势不应当过小,这时如果出现了拉直线的现象,显然是不正常的。所以后续可以进一步对该基金估值数据的较长期的变化特征(例如波动变化率等参数)进行具体计算,以确定待测的基金估值数据中是否真出现了拉直线的现象。
在一个实施例中,在检测所述待测的基金估值数据所对应的基金是否与所述预设的拉直线基金名单数据匹配后,所述方法具体实施时,还可以包括以下内容:在确定所述待测的基金估值数据所对应的基金未与所述预设的拉直线基金名单数据匹配的情况下,计算所述待测的基金估值数据所包含的多个时间点的基金净值的预测值中预设个数个时间点的基金净值的预测值的波动变化率;检测所述预测值的波动变化率是否小于等于预设的变化率阈值;在确定所述预测值的波动变化率小于等于预设的变化率阈值的情况下,根据所述待测的基金估值数据的类型特征,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在本实施例中,具体实施时,可以通过待测的基金估值数据中的连续的预设个数个(例如10个)时间点的基金净值的预测值作为一个时间段来反应较长期的变化趋势;进而可以根据上述连续的预设个数个时间点的基金净值的预测值来确定该时间段内的预测值的波动变化率(即该时间段所对应的预测值曲线的整体斜率)。
在本实施例中,上述预设的变化率阈值具体可以是用以判断待测的基金估值数据的较长期的变化趋势是否满足拉直线状态的参数数据。具体的,当波动变化率数值小于等于上述预设的变化率阈值时,可以认为待测的基金估值数据的较长期的变化趋势相对较小,进而可以判断该待测的基金估值数据出现了拉直线现象。相反,当波动变化率数值大于上述预设的变化率阈值时,可以认为待测的基金估值数据的较长期的变化趋势相对较大,进而可以判断该待测的基金估值数据没有出现拉直线现象。其中,上述预设的变化率阈值可以根据具体的精度要求设置。具体的,上述变化率阈值可以设置为1%。当然,上述所列举的变化率阈值只是一种示意性说明。本说明书对变化率阈值的具体数值不作限定。
在本实施例中,在确定所述预测值的波动变化率大于预设的变化率阈值时,可以判断待测的基金估值数据实际上并没有出现拉直线现象,即从较长期的变化特征的维度上来看,该待测的基金估值数据也是正常的。因此,可以确定该待测的基金估值数据的数据质量符合预设的质量要求。
在本实施例中,在确定所述预测值的波动变化率小于等于预设的变化率阈值时,可以判断待测的基金估值数据实际出现了拉直线现象。又考虑到,对于不同类型特征的基金估值数据,通常只有混合型或者债券型的基金估值数据出现拉直线是合理、正常的。因此,进一步可以根据待测的基金估值数据的类型特征,确定待测的基金估值数据所对应的基金的第一类型是否为债券型基金或者混合型基金。
如果根据上述类型特征,确定待测的基金估值数据所对应的基金的第一类型是债券型基金或者混合型基金,则可以认为该待测的基金估值数据出现拉直线现象是正常、合理的,因此,可以判断从较长期的变化特征维度上看,待测的基金估值数据的数据质量是符合预设的质量要求的。
如果根据上述类型特征,确定待测的基金估值数据所对应的基金的第一类型不是债券型基金或者混合型基金(例如是股票型或指数型基金),则可以认为该待测的基金估值数据出现拉直线现象是不正常、不合理的,因此,可以判断从较长期的变化特征维度上看,待测的基金估值数据的数据质量是不符合预设的质量要求的。
在一个实施例中,又考虑到不同第三机构(即对应不同基金估值数据的数据来源)所以依据的数据源、所使用的预测算法往往不同,导致不同来源处的待测的基金估值数据也会存在差异;对应的,同一来源处的不同基金估值数据也会存在一定的共性。在一些场景中,出于对来源处的信任,或者为了减少误报警,还可以引入并利用待测的基金估值数据的来源特征,对待测的基金估值数据的数据质量进行更加准确的判断。
在本实施例中,在确定所述待测的基金估值数据的波动参数大于所述匹配的判定阈值的情况下,可以不立即对该待测的基金估值数据的数据质量进行判定,而是获取并结合该待测的基金估值数据的来源特征,再对该待测的基金估值数据的数据质量是否符合预设的质量要求进行确定。具体实施时,可以包括以下内容:确定所述待测的基金估值数据的数据来源;检测所述待测的基金估值数据的数据来源是否与预设的来源名单数据匹配,其中,所述预设的来源名单数据中包含有多个关注的数据来源;在确定所述待测的基金估值数据的数据来源与预设的来源名单数据匹配的情况下,统计所述待测的基金估值数据的数据来源处的参考基金估值数据的数量,其中,所述参考基金估值数据为波动参数大于对应的匹配阈值的基金估值数据;检测所述参考基金估值数据的数量是否大于预设的数量阈值;在确定所述参考基金估值数据的数量大于所述预设的数量阈值的情况下,确定所述待测的基金估值数据的数据质量不符合预设的质量要求。
在本实施例中,上述关注的数据来源具体可以是相对较为信任的数据来源,例如业内认可度较高理财平台,或者由于长期合作较为信赖的基金估算机构等。当然,上述所列举的关注的数据来源只是一种示意性说明。具体实施时,还可以包含有其他情形的数据来源。对此,本说明书不作限定。
在本实施例中,上述预设的数量阈值具体可以根据具体情况和精度要求设置。例如,具体可以设置2,也可以设置为其他数值。对此,本说明书不作限定。
在本实施例中,在确定出待测的基金估值数据的波动参数大于匹配的判定阈值后,如果确定该待测的基金估值数的数据来源是预设的来源名单数据中关注的来源处,即较为信任的第三方机构,为了避免发生误报警,降低报警噪声,可以暂且不立即确定待测的基金估值数据的数据质量不符合预设的质量要求。而是先获取该来源处其他的基金估值数据,并对该来源处其他的基金估值数据的波动参数进行判定。
如果该来源处其他的基金估值数据的波动参数都小于等于对应的匹配的判定阈值,或者只有少量几个(即小于预设的数量阈值)基金估值数据的波动参数大于对应的匹配的判定阈值,则可以认为该来源处的基金估值数据出现异常的风险较低,可以选择信赖待测的基金估值数据的数据质量,不对该基金估值数据进行报警。
如果该来源处其他的基金估值数据的波动参数中有较多的(例如大于预设的数量阈值)波动参数大于对应的匹配的判定阈值,则可以认为该来源处的基金估值数据出现异常的风险较高,可以确定该待测的基金估值数据的数据质量不符合预设的质量要求,并对该待测的基金估值数据进行报警。
在一个实施例中,所述多个判定阈值具体实施时,可以按照以下方式获取:获取第一预设时间段内的多个基金估值数据,作为样本基金估值数据;分别确定所述样本基金估值数据中的基金估值数据的类型特征,并根据所述样本基金估值数据中的基金估值数据的类型特征,将所述样本基金估值数据划分为多个类型组;根据多个类型组中所包含的基金估值数据,分别确定多个类型组的变化特征数据,其中,所述变化特征数据具体可以包括以下至少之一:变化极值、变化均值和变化标准差等;根据所述多个类型组的变化特征数据,确定出多个判定阈值。
在本实施例中,上述第一预设时间段内的多个基金估值数据具体可以理解为历史上某个时间段的基金估值数据。
在本实施例中,上述所列举的多个变化特征数据只是为了更好地说明本说明书实施方式。具体实施时,根据具体场景和处理要求,还可以引入并使用其他形式的用于表征变化特征的参数数据。对此,本说明书不作限定。
在本实施例中,上述变化极值具体可以理解为基金估值数据中涨跌极值。具体的,上述变化极值可以包括:一分钟内的上涨极值,和/或,一分钟内的下跌极值等。
在本实施例中,上述根据所述多个类型组的变化特征数据,确定出多个判定阈值,具体实施时,可以按照以下方式对多个类型组中的各个类型组所对应的判定阈值进行确定:检测类型组的变化标准差是否大于预设的标准差阈值;在确定所述类型组的变化标准差大于所述预设的标准差阈值的情况下,将所述类型组的变化极值确定为对应所述类型组的判定阈值;在确定所述类型组的变化标准差小于等于预设的标准差阈值的情况下,根据所述变化均值和所述变化标准差,确定对应所述类型组的判定阈值。其中,上述对应所述类型组的判定阈值与一种类型特征对应。
在本实施例中,上述根据所述变化均值和所述变化标准差,确定对应所述类型组的判定阈值,具体实施时,可以包括:将所述变化均值与所述变化标准差相加得到的和作为对应所述类型组的判定阈值。
在本实施例中,进一步又考虑到所确定的判定阈值是反映对应类型特征的基金估值数据的短期变化幅度的参数。因此,可以优先从类型组所包含的多个基金估值数据中挑选变化较大的基金估值数据来确定对应的判定阈值。具体的,可以先确定类型组所包含的多个基金估值数据的波动变化率;再从多个基金估值数据中挑选出波动变化率大于预设的第二变化率阈值(例如10%)基金估值数据来确定对应的判定阈值。这样可以快速、准确地确定出具有较高代表性和覆盖性的判定阈值。
在一个实施例中,所述预设的拉直线基金名单数据具体可以按照以下方式获取:获取第二预设时间段内的多个基金净值数据,作为样本基金净值数据;分别确定所述样本基金净值数据中的基金净值数据在第二预设时间段内的净值波动变化率;从所述样本基金净值数据中筛选出净值波动变化率小于等于预设的变化率阈值的基金净值数据;根据所述净值波动变化率小于等于预设的变化率阈值的基金净值数据所对应的基金,建立所述预设的拉直线基金名单数据。
在本实施例中,上述第二预设时间段内的多个基金净值数据,具体可以理解为历史上某个时间段的基金净值数据。
在本实施例中,上述预设的变化率阈值具体可以设置为1%。当然,上述所列举的数值只是一种示意性说明。具体实施时,根据具体的精度要求可以灵活设置上述预设的变化率阈值。对此,本说明书不作限定。
在一个实施例中,在确定所述待测的基金估值数据的数据质量不符合预设的质量要求的情况下,具体实施时,还可以发出警示信息,进行报警,以便相关人员进行及时处理。
由上可见,本说明书实施例提供的基金估值数据的数据质量的确定方法,由于通过先确定出待测的基金估值数据的类型特征,再利用预设的规则集,根据基金估值数据的类型特征,有针对性对待测的基金估值数据的波动参数进行判定,以确定出待测的基金估值数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题,达到能高效地确定出基金估值数据的数据质量,及时发现不准确的基金估值数据,减少在对基金估值数据的监控中的误差,降低了用户的投资风险;还通过在确定待测的基金估值数据的波动参数小于等于所述匹配的判定阈值的情况下,利用预设的拉直线基金名单数据,从基金估值数据的变化趋势的角度对待测的基金估值数据的数据质量进行判断,提高了确定的基金估值数据的数据质量的准确度;还通过确定待测的基金估值数据的数据来源,根据待测的基金估值数据的数据来源,有针对性地结合同一数据来源的多个基金估值数据,对待测的基金估值数据的数据质量进行确定,降低了报警噪声,进一步提高了确定基金估值数据的数据质量的准确度。
参阅图4所示,本说明书实施例还提供了一种数据质量的确定方法。其中,该方法具体实施时,可以包括以下内容:
S41:获取待测的数据,其中,所述待测的数据包含有多个节点的数据值的预测值;
S43:根据所述待测的数据,确定待测的数据的波动参数;
S45:确定所述待测的数据的类型特征;
S47:根据所述待测的数据的类型特征、波动参数和预设的规则集,确定所述待测的数据的数据质量是否符合预设的质量要求。
在本实施例中,上述待测的数据具体可以待测的基金估值数据,也可以是待测的测量数据,还可以是待测的仿真结果数据等等。对于上述待测的数据的具体内容,本说明书不作限定。
在本实施例中,上述待测的数据的波动参数具体可以包括:待测的数据所包含的多个节点的数据值的预测值中相邻节点的数据值的预测值差值的最大值。
在本实施例中,上述预设的规则集具体可以包含有与类型特征相关的多种判定依据。例如,对应多种类型特征的多个判定阈值,或者对应多种类型特征的判定方式等等。
在本实施例中,上述根据所述待测的数据的类型特征、波动参数和预设的规则集,确定所述待测的数据的数据质量是否符合预设的质量要求,具体实施时,可以包括:根据待测的数据的类型特征,从预设的规则集中筛选出匹配的判定依据;并利用上述匹配的判定依据对波动参数进行判定,得到判定结果;再根据判定结果,确定所述待测的数据的数据质量是否符合预设的质量要求。
由上可见,本说明书实施例提供的数据质量的确定方法,由于通过先确定出待测的数据的类型特征,再利用预设的规则集,根据待测的数据的类型特征,有针对性对待测的数据的波动参数进行评价,以确定待测的数据的数据质量,从而解决了现有方法中存在的不能有效、准确地对数据质量进行确定和监控的技术问题。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
为了能够更加准确地完成上述指令,参阅图5所示,本说明书还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口501、处理器502以及存储器503,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口501,具体可以用于获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值。
所述处理器502,具体可以用于根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
所述存储器503,具体可以用于存储相应的指令程序。
在本实施方式中,所述网络通信端口501可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施方式中,所述处理器502可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施方式中,所述存储器503可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述基金估值数据的数据质量的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;确定所述待测的基金估值数据的类型特征;根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图6所示,在软件层面上,本说明书实施例还提供了一种基金估值数据的数据质量的确定装置,该装置具体可以包括以下的结构模块:
获取模块61,具体可以用于获取待测的基金估值数据,其中,所述待测的基金估值数据包含有多个时间点的基金净值的预测值;
第一确定模块62,具体可以用于根据所述待测的基金估值数据,确定待测的基金估值数据的波动参数;
第二确定模块63,具体可以用于确定所述待测的基金估值数据的类型特征;
第三确定模块64,具体可以用于根据所述待测的基金估值数据的类型特征、波动参数和预设的规则集,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在一个实施例中,所述第二确定模块63具体可以包括以下结构单元:
第一确定单元,具体可以用于确定所述待测的基金估值数据所对应的基金的第一类型,其中,所述第一类型具体可以包括以下至少之一:债券型基金、股票型基金、指数型基金和混合型基金等;
第二确定单元,具体可以用于确定所述待测的基金估值数据所对应的基金的第二类型,其中,所述第二类型具体可以包括:分级型基金,或,非分级型基金等;
第三确定单元,具体可以用于根据所述待测的基金估值数据所对应的基金的第一类型、第二类型,确定所述待测的基金估值数据的类型特征。
在一个实施例中,所述预设的规则集具体可以包括:多个判定阈值,和/或,预设的拉直线基金名单数据等。
在一个实施例中,所述第三确定模块64具体可以包括以下结构单元:
第一筛选单元,具体可以用于根据所述待测的基金估值数据的类型特征,从所述多个判定阈值中筛选出匹配的判定阈值;
第一检测单元,具体可以用于检测所述待测的基金估值数据的波动参数是否大于所述匹配的判定阈值;
第四确定单元,具体可以用于在确定所述待测的基金估值数据的波动参数大于所述匹配的判定阈值的情况下,确定所述待测的基金估值数据的数据质量不符合预设的质量要求。
在一个实施例中,所述第三确定模块64具体还可以包括:第二检测单元和第五确定单元,其中,在所述第一检测单元确定所述待测的基金估值数据的波动参数小于等于所述匹配的判定阈值的情况下,
所述第二检测单元,具体可以用于检测所述待测的基金估值数据所对应的基金是否与所述预设的拉直线基金名单数据匹配;
所述第五确单元,具体可以用于在确定所述待测的基金估值数据所对应的基金与所述预设的拉直线基金名单数据匹配的情况下,确定所述待测的基金估值数据的数据质量符合预设的质量要求。
在一个实施例中,所述第三确定模块64具体还可以包括:计算单元、第三检测单元、第六确定单元,其中,在所述第二检测单元确定所述待测的基金估值数据所对应的基金未与所述预设的拉直线基金名单数据匹配的情况下,
所述计算单元,具体可以用于计算所述待测的基金估值数据所包含的多个时间点的基金净值的预测值中预设个数个时间点的基金净值的预测值的波动变化率;
所述第三检测单元,具体可以用于检测所述预测值的波动变化率是否小于等于预设的变化率阈值;
所述第六确定单元,具体可以用于在确定所述预测值的波动变化率小于等于预设的变化率阈值的情况下,根据所述待测的基金估值数据的类型特征,确定所述待测的基金估值数据的数据质量是否符合预设的质量要求。
在一个实施例中,所述第三确定模块64具体还可以包括:第七确定单元、第四检测单元、第八确定单元、第五检测单元、第九确定单元,其中,在所述第一检测单元确定所述待测的基金估值数据的波动参数大于所述匹配的判定阈值的情况下,
所述第七确定单元,具体可以用于确定所述待测的基金估值数据的数据来源;
所述第四检测单元,具体可以用于检测所述待测的基金估值数据的数据来源是否与预设的来源名单数据匹配,其中,所述预设的来源名单数据中包含有多个关注的数据来源;
所述第八确定单元,具体可以用于在确定所述待测的基金估值数据的数据来源与预设的来源名单数据匹配的情况下,统计所述待测的基金估值数据的数据来源处的参考基金估值数据的数量,其中,所述参考基金估值数据为波动参数大于对应的匹配阈值的基金估值数据;
所述第五检测单元,具体可以用于检测所述参考基金估值数据的数量是否大于预设的数量阈值;
所述第九确定单元,具体可以用于在确定所述参考基金估值数据的数量大于所述预设的数量阈值的情况下,确定所述待测的基金估值数据的数据质量不符合预设的质量要求。
在一个实施例中,所述装置具体还可以包括第四确定模块,具体可以用于获取第一预设时间段内的多个基金估值数据,作为样本基金估值数据;分别确定所述样本基金估值数据中的基金估值数据的类型特征,并根据所述样本基金估值数据中的基金估值数据的类型特征,将所述样本基金估值数据划分为多个类型组;根据多个类型组中所包含的基金估值数据,分别确定多个类型组的变化特征数据,其中,所述变化特征数据具体可以包括以下至少之一:变化极值、变化均值和变化标准差;根据所述多个类型组的变化特征数据,确定出多个判定阈值等。
在一个实施例中,所述装置具体还可以包括第五确定模块,具体可以用于获取第二预设时间段内的多个基金净值数据,作为样本基金净值数据;分别确定所述样本基金净值数据中的基金净值数据在第二预设时间段内的净值波动变化率;从所述样本基金净值数据中筛选出净值波动变化率小于等于预设的变化率阈值的基金净值数据;根据所述净值波动变化率小于等于预设的变化率阈值的基金净值数据所对应的基金,建立所述预设的拉直线基金名单数据。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的基金估值数据的数据质量的确定装置,通过第二确定模块先确定出待测的基金估值数据的类型特征,再通过第三确定模块利用预设的规则集,根据基金估值数据的类型特征,有针对性对待测的基金估值数据的波动参数进行判定,以确定出待测的基金估值数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对基金估值数据的数据质量进行确定和监控的技术问题,达到能高效地确定出基金估值数据的数据质量,及时发现不准确的基金估值数据,减少在对基金估值数据的监控中的误差,降低了用户的投资风险。
在软件层面上,本说明书实施例还提供了一种数据质量的确定装置,该装置具体可以包括以下的结构模块:
获取模块,具体可以用于获取待测的数据,其中,所述待测的数据包含有多个节点的数据值的预测值;
第一确定模块,具体可以用于根据所述待测的数据,确定待测的数据的波动参数;
第二确定模块,具体可以用于确定所述待测的数据的类型特征;
第三确定模块,具体可以用于根据所述待测的数据的类型特征、波动参数和预设的规则集,确定所述待测的数据的数据质量是否符合预设的质量要求。
由上可见,本说明书实施例提供的数据质量的确定装置,通过第二确定模块先确定出待测的数据的类型特征,再通过第三确定模块利用预设的规则集,根据待测的数据的类型特征,有针对性对待测的数据的波动参数进行评价,以确定出待测的数据的数据质量是否符合预设的质量要求,从而解决了现有方法中存在的不能有效、准确地对待测的数据的数据质量进行确定和监控的技术问题。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。