分摊数据检测方法以及装置
技术领域
本说明书涉及数据处理技术领域,特别涉及一种分摊数据检测方法。本说明书同时涉及一种分摊数据检测装置,一种电子设备,以及一种计算机可读存储介质。
背景技术
随着互联网保险业务的发展,市面上推出了相互制类型的保险项目,在此保险模式中,参保人达到此保险模式规定的准入条件后即可加入到此保险业务中,所述保险模式的参保人在保险业务期间患病或发生意外将获得理赔,理赔款由其他参保人分摊,通过保险公司进行扣款或由除获得理赔外的其他参保人进行缴费。此保险由于具有缴费金额低,受众规模大,相对更公平公正等优点,广受用户青睐。
现有技术中,在相互制类型的保险项目中,发生互助案件的情况下,需要统计项目周期内参与保险项目的总人数,以及项目周期内总互助案件的总申领金额,计算总人数与总申领金额二者的比值确定每名项目成员的分摊金额。
然而,由于相互制类型的保险项目的项目成员是实时增加的,在保险项目运行的过程中,会有新的用户参与,使得项目周期内的项目成员数量增加,在计算项目周期内每名项目成员的分摊金额时可能出现错误,在发生计算出现错误的情况下,没有参考的分摊金额区间与分摊金额进行对比,可能导致出现扣错分摊金额的事件发生。
发明内容
有鉴于此,本说明书实施例提供了一种分摊数据检测方法。本说明书同时涉及一种分摊数据检测装置,一种电子设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种分摊数据检测方法,包括:
获取互助项目在多个历史项目周期内的项目数据;
对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;
将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;
根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;
若是,根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
可选的,所述对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组,包括:
对所述多个历史项目周期的项目数据进行数据完整度分析,获得每个历史项目周期的项目数据的数据完整度;
根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组。
可选的,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,且所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关。
可选的,所述根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组,包括:
根据所述项目数据的时间权重筛选出时间权重最高的项目数据作为第一项目数据,以及根据项目数据的完整度权重筛选出完整度权重最高的项目数据作为第二项目数据;
判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据;
若否,基于所述第一项目数据和所述第二项目数据创建所述项目数据组。
可选的,若所述判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据子步骤的判断结果为是,则执行如下步骤:
基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述时间权重低于所述最优项目数据的第一次优项目数据创建所述项目数据组;
或者,基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述完整度权重低于所述最优项目数据的第二次优项目数据创建所述项目数据组。
可选的,所述将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间,包括:
将包含所述时间权重以及所述完整度权重的项目数据组输入至所述分摊数据预测模型对所述互助项目在所述目标项目周期的分摊数据区间进行预测,输出包含预测分摊数据上限以及预测分摊数据下限的所述预测分摊数据区间。
可选的,所述分摊数据预测模型,采用如下方式进行训练:
根据多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型;
筛选至少两个历史项目周期的项目数据创建项目数据组;
确定所述项目数据组对应的实际分摊数据区间;
将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型。
可选的,所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为是,还包括:
将所述目标项目周期的项目数据以及所述实际分摊数据作为优化训练样本,对所述分摊数据预测模型进行优化。
可选的,所述分摊数据包括下述至少一项:
所述互助项目的总分摊金额、参与所述互助项目的项目成员总数目、所述项目成员的分摊金额和互助案件总数目。
可选的,在所述分摊数据为所述项目成员分摊金额的情况下,若所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为否,则执行如下步骤:
向所述项目成员发送分摊金额的缴费提醒,所述缴费提醒中携带有应缴分摊金额以及缴费周期;
在所述项目成员未在所述缴费周期内缴纳所述分摊金额的情况下,所述互助项目清退所述项目成员。
根据本说明书实施例的第二方面,提供了一种分摊数据检测装置,包括:
获取项目数据模块,被配置为获取互助项目在多个历史项目周期内的项目数据;
创建项目数据组模块,被配置为对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;
预测模块,被配置为将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;
检测模块,被配置为根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;
若是,运行校验模块;
所述校验模块,被配置为根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
根据本说明书实施例的第三方面,提供了一种电子设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取互助项目在多个历史项目周期内的项目数据;
对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;
将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;
根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;
若是,根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述分摊数据检测方法的步骤。
与现有技术相比,本说明书具有如下优点:
本说明书提供一种分摊数据检测方法,包括:获取互助项目在多个历史项目周期内的项目数据;对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;若是,根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
本说明书提供的分摊数据检测方法,通过获取多个历史项目周期内的项目数据,对所述项目数据进行数据分析筛选,确定至少两个历史项目周期的项目数据创建所述项目数据组,将所述项目数据组输入至所述分摊数据预测模型中,获取预测分摊数据区间,判断实际分摊数据是否超出所述预测分摊数据区间,在超出所述预测分摊数据区间的情况下,说明所述实际分摊数据可能存在计算出错的情况,重新通过项目数据计算实际分摊数据即可,通过所述预测分摊数据区间对实际分摊数据进行核对,避免了出现分摊数据计算出错的情况,通过核对重新计算实际分摊数据保证了实际分摊数据的准确性。
附图说明
图1是本说明书一实施例提供的分摊数据检测方法的流程图;
图2是本说明书一实施例提供的分摊数据检测方法过程的流程图;
图3是本说明书一实施例提供的分摊数据检测装置的结构示意图;
图4是本说明书一实施例提供的电子设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施涉及的名词术语进行解释。
相互保险:具有同质风险保障需求的单位或个人,通过订立合同成为会员,并缴纳保费形成互助基金,由该基金对合同约定的事故发生所造成的损失承担赔偿责任,或者当被保险人死亡、伤残、疾病或者达到合同约定的年龄、期限等条件时承担给付保险金责任的保险活动。
在本说明书中,提供了一种分摊数据检测方法,本说明书同时涉及一种分摊数据检测装置,一种电子设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一实施例的分摊数据检测方法的流程图,包括步骤102至步骤110。
步骤102:获取互助项目在多个历史项目周期内的项目数据。
本说明书一实施例中所述的互助项目可以是互助共济项目、扶贫项目或者共享项目,其中,所述多个历史项目周期是指互助项目的每个项目周期,实际应用中,互助项目每隔设定时间会结算一次,这个时间跨度即为项目周期,历史项目周期是指互助项目已经结算完成的时间。此处,将以所述互助项目为互助共济项目为例,对所述费用计算的核对方法进行描述。
基于此,所述互助共济项目是指将具有相同需求的用户,通过一定的筛选标准,将通过所述筛选标准的用户确定为所述互助共济项目中的项目成员,当所有项目成员中任意一名项目成员发生意外或者需要帮助时,只要该项目成员发生的意外或者需要帮助的事件在互助共济项目的受理范围内,参与所述互助共济项目的其他成员会为该项目成员提供一定的互助金或者一定的帮助。
具体实施时,用户通过向项目代理平台提出参与互助项目的请求,项目代理平台根据用户发送的请求,将符合参与条件的用户确定为项目成员;在项目结算周期内,项目代理平台以及项目服务平台均计算每名项目成员的分摊金额,通过将发生的互助案件的申领金进行累加求和,确定项目周期内的总申领金额,并统计项目周期内的项目成员的总数目,根据总申领金额与项目成员的总数目计算每名项目成员分摊的金额,在计算完成后,为了保证分摊金额计算正确,将分摊金额与通过分摊数据预测模型输出的预测分摊数据区间进行核对,若未超过所述预测分摊数据区间,则说明分摊金额计算正确,若超过所述预测分摊数据区间则说明分摊金额计算错误,则根据上述描述内容重新计算所述分摊金额。
在对所述分摊金额进行核对的过程中,为了能够保证分摊金额正确,通过将历史项目周期内的项目数据进行分析处理创建项目数据组,将所述项目数据组输入至所述分摊数据预测模型,输出预测分摊数据区间,检测所述分摊金额是否在所述预测分摊数据区间,通过对所述分摊金额进行核对,保证了最终确定的分摊数据不会出现错误,并且在对参与所述互助项目的项目成员扣除分摊金额时,不会发生扣错分摊金额的情况。
具体的,获取互助项目在多个历史项目周期的项目数据,其中,所述每个历史项目周期均有对应的项目日志,所述项目日志用于记录该项目周期内发生的全部关于所述互助项目的项目数据,所述项目数据包括:项目成员总数目、互助案件总数目、总申领金额、总分摊金额、每名项目成员的分摊金额等数据。
步骤104:对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组。
具体的,根据上述获取的多个历史项目周期的项目数据,进一步的,对所述多个历史项目周期的项目数据进行数据分析,筛选出至少两个历史项目周期的项目数据创建项目数据组,用于后续的分摊数据预测模型的输入。
本实施例的一个或多个实施方式中,创建所述项目数据组具体的实现方式如下所述:
对所述多个历史项目周期的项目数据进行数据完整度分析,获得每个历史项目周期的项目数据的数据完整度;
根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组。
具体的,在获取多个历史项目周期的项目数据后,对每个历史项目周期内的项目数据进行数据完整度分析,获取每个历史项目周期的项目数据的数据完整度,选择数据完整度较高的项目数据,以及与所述目标项目周期时间跨度较近的历史项目周期的项目数据组成所述项目数据组。
除此之外,还可以只通过所述数据完整度确定所述项目数据组,将数据完整度最高的项目数据以及低于所述数据完整度最高的项目数据组成所述项目数据组;或者只通过目标项目周期与历史项目周期的时间跨度确定项目数据组,将时间跨度最近的历史项目周期的项目数据以及仅低于时间跨度最近的历史项目周期的项目数据组成所述项目数据组,所述项目数据组的确定方式上述描述方法均可以实现。
实际应用中,以三个历史项目周期的项目数据为例,对确定所述项目数据组的过程进行描述,其中,第一历史项目周期的项目数据的完整度为100%,第二历史项目周期的项目数据的完整度为80%,第三历史项目周期的项目数据的完整度为70%,第一历史项目周期与目标项目周期的时间跨度为60天,第二历史项目周期与目标项目周期的时间跨度为30天,第三历史项目周期与目标项目周期的时间跨度为100天,根据上述描述确定,第一历史项目周期的项目数据的完整度最高,第二历史项目周期与目标项目周期的时间跨度最近,则根据第一历史项目周期的项目数据与第二历史项目周期的项目数据创建项目数据组。
本实施例的一个或多个实施方式中,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,且所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关。
具体的,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,可以理解为项目数据的数据完整度越高,所述实际分摊数据的完整度权重越高,所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关,可以理解为时间跨度越大,目标项目周期的实际分摊数据的时间权重越小。
在上述确定所述项目数据组的基础上,进一步,本实施例的一个或多个实施方式中,判断所述项目数据组中的项目数据是否为同一历史项目周期的项目数据,具体实现方式如下所述:
根据所述项目数据的时间权重筛选出时间权重最高的项目数据作为第一项目数据,以及根据项目数据的完整度权重筛选出完整度权重最高的项目数据作为第二项目数据;
判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据;
若否,则说明所述第一项目数据和所述第二项目数据不是同一历史项目周期的项目数据,基于所述第一项目数据和所述第二项目数据创建所述项目数据组;
若是,则说明所述第一项目数据和所述第二项目数据是同一历史项目周期的项目数据,可以选择时间权重或者完整度权重低于最高的项目数据的时间权重或者完整度权重的项目数据与最优项目数据创建所述项目数据组。
具体的,根据每个历史项目周期与所述目标项目周期的时间跨度确定每个历史项目周期的项目数据的时间权重,以及根据每个项目数据的数据完整度确定每个历史项目周期的项目数据的完整度权重,将时间权重最高的项目数据作为第一项目数据,将完整度权重最高的项目数据作为第二项目数据。判断所述第一项目数据以及第二项目数据是否为同一历史项目周期内的项目数据,若否,则根据所述第一项目数据以及所述第二项目数据创建所述项目数据组即可,若是,则将所述同一历史项目周期的项目数据确定为最优的项目数据组中的一个项目数据,再根据后续的确定方法确定另一个项目数据组成项目数据组即可。
实际应用中,仍以上述三个历史项目周期的项目数据为例,对创建项目数据组进行描述,其中,若第一历史项目周期的项目数据的完整度为100%,第二历史项目周期的项目数据的完整度为80%,第三历史项目周期的项目数据的完整度为70%,第一历史项目周期与目标项目周期的时间跨度为60天,第二历史项目周期与目标项目周期的时间跨度为30天,第三历史项目周期与目标项目周期的时间跨度为100天,根据确定第一历史项目周期的项目数据的完整度权重最高,第二历史项目周期的项目数据的时间跨度权重最高,则将第一历史项目周期的项目数据确定为第一项目数据,第二历史项目周期的项目数据确定为第二项目数据,根据第一项目数据以及第二项目数据创建项目数据组。
在上述判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据的基础上,进一步,本实施例的一个或多个实施方式中,若所述判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据子步骤的判断结果为是,则说明所述项目数据组中还缺少一个项目数据,再确定一个项目数据即可,具体实现方式如下所述:
基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述时间权重低于所述最优项目数据的第一次优项目数据创建所述项目数据组;
或者,基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述完整度权重低于所述最优项目数据的第二次优项目数据创建所述项目数据组。
具体的,在所述第一项目数据和所述第二项目数据为同一历史项目周期的项目数据的情况下,说明所述该项目数据的时间权重最高且所述完整度权重最高,则将该项目数据确定为最优项目数据即可,项目数据组中的另一个项目数据可以通过两种方式确定;第一:选择时间权重低于所述最优项目数据的时间权重的项目数据确定为第一次优项目数据,根据最优项目数据以及第一次优项目数据创建项目数据组;第二:选择完整度权重低于所述最优项目数据的完整度权重的项目数据确定为第二次优项目数据,根据最优项目数据以及第二次优项目数据创建项目数据组。
除此之外,在所述第一次优项目数据与所述第二次优项目数据为同一历史项目周期的项目数据的情况下,则将该项目数据确定为仅次于最优项目数据的项目数据即可,根据最优项目数据以及仅次于最优项目数据的项目数据创建项目数据组即可。
实际应用中,仍以上述三个历史项目周期的项目数据为例,对创建项目数据组进行描述,其中,若第一历史项目周期的项目数据的完整度为100%,第二历史项目周期的项目数据的完整度为80%,第三历史项目周期的项目数据的完整度为70%,第一历史项目周期与目标项目周期的时间跨度为30天,第二历史项目周期与目标项目周期的时间跨度为60天,第三历史项目周期与目标项目周期的时间跨度为100天,根据确定第一历史项目周期的项目数据的完整度权重和时间权重均最高,第二历史项目周期的项目数据的完整度权重仅低于第一历史项目周期的项目数据的完整度权重,则将第一历史项目周期的项目数据确定为最优项目数据,将第二历史项目周期的项目数据确定为次优项目数据,根据所述最优项目数据以及次优项目数据创建项目数据组。
通过对所述项目数据组筛选的过程中,选择完整度权重最高的项目数据作为第一项目数据,选择时间权重最高的项目数据作为第二项目数据,根据所述第一项目数据以及所述第二项目数据创建所述项目数据组,即使在所述第一项目数据与所述第二项目数据为同一历史项目周期的项目数据的情况下,可以进一步选择低于所述完整度权重最高或者低于所述时间权重最高的项目数据作为项目数据组中的另一个项目数据,实现了可以多种情况确定所述项目数据组,保证了在后续的预测分摊数据区间更具有准确性。
步骤106:将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间。
具体的,根据上述确定所述项目数据组,进一步的,将所述项目数据组输入至所述分摊数据预测模型对所述分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间。
如上所述,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,且所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关;在此基础上,本实施例的一个或多个实施方式中,所述将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间,包括:
将包含所述时间权重以及所述完整度权重的项目数据组输入至所述分摊数据预测模型对所述互助项目在所述目标项目周期的分摊数据区间进行预测,输出包含预测分摊数据上限以及预测分摊数据下限的所述预测分摊数据区间。
具体实施时,所述输入的项目数据包含对应的时间权重以及完整度权重,经过所述分摊数据预测模型进行预测分摊数据区间,输入的预测分摊数据区间具有预测分摊数据上限以及预测分摊数据下限。
本实施例的一个或多个实施方式中,所述分摊数据包括下述至少一项:
所述互助项目的总分摊金额、参与所述互助项目的项目成员总数目、所述项目成员的分摊金额和互助案件总数目。
实际应用中,以所述分摊数据为互助项目的总分摊金额为例,对分摊数据预测模型的输入和输出进行描述,其中,输入的项目数据组中,项目数据包含历史项目周期对应的项目成员总数目1000万人、发生的互助案件总数目5件以及每笔互助案件的申领金额30万元,将项目数据组输入至分摊数据预测模型,对互助项目的总分摊金额区间进行预测,获得的目标项目周期的预测分摊金额区间为120万元至180万元。
基于此,在所述分摊数据为参与所述互助项目的项目成员总数目、所述项目成员的分摊金额和互助案件总数目的情况下,预测目标项目周期的预测分摊数据区间均可参见上述所述分摊数据为互助项目的总分摊金额的描述内容,本说明书在此不在赘述。
在上述所述分摊数据预测模型的应用基础上,进一步,本实施例的一个或多个实施方式中,所述分摊数据预测模型,采用如下方式进行训练:
根据多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型;
筛选至少两个历史项目周期的项目数据创建项目数据组;
确定所述项目数据组对应的实际分摊数据区间;
将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型。
具体的,根据至少两个项目周期的项目数据创建项目数据组,并根据与其对应的实际分摊数据区间的关键关系,构建初始分摊数据预测模型,通过筛选大量的历史项目周期的项目数据创建大量的项目数据组,并确定每个项目数据组对应的实际分摊数据区间,将大量的项目数据组以及与所述项目数据组对应的实际分摊数据区间作为训练样本对所述初始分摊数据预测模型进行训练,训练完成后的模型即为上述分摊数据预测模型。
通过所述分摊预测模型对所述分摊数据区间进行预测,获得分摊数据预测区间,所述分摊数据预测区间可以在后续核对所述实际分摊数据的过程作为核对标准,能够更准确的确定所述实际分摊数据是否计算正确。
步骤108:根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间。
具体的,上述通过所述分摊数据预测模型,预测所述目标项目周期的预测分摊数据区间,进一步,根据所述互助项目在所述目标项目周期生成实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间。
如果所述实际分摊数据超出所述预测分摊数据区间,说明实际分摊数据可能存在计算错误,则执行步骤110;
如果所述实际分摊数据未超出所述预测分摊数据区间,说明实际分摊数据计算正确,向所述目标项目周期内的项目成员发送缴费提醒即可。
在上述检测所述实际分摊数据是否超出所述预测分摊数据区间的基础上,进一步,本实施例的一个或多个实施方式中,在所述分摊数据为所述项目成员分摊金额的情况下,若所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为否,向参与所述互助项目的项目成员发送缴费提醒,具体实现方式如下所述:
向所述项目成员发送分摊金额的缴费提醒,所述缴费提醒中携带有应缴分摊金额以及缴费周期;
在所述项目成员未在所述缴费周期内缴纳所述分摊金额的情况下,所述互助项目清退所述项目成员。
具体的,在确定所述实际分摊数据未超过所述预测分摊数据区间的情况下,所述分摊数据为分摊金额的情况下,向目标项目周期内的参与所述互助项目的项目成员发送缴费提醒,提醒每名项目成员的缴费金额以及最佳缴费时间,若所述项目成员对所述分摊金额缴费成功,则不对所述项目成员做任何处理,若所述项目成员对所述分摊金额缴费失败,则将所述项目成员从所述互助项目中清退。
实际应用中,以所述分摊数据为分摊金额为例,对检测所述实际分摊数据未超出所述预测分摊数据区间进行描述,其中分摊金额预测区间为每名项目成员分摊金额预测区间为0.1元至0.3元,根据目标项目周期的项目数据确定每名项目成员在目标项目周期内的分摊金额为0.2元,根据确定,每名项目成员的分摊金额未超出分摊金额预测区间,向每名项目成员发送缴费提醒,并提醒缴费时间周期为30天,若30天内,项目成员成功缴费,则不作任何处理,若30内,项目成员未成功缴费,则将项目成员清退。
上述检测所述实际分摊数据是否超出所述预测分摊数据区间的基础上,进一步,本实施例的一个或多个实施方式中,所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为是,还可能是分摊数据预测模型输出的结果错误,具体实现方式如下所述:
将所述目标项目周期的项目数据以及所述实际分摊数据作为优化训练样本,对所述分摊数据预测模型进行优化。
具体的,在所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为是的情况下,说明所述预测分摊数据区间可能存在错误,则将所述目标项目周期的项目数据以及对应的实际分摊数据作为正向训练样本,对所述分摊数据预测模型进行优化,使得所述分摊数据预测模型输出的预测分摊数据区间趋近于实际的分摊数据区间。
在检测所述实际分摊数据是否超出所述预测分摊数据区间的检测结果为否的情况下,说明实际分摊数据计算正确,向所述目标项目周期内的项目成员发送缴费提醒即可,在检测所述实际分摊数据是否超出所述预测分摊数据区间的检测结果为是的情况下,则说明可能存在所述分摊数据预测模型的输出结果错误,可以将所述目标项目周期的项目数据及其对应的实际分摊数据区间作为训练样本,对所述分摊数据预测模型进行优化,使得所述分摊数据预测模型输出的预测分摊数据区间更准确。
步骤110:根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
具体的,在上述检测所述实际分摊数据是否超出所述预测分摊数据区间的基础上,检测所述实际分摊数据超过所述预测分摊数据区间,说明所述实际分摊数据计算错误,则根据所述目标项目周期的项目数据重新计算目标项目周期校验分摊数据,根据所述校验分摊数据对所述实际分摊数据进行校验,确定正确的分摊数据。
实际应用中,以分摊数据为参与互助项目的项目成员分摊金额为例,对根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验进行描述,其中所述实际分摊金额为0.2元,根据确定实际分摊金额未在分摊金额预测区间,则根据目标项目周期内的项目数据重新计算校验分摊金额,根据计算确定校验分摊金额为0.1元,则根据校验分摊金额0.1元对实际分摊金额0.2元进行调整,确定每名项目成员在目标项目周期内的分摊金额为0.1元。
本说明书提供的分摊数据预测方法,根据所述多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型,筛选至少两个历史项目周期的项目数据创建项目数据组,并确定所述项目数据组对应的实际分摊数据区间,将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型,通过训练好的分摊数据预测模型对目标项目周期的分摊数据区间进行预测,在计算目标项目周期实际分摊数据后,通过预测分摊数据区间对所述实际分摊数据进行预测,提高了实际分摊数据计算的准确性,避免在出现计算后的实际分摊数据错误的情况下,对互助项目的业务处理过程产生负面影响。
下述结合附图2,以本说明书提供的分摊数据检测方法在互助项目中检测分摊金额是否正确的应用为例,对所述分摊数据检测方法过程进行进一步说明。其中,具体步骤包括步骤202至步骤216。
步骤202:获取互助项目在多个历史周期内的项目数据。
具体的,在互助项目的每个项目周期为一个月的情况下,为了检测4月份的分摊金额计算是否准确,获取1月份、2月份和3月份三个项目周期的项目数据。
步骤204:对三个项目周期的项目数据进行数据分析。
具体的,1月份、2月份和3月份的项目数据的完整度均为100%,1月份距离4月份的时间跨度为90天,2月份距离4月份的时间跨度为60天,3月份距离4月份的时间跨度为30天。
进一步的,根据数据分析确定,1月份、2月份和3月份的项目数据对应的完整度权重均为0.3,1月份的项目数据对应的时间权重为0.1,2月份的项目数据对应的时间权重为0.3,3月份的项目数据对应的时间权重为0.6。
步骤206:根据数据分析结果筛选两个项目周期的项目数据创建项目数据组。
具体的,根据上述确定三个月份的完整度权重均相等,则根据时间权重确定项目数据组即可,上述确定3月份项目数据对应的时间权重最高,其次为2月份项目数据对应的时间权重,则根据3月份的项目数据以及2月份的项目数据创建项目数据组。
步骤208:将项目数据组输入至分摊数据预测模型,输出分摊金额预测区间。
具体的,将3月份的项目数据以及2月份的项目数据创建的项目数据组输入至分摊数据预测模型,输出的分摊金额预测区间为每名项目成员的分摊金额预测区间为0.1元至0.4元。
步骤210:根据目标项目周期的项目数据计算目标项目周期的每名项目成员的分摊金额。
步骤212:检测每名项目成员的分摊金额是否超出分摊金额预测区间;若否,执行步骤214;若是,执行步骤216。
具体的,在每名项目成员的分摊金额为0.3元的情况下,每名项目成员的分摊金额未超出分摊金额预测区间,则执行步骤214;
在每名项目成员的分摊金额为0.5元的情况下,每名项目成员的分摊金额超出分摊金额预测区间,则执行步骤216。
步骤214:向每名项目成员发送缴纳分摊金额的缴费提醒。
步骤216:重新对每名项目成员的分摊金额进行计算,获取正确的每名项目成员在目标项目周期内的分摊金额。
具体的,每名项目成员的分摊金额超出分摊金额预测区间的情况下,重新对每名项目成员的分摊金额进行计算,保证每名项目成员分摊金额计算正确,再向每名项目成员发送缴纳分摊金额的缴费提醒。
本说明书提供的分摊数据检测方法,通过获取多个项目周期内的项目数据,对所述项目数据进行数据分析筛选,确定2月份和3月份项目周期的项目数据创建所述项目数据组,将所述项目数据组输入至分摊数据预测模型中,获取预测分摊金额区间,判断实际分摊金额是否超出所述预测分摊金额区间,在超出预测分摊金额区间的情况下,说明实际分摊金额可能存在计算出错的情况,重新通过2月份和3月份的项目数据计算实际分摊金额即可,通过预测分摊金额区间对实际分摊金额进行核对,避免了出现分摊金额计算出错的情况,通过核对重新计算实际分摊金额保证了实际分摊金额的准确性,避免了出现扣错分摊金额的情况发生。
与上述方法实施例相对应,本说明书还提供了分摊数据检测装置实施例,
图3示出了本说明书一实施例的分摊数据检测装置的结构示意图。如图3所示,该装置包括:
获取项目数据模块302,被配置为获取互助项目在多个历史项目周期内的项目数据;
创建项目数据组模块304,被配置为对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;
预测模块306,被配置为将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;
检测模块308,被配置为根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;
若是,运行校验模块310;
所述校验模块310,被配置为根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
一个可选的实施例中,创建项目数据组模块304,包括:
完整度分析单元,被配置为对所述多个历史项目周期的项目数据进行数据完整度分析,获得每个历史项目周期的项目数据的数据完整度;
创建项目数据组单元,被配置为根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组。
一个可选的实施例中,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,且所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关。
一个可选的实施例中,所述创建项目数据组单元,包括:
筛选子模块,被配置为根据所述项目数据的时间权重筛选出时间权重最高的项目数据作为第一项目数据,以及根据项目数据的完整度权重筛选出完整度权重最高的项目数据作为第二项目数据;
判断子模块,被配置为判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据;
若否,运行第一创建子模块;
所述第一创建子模块,被配置为基于所述第一项目数据和所述第二项目数据创建所述项目数据组。
一个可选的实施例中,若所述判断子模块的运行结果为是,则所述创建项目数据组单元,包括:
第二创建子模块,被配置为基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述时间权重低于所述最优项目数据的第一次优项目数据创建所述项目数据组;
或者
第三创建子模块,被配置为基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述完整度权重低于所述最优项目数据的第二次优项目数据创建所述项目数据组。
一个可选的实施例中,所述预测模块306进一步被配置为:
将包含所述时间权重以及所述完整度权重的项目数据组输入至所述分摊数据预测模型对所述互助项目在所述目标项目周期的分摊数据区间进行预测,输出包含预测分摊数据上限以及预测分摊数据下限的所述预测分摊数据区间。
一个可选的实施例中,所述分摊数据预测模型,采用如下方式进行训练:
构建单元,被配置为根据多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型;
筛选单元,被配置为筛选至少两个历史项目周期的项目数据创建项目数据组;
确定单元,被配置为确定所述项目数据组对应的实际分摊数据区间;
训练单元,被配置为将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型。
一个可选的实施例中,所述检测模块308进一步被配置为:
将所述目标项目周期的项目数据以及所述实际分摊数据作为优化训练样本,对所述分摊数据预测模型进行优化。
一个可选的实施例中,所述分摊数据包括下述至少一项:
所述互助项目的总分摊金额、参与所述互助项目的项目成员总数目、所述项目成员的分摊金额和互助案件总数目。
一个可选的实施例中,在所述分摊数据为所述项目成员分摊金额的情况下,所述检测模块308的运行结果为否,则所述分摊数据检测装置,还包括:
发送缴费提醒模块,被配置为向所述项目成员发送分摊金额的缴费提醒,所述缴费提醒中携带有应缴分摊金额以及缴费周期;
清退模块,被配置为在所述项目成员未在所述缴费周期内缴纳所述分摊金额的情况下,所述互助项目清退所述项目成员。
本说明书提供的分摊数据预测装置,根据所述多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型,筛选至少两个历史项目周期的项目数据创建项目数据组,并确定所述项目数据组对应的实际分摊数据区间,将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型,通过训练好的分摊数据预测模型对目标项目周期的分摊数据区间进行预测,在计算目标项目周期实际分摊数据后,通过预测分摊数据区间对所述实际分摊数据进行预测,提高了实际分摊数据计算的准确性,避免在出现计算后的实际分摊数据错误的情况下,对互助项目的业务处理过程产生负面影响。
图4示出了根据本说明书一实施例的电子设备400的结构框图。该电子设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
电子设备400还包括接入设备440,接入设备440使得电子设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,电子设备400的上述以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的电子设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
电子设备400可以是任何类型的静止或移动电子设备,包括移动计算机或移动电子设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的电子设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止电子设备。电子设备400还可以是移动式或静止式的服务器。
其中,处理器420用于执行如下计算机可执行指令:
获取互助项目在多个历史项目周期内的项目数据;
对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组;
将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间;
根据所述互助项目在所述目标项目周期生成的实际分摊数据,检测所述实际分摊数据是否超出所述预测分摊数据区间;
若是,根据所述目标项目周期的项目数据计算所述目标项目周期的校验分摊数据,并根据所述校验分摊数据对所述实际分摊数据进行校验。
可选的,所述对所述项目数据进行数据分析,根据数据分析结果筛选至少两个历史项目周期的项目数据创建项目数据组,包括:
对所述多个历史项目周期的项目数据进行数据完整度分析,获得每个历史项目周期的项目数据的数据完整度;
根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组。
可选的,所述历史项目周期的项目数据的数据完整度与所述实际分摊数据的完整度权重呈正相关,且所述历史项目周期与所述目标项目周期之间的时间跨度与所述历史项目周期的项目数据的时间权重呈负相关。
可选的,所述根据所述数据完整度以及每个历史项目周期与所述目标项目周期之间的时间跨度,在所述多个历史项目周期中筛选出两个历史项目周期的项目数据创建所述项目数据组,包括:
根据所述项目数据的时间权重筛选出时间权重最高的项目数据作为第一项目数据,以及根据项目数据的完整度权重筛选出完整度权重最高的项目数据作为第二项目数据;
判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据;
若否,基于所述第一项目数据和所述第二项目数据创建所述项目数据组。
可选的,若所述判断所述第一项目数据和所述第二项目数据是否为同一历史项目周期的项目数据子步骤的判断结果为是,则执行如下步骤:
基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述时间权重低于所述最优项目数据的第一次优项目数据创建所述项目数据组;
或者,基于所述时间权重最高且所述完整度权重最高的最优项目数据以及所述完整度权重低于所述最优项目数据的第二次优项目数据创建所述项目数据组。
可选的,所述将所述项目数据组输入至预先训练的分摊数据预测模型对所述互助项目在目标项目周期的分摊数据区间进行预测,输出所述目标项目周期的预测分摊数据区间,包括:
将包含所述时间权重以及所述完整度权重的项目数据组输入至所述分摊数据预测模型对所述互助项目在所述目标项目周期的分摊数据区间进行预测,输出包含预测分摊数据上限以及预测分摊数据下限的所述预测分摊数据区间。
可选的,所述分摊数据预测模型,采用如下方式进行训练:
根据多个历史项目周期中至少两个项目周期的项目数据创建的项目数据组与对应的实际分摊数据区间的关联关系,构建初始分摊数据预测模型;
筛选至少两个历史项目周期的项目数据创建项目数据组;
确定所述项目数据组对应的实际分摊数据区间;
将所述项目数据组及其对应的所述实际分摊数据区间作为训练样本,对所述初始分摊数据预测模型进行训练,训练完成后获得所述分摊数据预测模型。
可选的,所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为是,还包括:将所述目标项目周期的项目数据以及所述实际分摊数据作为优化训练样本,对所述分摊数据预测模型进行优化。
可选的,所述分摊数据包括下述至少一项:所述互助项目的总分摊金额、参与所述互助项目的项目成员总数目、所述项目成员的分摊金额和互助案件总数目。
可选的,在所述分摊数据为所述项目成员分摊金额的情况下,若所述检测所述实际分摊数据是否超出所述预测分摊数据区间步骤的检测结果为否,则执行如下步骤:
向所述项目成员发送分摊金额的缴费提醒,所述缴费提醒中携带有应缴分摊金额以及缴费周期;
在所述项目成员未在所述缴费周期内缴纳所述分摊金额的情况下,所述互助项目清退所述项目成员。
上述为本实施例的一种电子设备的示意性方案。需要说明的是,该电子设备的技术方案与上述的分摊数据检测方法的技术方案属于同一构思,电子设备的技术方案未详细描述的细节内容,均可以参见上述分摊数据检测方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述分摊数据检测方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的分摊数据检测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述分摊数据检测方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。