用户风险的确定方法和目标风险识别模型的建立方法
技术领域
本说明书属于互联网技术领域,尤其涉及一种用户风险的确定方法和目标风险识别模型的建立方法。
背景技术
在多个区域(例如多个不同国家)分别开展业务时,往往会先确定并根据各个区域中用户的风险等级为所对应区域中的用户分别提供匹配的业务服务或开放匹配的权限;或者,根据各个区域中用户的风险等级,对各个区域中风险等级较高的用户的业务处理进行监控、管理等,以保障所开展的业务在各个区域中整体运行的稳定。
为了确定各个区域中用户的风险等级,通常会先分别根据各个区域的数据资源建立对应该区域的风险识别模型,再利用风险识别模型分别确定出所对应区域中用户的风险等级。
但是,在对新区域开展业务工作,建立针对新区域的风险识别模型时,由于前期在新区域的业务量相对较少,导致新区域的服务器可以获取得到的新区域的样本数据也会相对较少。例如,可能缺少用于建模的黑样本数据等。并且,由于不同区域的样本数据会涉及所在各个区域的区域数据隐私保护,导致不同区域之间还存在数据隔离,即新区域的服务器不能获取或者使用其他区域(例如老区域)的样本数据。这样在建立新区域的风险识别模型时,由于能够获取使用的样本数据数量较少,导致所建立的风险识别模型的准确度会相对差。
例如,某网络支付平台在A区域建立针对A区域的风险识别模型时,需要获取A区域的用户的身份数据。但由于该网络支付平台在A区域开展业务工作的时间相对较短,所积累拥有的A区域的用户身份数据相对较少。而该网络支付平台在A区域的邻近区域B区域拥有大量用户身份数据,积累了较多的建模经验。但出于B区域用户数据的隐私保护考虑,B区域的用户身份数据是不允许离境的,导致在A区域建立风险识别模型时,是不能获取使用B区域的用户身份数据,而只能使用A区域本地的用户身份数据进行模型训练,使得在A区域建立的风险识别模型的准确度往往相对较差,影响在A区域中用户的风险等级的识别确定。
因此,亟需一种能够有效获取利用存在数据隔离的其他区域的建模经验,以准确、高效地建立针对本区域的风险识别模型的建模方法。
发明内容
本说明书目的在于提供一种用户风险的确定方法和目标风险识别模型的建立方法,以充分地利用存在数据隔离的第一区域所积累的建模经验,高效、准确地在目标区域中建立出针对目标区域的目标风险识别模型,从而提高了目标区域建模的准确度,以及建模效率。
本说明书提供的一种用户风险的确定方法和目标风险识别模型的建立方法是这样实现的:
一种用户风险的确定方法,包括:获取目标区域中的目标用户的特征数据;利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
一种目标风险识别模型的建立方法,包括:获取目标区域的样本数据,以及关于第一风险识别模型的模型数据,其中,所述第一风险识别模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域;根据所述模型数据,在所述目标区域中建立第一风险识别模型;在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型。
一种目标风险识别模型的建立方法,包括:获取目标区域的样本数据,以及多个风险识别模型,其中,所述多个风险识别模型分别为利用对应区域的样本数据在对应区域中训练得到的初始模型,所述多个区域分别为与目标区域不同的区域;融合所述多个风险识别模型,得到初始的目标风险识别模型;在目标区域中利用目标区域的样本数据,在目标区域中对所述初始的目标风险识别模型进行训练,得到所述目标风险识别模型。
一种业务数据处理方法,包括:获取目标区域中的目标数据;利用针对目标区域的目标业务处理模型对所述目标数据进行数据处理,得到业务处理结果,其中,所述目标业务处理模型为在目标区域中,根据目标区域的样本数据和第一业务处理模型得到的;所述第一业务处理模型为在第一区域中,利用第一区域的样本数据进行训练得到的。
一种目标业务处理模型的建立方法,包括:获取目标区域的样本数据,以及关于第一业务处理模型的模型数据,其中,所述第一业务处理模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域;根据所述模型数据,在目标区域中建立第一业务处理模型;在目标区域中,利用目标区域的样本数据,在目标区域中对第一业务处理模型进行训练,得到所述目标业务处理模型。
一种用户风险的确定装置,包括:获取模块,用于获取目标区域中的目标用户的特征数据;处理模块,用于利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;确定模块,用于根据所述识别结果,确定目标用户的风险等级。
一种目标风险识别模型的建立装置,包括:获取模块,用于获取目标区域的样本数据,以及关于第一风险识别模型的模型数据,其中,所述第一风险识别模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域;建立模块,用于根据所述模型数据,在所述目标区域中建立第一风险识别模型;训练模块,用于在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取目标区域中的目标用户的特征数据;利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取目标区域中的目标用户的特征数据;利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
本说明书提供的一种用户风险的确定方法和目标风险识别模型的建立方法,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据;再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,解决了由于第一区域和目标区域之间存在数据隔离导致的目标区域的服务器无法有效地利用第一区域的样本数据,影响目标区域建模的技术问题,从而能充分地获取并利用第一区域所积累的建模经验,基于第一风险识别模型通过迁移学习,高效、准确地在目标区域中建立出针对目标区域的目标风险识别模型,提高了在目标区域中建立风险识别模型的准确度,以及建模效率;并通过上述目标风险识别模型实现较为准确地识别确定目标区域中用户的风险等级。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是利用现有方法建立目标区域的风险识别模型的一种实施例的示意图;
图2是应用本说明书实施例提供的用户风险的确定方法和目标风险识别模型的建立方法的系统的结构组成的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的用户风险的确定方法的一种实施例的示意图;
图4是在一个场景示例中,应用本说明书实施例提供的目标风险识别模型的建立方法的一种实施例的示意图;
图5是本说明书实施例提供的用户风险的确定方法的流程的一种实施例的示意图;
图6是本说明书实施例提供的目标风险识别模型的建立方法的流程的一种实施例的示意图;
图7是本说明书实施例提供的业务数据处理方法的流程的一种实施例的示意图;
图8是本说明书实施例提供的服务器的结构的一种实施例的示意图;
图9是本说明书实施例提供的用户风险的确定装置的结构的一种实施例的示意图;
图10是本说明书实施例提供的目标风险识别模型的建立装置的结构的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
考虑到基于现有的建模方法,在数据隔离的情况下,参阅图1所示,往往是无法调取使用其他区域的样本数据,而只能使用本区域的样本数据来建立针对本区域的风险识别模型。但是在许多情况下,如果本区域为新开发的区域(例如新区域),或者本区域本身所包含的用户基数相对较少,使得本区域的服务器所能够获取到的本区域的样本数据的数据量也相对较少,例如可能会出现缺少必要数量的用于建模的黑样本数据等情况。而相对开发较早的区域(例如老区域),或者所包含的用户基数较多的区域,则拥有大量的样本数据,但出于区域数据保护的考虑,不能将该区域的样本数据提供给新开发的区域或者本身样本数据量较少的区域。导致在建模时,上述区域的服务器只能基于本区域的样本数据进行模型训练,但由于本区域的样本数据的数据量相对较小,导致仅基于本区域的样本数据所建立的风险识别模型的准确度也会相对较低。相应的,在应用这样的风险识别模型对本区域进行用户风险识别也更时容易出现误差。
针对上述问题,考虑到如果采用多方安全计算的方式调取使用其他区域的样本数据,则需要预先在本区域和其他区域的服务器布设相应的计算节点,并设计对应的计算规则和程序实施成本相对较高,实施过程也较为复杂、繁琐;并且在调取传输其他区域的样本数据的过程中,样本数据是以随机数的形式进行传输的,应用这种形式传输的数据建模,模型的准确率也会受到影响。
基于上述分析和考虑,为了能够兼顾实施成本和处理效率,高效、准确地建立目标区域的风险识别模型,本申请进一步考虑到,对于不同区域的风险识别模型由于所要处理的特征数据相同,所对应的业务处理场景相近,因此虽然不同区域的风险识别模型会存在差异,但模型的算法框架、主体结构是相近的,因此在其他区域基于其他区域的样本数据所获得的建模经验对于目标区域的建模而言也具有较高的参考价值。
进而提出了可以先在样本数据较为丰富的其他区域中,例如第一区域,使用该区域的样本数据先训练得到一个初始模型,例如第一风险识别模型;进而可以仅将该初始模型而不是受数据隔离限制的该区域的样本数据反馈至目标区域;这样目标区域的服务器可以在目标区域中,利用目标区域所采集到的目标区域的样本数据对上述初始模型进行训练,以便基于第一风险识别模型的算法框架、主体结构对模型的模型参数进行调整、修改,从而可以高效地获得具有较高精度的对应目标区域的目标风险识别模型,后续可以利用该目标风险识别模型对该目标区域中的用户风险进行识别确定。进而可以解决由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的数据资源的技术问题,并能充分地利用第一区域积累的建模经验,通过迁移学习,高效、准确地在目标区域中建立针对目标区域的目标风险识别模型,提高在目标区域中建立风险识别模型的准确度,以及建模效率。
本说明书实施例提供一种用户风险的确定方法和目标风险识别模型的建立方法,所述方法可以应用于包含有目标区域的服务器、目标区域的客户端以及第一区域的服务器、第一区域的客户端的系统架构中。
具体可以参阅图2所示,第一区域的服务器和第一区域的客户端布设于第一与区域中,目标区域的服务器和目标区域的客户端布设于目标区域中。其中,上述第一区域的服务器与第一区域的客户端耦合,上述目标区域的服务器与目标区域的客户端耦合,上述第一区域的服务器与目标区域的客户端耦合,相互之间可以在满足数据隔离的前提下进行数据交互。其中,上述第一区域和目标区域为存在数据隔离的不同区域,即为了保护各自区域中用户数据的数据隐私,避免各自区域所拥有的用户数据发生泄漏,第一区域和目标区域之间不能相互传输各自区域的样本数据。
具体实施时,第一区域服务器可以通过第一区域的客户端搜集第一区域的样本数据,并在第一区域中,利用第一区域的样本数据训练一个初始模型作为第一风险识别模型;进而第一区域的服务器可以将第一风险识别模型而不是第一区域的样本数据发送至目标区域的服务器。目标区域的服务器可以通过目标区域的客户端搜集目标区域的样本数据。目标区域的服务器在接收到第一区域的服务器反馈的第一风险识别模型后,可以利用所获取的目标区域的样本数据在目标区域中对第一风险识别模型进行训练,在第一风险识别模型的基础上进行调整,得到对应于目标区域的目标风险识别模型。目标区域的服务器在得到了上述目标风险识别模型后,可以根据目标区域的客户端所搜集的目标用户的特征数据对目标区域中的用户的风险等级进行确定;进而在目标区域开展具体业务时,目标区域的服务器可以根据用户的风险等级为目标区域中的用户提供与风险等级匹配的业务或者开放与风险等级匹配的服务权限,从而可以有效地对目标区域的业务开展进行风险管控。
在本实施例中,所述目标区域的服务器、第一区域的服务器可以是一种应用于业务处理平台一侧,分别对应于目标区域、第一区域业务处理平台的能够实现数据传输、数据处理等功能的后台业务服务器。具体的,所述服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施方式中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述目标区域的客户端、第一区域的客户端可以是一种应用于用户一侧,分别对应于目标区域、第一区域用户的能够实现数据采集、数据传输等功能的前端设备。具体地,所述客户端例如可以为台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、具有网络访问功能的电视机等。或者,所述客户端也可以为能够运行于上述电子设备中的软件应用。例如,可以是在手机上运行的某APP等。
在一个场景示例中,可以参阅图3所示,XX网络支付平台可以应用本说明书实施例提供的用户风险的确定方法和目标风险识别模型的建立方法,在基于B区域的建模经验在新开展业务的A区域建立对应的风险识别模型,并利用该风险识别模型确定出A区域用户的风险等级。
在本场景示例中,XX网络支付平台相对A区域更早就已经在B区域开展网络支付业务,在B区域积累了大量的与B区域用户相关的特征数据。例如,B区域用户的历史交易记录、B区域用户的历史借贷记录、B区域用户的身份信息、B区域用户的登录地点数据等等。而对于A区域,XX网络支付平台刚刚开始进入并在A区域推广该平台的网络支付业务,因此所拥有的A区域的用户的特征数据的数据量相对较小,例如,缺少足够的黑样本数据(例如风险等级较高的用户的特征数据)。而在A区域开展该平台的网络支付业务时,为了对支付业务的风险进行有效管控,需要先预测确定出A区域的各个用户的风险等级,并根据用户的风险等级为A区域的用户分别提供对应匹配的业务。例如,根据用户等级,为A区域中风险等级较低的用户提供相对较高额度的支付业务,为风险等级较高的用户则提供相对较低额度的支付业务。
在本场景示例中,为了能预测确定出A区域中用户的风险等级,布设于A区域的XX网络支付平台的服务器(记为A区域的服务器),需要先建立针对于A区域的风险识别模型(记为A模型),但目前A区域的服务器所能获取的用于建模的A区域的样本数据(即所积累的A区域中已经使用该网络支付平台业务或者参与该网络支付平台业务测试的用户的特征数据)相对较少。而B区域积累有大量用于建模的B区域中的样本数据(即所积累的B区域中用户的特征数据)。但是B区域为了保护本区域用户的数据隐私,不允许本区域中用户的特征数据流入其他的区域。类似的,A区域也不允许本区域中用户的特征数据流入其他区域。即A区域和B区域之间存在数据隔离:XX网络支付平台位于B区域中的服务器(即为B区域的服务器)不能将B区域中的样本数据发送至A区域的服务器使用。
在这种情况下,A区域如果仅使用A区域的样本数据来建立A模型,所能获取使用的样本数据相对较少,会使得所建立的A模型的准确度较差。为了能够建立出准确度较高的A模型,A区域的服务器可以先通过B区域的服务器获取B区域建立风险识别模型的建模经验,例如,模型的算法框架、主体结构等,这样可以不用获取B区域的受数据隔离的样本数据,而是获取B区域的建模经验等来建立得到较为准确的A模型。
具体实施时,A区域的服务器可以在通过布设于A区域的客户端采集获取A区域中用户的样本数据的同时,可以向B区域的服务器发送协助建模请求。B区域的服务器在接收到上述协助建模请求后,可以响应该协助建模请求,通过布设于B区域的客户端采集获取B区域的中用户的样本数据,并在B区域内,利用所采集到的B区域的样本数据进行模型训练,以建立第一风险识别模型作为用于表征B区域建模经验的载体。
具体的,以建立基于神经网络模型的第一风险识别模型为例,B区域的服务器可以先建立一个包含有10层的神经网络模型;再利用所获取的B区域的样本数据对该神经网络模型进行学习、训练,以确定出该神经网络模型中的前6层,即第1层至第6层(例如特征提取层等)中各层的网络参数,得到一个经过训练的神经网络模型作为第一风险识别模型。需要说明的是,上述第一风险识别模型由于已经确定了前6层中各层的网络参数,因此已经具备了较为准确的算法框架和模型结构,即该模型已经包含了B区域基于B区域的样本数据进行模型训练的建模经验。其中,还需要说明的是,上述第一风险识别模型所包含的后4层(例如与具体的应用场景关联的分类层)还没有被完全确定。这时,B区域的服务器可以将关于上述第一风险识别模型的模型数据(例如第一风险识别模型的层数据)发送至A区域的服务器,而不需要直接向A区域的服务器发送B区域的样本数据。
A区域的服务器在接收到上述关于第一风险识别模型的模型数据后,可以先根据上述关于第一风险识别模型的模型数据,在A区域中还原出第一风险识别模型。再利用所采集获取的A区域的样本数据在A区域中对第一风险识别模型进行学习、训练,以调整第一风险识别模型的后4层中的网络参数。通过多次调整后,当第一风险识别模型的模型精度满足预设的精度要求后,将此时的第一风险识别模型确定为对应A区域的目标风险识别模型,即A模型,从而在没有获取使用其他区域的样本数据的情况下,得到了准确度较高的风险识别模型。
当然需要说明的是,上述所列举的基于神经网络模型建立A模型的方式只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他类型的模型来建立A模型。例如,还可以通过基于随机森林模型或者梯度提升树模型等来按照上述方式建立A模型。对此,本说明书不作限定。
在得到了准确度较高的A模型后,A区域的服务器可以获取A区域中待确定风险的目标用户的特征数据,并将上述目标用户的特征数据作为模型输入,输入至上述A模型中进行识别处理,得到对应的识别结果。其中,上述识别结果具体可以是一种用于衡量风险的分数值。进而可以根据识别结果,确定出目标用户的风险等级。
例如,A区域的服务器可以将所得到的识别结果与预设的分数阈值作比较,如果识别结果大于上述预设的分数阈值,则可以判断目标用户的风险等级较高,即该目标用户在使用XX网络支付平台提供的支付业务时,XX网络支付平台需要承担的风险会相对较大。如果识别结果小于等于上述预设的分数阈值,则可以判断目标用户的风险等级较低,即该目标用户在使用XX网络支付平台提供的支付业务时,XX网络支付平台需要承担的风险会相对较小。
按照上述方式确定出A区域中各个用户的风险等级后,XX网络支付平台可以根据各个用户的风险等级,为不同用户提供与该用户的风险等级匹配的服务。具体的,例如,XX网络支付平台可以根据用户的风险等级,为风险等级较低的用户提供相对更多的服务,例如为这类用户提供赊账服务。而对于风险等级较高的用户则不提供上述赊账服务,并对风险等级较低的用户所请求发起的支付业务进行针对性的监管,降低该类用户可能带来的风险。从而可以有效地降低XX网络支付平台在A区域中推广使用所提供的支付业务时所需要承担的风险,保证XX网络支付平台运行的安全、稳定。
在另一个场景示例中,参阅图4所示,为了使得所建立的A模型具有更高的准确度,具体实施时,A区域的服务器可以同时向B区域的服务器、C区域的服务器和D区域的服务器分别发送协助建模请求。其中,上述C区域、D区域与B区域相同,也与A区域存在数据隔离,即C区域的服务器不能将C区域的样本数据发送至A区域的服务器,D区域的服务器也不能将D区域的样本数据发送至A区域。
B区域的服务器、C区域的服务器和D区域的服务器在接收到A区域的协助建模请求后,可以分别获取并根据各自区域的样本数据建立各自区域的风险识别模型。例如,B区域的服务器获取并根据B区域的样本数据通过模型训练建立了对应B区域的第一风险识别模型。C区域的服务器获取并根据C区域的样本数据通过模型训练建立了对应C区域的第二风险识别模型。D区域的服务器获取并根据D区域的样本数据通过模型训练建立了对应D区域的第三风险识别模型。然后,B区域的服务器、C区域的服务器和D区域的服务器会分别将各自建立的第一风险识别模型、第二风险识别模型、第三风险识别模型发送至A区域的服务器。
A区域的服务器在接收到上述三个风险识别模型后,可以将上述三个风险识别模型进行模型融合,得到初始的目标风险识别模型,可以记为A0模型。具体的,A区域的服务器可以根据B区域、C区域和D区域与A区域的近似程度分别设置第一风险识别模型(可以记为B1)、第二风险识别模型(可以记为C1)和第三风险识别模型(可以记为D1)的权重参数;再根据各个风险识别模型的权重参数,将上述第一风险识别模型、第二风险识别模型和第三风险识别模型进行加权处理,得到对应的A0模型。其中,上述A0模型是基于3种区域的样本数据得到的,因此该模型所携带的建模经验,例如所包含的算法框架和模型结构相对更加准确。
在得到上述A0模型后,A区域的服务器可以利用A区域的样本数据对A0模型进行第一次模型训练,得到对应A区域的目标风险识别模型,记为A1模型。其中,A1模型是基于更加准确的融入有3种区域的风险识别模型的A0模型得到的,因此相对于A模型具有更高的准确度。A区域的服务器可以利用A1模型来确定A区域中用户的风险等级。
如果想要进一步提高模型的准确度,A区域的服务器在得到上述A1模型后,还可以再把A1模型分别发送给B区域的服务器、C区域的服务器和D区域的服务器。B区域的服务器、C区域的服务器和D区域的服务器在接收到A1模型后,可以分别利用各自区域的样本数据对A1模型进行训练调整,得到调整后的模型,可以分别记为B2模型、C2模型和D2模型,再将上述三种调整后的模型发送至A区域的服务器。
A区域的服务器在接收到上述B2模型、C2模型和D2模型后,可以先融合上述B2模型、C2模型和D2模型得到新融合的模型;再利用A区域的样本数据对上述新融合的模型进行第二次模型训练,得到准确度更高的目标风险识别模型作为更新后的目标风险识别模型,可以记为A2。
当然,具体实施时,根据具体的精度要求可以按照上述方式通过与B区域的服务器、C区域的服务器和D区域的服务器进行多次通信交互,从而进行多次的模型训练和更新,从而可以对所获取的对应A区域的目标风险识别模型的准确度进行多次改善,使得最终得到的更新后的目标风险识别模型的准确度能够满足精度要求。
由上述场景示例可见,本说明书提供的目标风险识别模型的建立方法,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据;再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的样本数据,影响目标区域的模型训练的技术问题,从而能充分地利用第一区域积累的建模经验,基于第一风险识别模型通过迁移学习,高效、准确地在目标区域中建立针对目标区域的目标风险识别模型,提高了在目标区域中建立风险识别模型的准确度,以及建模效率。
参阅图5所示,本说明书实施例提供了一种用户风险的确定方法,其中,该方法具体可以应用于布设于目标区域的服务器一侧。具体实施时,该方法可以包括以下内容。
S51:获取目标区域中的目标用户的特征数据。
在本实施例中,上述目标用户具体可以理解为一种待确定风险等级的用户。上述目标区域具体可以理解为一种目标用户的所在区域。
在本实施例中,上述目标用户的特征数据具体可以理解为一种反映目标用户相关属性的用户数据。具体的,上述目标用户的特征数据可以包括:目标用户的登录地址、目标用户的登录设备、目标用户的历史交易记录、目标用户的身份信息等等。当然,需要说明的是,上述所列举的特征数据只是为了更好地说明本说明书实施例。具体实施时,根据具体的应用场景,还可以引入其他类型的用户数据。例如,还可以引入目标用户的历史借贷记录、目标用户的收支流水信息等一同作为目标用户的特征数据。对此,本说明书不作限定。
在本实施例中,具体实施时,目标区域的目标用户在通过客户端设备,例如手机、平板等登陆使用相应的应用程序(例如XX网络支付平台的APP)时,客户端设备可以通过该应用程序的内置代码搜集该目标用户的特征数据,并将所搜集到的目标用户的特征数据发送至目标区域的服务器,从而可以使得目标区域的服务器获取目标用户的特征数据。其中,上述目标区域的服务器,具体可以理解为布设于目标区域的服务器,该服务器用于负责确定目标区域中的各个用户的风险等级。
S53:利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的。
在本实施例中,上述针对目标区域的风险识别模型具体可以理解为一种预先通过学习训练得到用于预测识别目标区域中用户的风险等级的模型。
在本实施例中,上述第一区域具体可以理解为一种与目标区域不同的区域。其中,上述第一区域可以是真实地理中与目标区域不同的区域,例如,目标区域为R市,第一区域为与R市邻近的F市等。也可以是虚拟领域中与目标区域不同的区域,例如,目标区域为包含有倾向短期投资的用户的区域,第一区域为包含有倾向长期投资的用户的区域等。
在本实施例中,上述第一区域具体可以为与目标区域存在数据隔离的区域,即出于保护第一区域的数据资源(例如涉及第一区域中用户的样本数据等),避免本区域的样本数据泄漏到其他区域等考虑,第一区域的服务器不能将所拥有的用于训练风险识别模型的第一区域的样本数据发送至目标区域。当然,还需要补充的是,如果第一区域为与目标区域不存在数据隔离的区域,即第一区域的服务器可以与目标区域的服务器分享本区域的样本数据,本申请所提出的方法同样可以适用。
在本实施例中,如果第一区域与目标区域存在数据隔离,则目标区域的服务器无法获取、使用第一区域的样本数据。但在第一区域中,基于第一区域的样本数据所建立的风险识别模型与目标区域的服务器想要建立的目标风险识别模型由于所要数据处理的特征数据相同,所对应的业务处理场景相近,因此上述两种不同区域的风险识别模型在模型的算法框架、主体结构等相近。即,目标区域的服务器虽然不能直接使用第一区域的样本数据,但可以借鉴第一区域的服务器基于第一区域的样本数据所得到的建模经验,来更加准确、高效地建立针对目标区域的目标风险识别模型。
在本实施例中,上述第一风险识别模型具体可以理解为一种由第一区域的服务器基于第一区域的样本数据通过学习训练所得的包含有第一区域的建模经验的初始模型。其中,上述第一风险识别模型所包含的算法框架、模型的主体结构等与目标风险识别模型相近,可以为目标区域的服务器建立目标风险识别模型提供借鉴。
在本实施例中,在具体实施前,目标区域的服务器可以按照以下方式获取目标风险识别模型:目标区域的服务器向第一区域的服务器发送协助建模请求;第一区域的服务器接收并响应协助建模请求,获取第一区域的样本数据,并利用第一区域的样本数据进行训练得到第一风险识别模型,再将关于第一风险识别模型的模型数据发送至目标区域的服务器;目标区域的服务器在接收到第一风险识别模型后,可以以第一风险识别模型为目标风险识别模型的模型基础(即初始模型),获取并利用目标区域的样本数据对第一风险识别模型进行训练和调整,从而得到对应目标区域的目标风险识别模型。这样在不需要获取第一区域的样本数据的情况下,目标区域的服务器可以通过获取并利用能够反映基于第一区域的样本数据所得到的建模经验的第一风险识别模型作为模型基础,再综合利用目标区域的样本数据,高效、快速地得到准确度较高的目标风险识别模型。
在本实施例中,具体实施时,目标区域的服务器可以将目标用户的特征数据作为模型输入,输入至目标风险识别模型中;目标风险识别模型可以对输入的用户的特征数据进行识别处理,得到对应的模型输出,即所述识别结果。其中,上述识别结果具体可以是一种用于表征目标用户的风险情况的分数值等。当然,上述所列举的识别结果只是一种示意性说明。具体实施时,根据具体情况,还可以引入其他形式或类型的数据作为上述识别结果。对此,本说明书不作限定。
S55:根据所述识别结果,确定目标用户的风险等级。
在本实施例中,目标区域的服务器在得到目标风险识别模型输出的识别结果后,可以根据识别结果来确定对应的目标用户的风险等级。
具体的,例如,目标区域的服务器可以将得到的识别结果与预设的分数阈值进行数值比较,如果识别结果大所述预设的分数阈值,则可以判断目标用户的风险等级较高;如果识别结果小于等于所述预设的分数阈值,则可以判断目标用户的风险等级较低。其中,上述预设的分数阈值具体可以根据风险管控的具体的要求确定。例如,如果对于风险管控的要求较为严格,可以将上述预设的分数阈值的数值设置得相对较小,如果对于风险管控的要求较为宽松,可以将上述预设的分数阈值的数值设置得相对较大。
当然,需要说明的是,上述所列举的根据识别结果确定目标用户的风险等级的方式只是一种示意性说明。具体实施时,根据具体情况,还可以采用其他合适的方式来根据识别结果确定目标用户的风险等级。对此,本说明书不作限定。
在一个实施例中,所述目标用户的特征数据具体可以包括以下至少之一:目标用户的登录地址、目标用户的登录设备、目标用户的历史交易记录、目标用户的身份信息等等。当然,需要说明的是,上述所列举的特征数据只是一种示意性说明。具体实施时,根据具体情况,上述目标用户的特征数据还可以包括有其他类型的特征数据,例如,还可以包括目标用户的历史借贷记录等。对此,本说明书不作限定。
在一个实施例中,在根据所述识别结果,确定目标用户的风险等级后,所述方法具体实施时,还可以包括以下内容:根据目标用户的风险等级,向目标用户提供与所述风险等级匹配的业务。
在本实施例中,目标区域的服务器在目标区域开展具体业务时,为了降低业务开展方所要承担的风险,保证在该区域的业务整体稳定、安全,可以根据不同用户的风险等级,为不同用户分别提供与该用户的风险等级匹配的业务。例如,如果目标用户的风险等级较高,可以判断为该目标用户提供业务服务时所要承担的风险相对较大,这时可以为该目标用户提供相对受限制的部分业务,或者对限制开发针对该目标用户的权限,或者对该目标用户的业务情况进行针对性的监控和管理等。如果目标用户的风险等级较低,可以判断为该目标用户提供业务服务时所要承担的风险相对较小,这时可以为该目标用户提供相对更多的业务,或者进一步开放该目标用户的权限等等。
在一个是实施例中,所述第一风险识别模型具体实施时,可以按照以下方式获取:接收第一区域的服务器反馈的关于第一风险识别模型的模型数据,其中,所述第一区域为与目标区域不同的区域;在根据所述模型数据,在所述目标区域中建立所述第一风险识别模型。
当然,需要说明的是,上述所列举的获取第一风险识别模型的方式只是一种示意性说明。具体实施时,根据目标区域的服务器与第一区域的服务器之间的数据交互方式,还可以采用其他合适的方式来获取第一风险识别模型。对此,本说明书不作限定。
由上可见,本说明书实施例提供的用户风险的确定方法,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据,再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,进而可以利用上述目标风险识别模型来识别确定目标区域中目标用户的风险等级,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的样本数据影响目标区域的模型训练的技术问题,从而能充分地利用第一区域积累的建模经验,通过迁移学习,在目标区域中建立针对目标区域的目标风险识别模型,并通过基于上述方式得到目标风险识别模型,综合了目标区域的样本数据,以及基于第一区域的样本数据得到的建模经验,高效、准确地识别确定出目标区域中目标用户的风险等级,降低了识别误差。
参阅图6所示,本说明书实施例提供了一种目标风险识别模型的建立方法,其中,该方法具体可以应用于布设于目标区域的服务器一侧。具体实施时,该方法可以包括以下内容。
S61:获取目标区域的样本数据,以及关于第一风险识别模型的模型数据,其中,所述第一风险识别模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域。
在本实施例中,具体实施时,目标区域的服务器在建立对应目标区域的目标风险识别模型时,可以不用获取第一区域的样本数据,而获取第一区域的服务器通过第一区域的样本数据训练得到的可以反映基于第一区域的样本数据得到的建模经验的第一风险识别模型;再根据上述第一风险识别模型,结合目标区域的样本数据得到准确度相对较高的目标风险识别模型。
在本实施例中,上述获取目标区域的样本数据,具体可以包括:目标区域的服务器通过目标区域中用户所使用的客户端设备收集用户的特征数据作为目标区域的样本数据。其中,上述所收集用户的特征数据可以包括:用户的登录地址、用户的登录设备、用户的历史交易记录、用户的身份信息等等。
在本实施例中,上述获取第一风险识别模型的模型数据,具体实施时,可以包括:目标区域的服务器先向第一区域的服务器发送协助建模请求;第一区域的服务器接收并响应所述协助建模请求,获取第一区域的样本数据,并利用第一区域的样本数据在第一区域进行模型训练,得到初始模型,即具有了一定算法框架、模型结构的模型作为第一风险识别模型,再将上述第一风险识别模型的模型数据发送至目标区域的服务器;目标区域的服务器接收第一区域的风险识别模型基于协助建模请求所反馈的第一风险识别模型的模型数据。
S63:根据所述模型数据,在所述目标区域中建立第一风险识别模型。
在本实施例中,具体实施时,目标区域的服务器在接收到第一风险识别模型的模型数据后,可以根据模型数据,在目标区域中还原建立出对应的第一风险识别模型。
S65:在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型。
在本实施例中,上述第一风险识别模型虽然不是第一区域的样本数据,但是能够有效地表征出第一区域的服务器基于第一区域的样本数据进行模型训练所得到的建模经验。又由于第一风险识别模型所对应的要处理的数据与待建立的目标风险识别模型所要求处理的数据相同,且第一风险识别模型所对应的业务场景也与目标风险识别模型所对应的业务场景相近,因此待建立的目标风险识别模型的算法框架与主体结构等特征是与第一风险识别模型相近的。基于上述情况,可以利用第一风险识别模型作为基础,通过迁移学习,借鉴使用第一风险识别模型的算法框架和主体结构等特征,以便能够高效、准确地建立得到目标区域的目标风险识别模型。
在本实施例中,上述在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型,具体实施时,可以包括:目标区域的服务器利用第一风险识别模型作为基础模型,在目标区域中,利用目标区域的样本数据对第一风险识别模型进行训练,以便不断地调整第一风险识别模型中的模型数据,直到模型适用于目标区域中的用户的识别,且满足目标区域的精度要求,从而得到了上述目标风险识别模型。
在本实施例中,通过上述方式,可以在不获取使用第一区域的样本数据的情况下,通过获取并利用基于第一区域的样本数据得到的能反映第一区域的建模经验的第一风险识别模型,以及目标区域的样本数据,高效、准确地获取到对应于目标区域的目标风险识别模型。
在本实施例中,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据,再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的数据资源的技术问题,从而能充分地利用第一区域积累的建模经验,通过迁移学习,高效、准确地在目标区域中建立针对目标区域的目标风险识别模型,提高了在目标区域中建立风险识别模型的准确度,以及建模效率。
在一个实施例中,所述第一风险识别模型具体可以包括以下至少之一:神经网络模型、随机森林(Random Forest)模型、梯度提升树(GDBT)模型等等。当然,需要说明的是,上述所列举的第一风险识别模型的模型类型只是一种示意性说明。具体实施时,根据具体的应用场景,还可以选择除上述所列举的模型类型以外其他类型的模型作为第一风险识别模型。对此,本说明书不作限定。
在本实施例中,第一区域的服务器在基于第一区域的样本数据训练第一风险识别模型,可以根据第一风险识别模型的类型选择合适的方式来进行训练。相应的,目标区域的服务器可以根据第一风险识别模型的类型选择对应的方式,对第一风险识别模型训练调整,得到对应的目标风险识别模型。
具体的,在第一风险识别模型为神经网络模型的情况下,第一区域的服务器可以先利用第一区域的样本数据对神经网络模型进行模型训练。当第一区域的服务器通过模型训练,确定出所述神经网络模型前面连续预设层数的网络参数后,可以停止模型训练,并将此时得到的神经网络模型确定为第一风险识别模型。其中,上述第一风险识别模型中前面连续预设层数的网络参数已经被第一区域的服务器通过第一区域的样本数据确定出来了,即该模型的算法框架、主体结构已经被锁定,而该模型中后面多层的网络参数还没有被确定。上述预设层数具体可以根据所选择使用的神经网络模型以及对模型的具体要求灵活设定。例如,所选取的为包含有10层的神经网络模型,则上述预设层数可以设置为6,即所得到的第一风险识别模型从起始层到第6层中各层的网络参数已经被确定,后面的4层的网络参数还没有被确定。目标区域的服务器在得到上述第一风险识别模型后,可以在目标区域中,利用目标区域的样本数据对上述第一风险识别模型进行模型训练,以逐步地确定出该模型后面多层中各层的网络参数。当目标区域的服务器通过模型训练,确定出所述第一风险识别模型中后面多层的网络参数,可以停止模型训练,并将此时得到的第一风险识别模型确定为目标风险识别模型。
在第一风险识别模型为随机森林模型的情况下,第一区域的服务器可以利用第一区域的样本数据,通过模型训练,先确定出随机森林中各棵树的主干模型,完成整体的RF建模,得到第一风险识别模型。其中,上述第一风险识别模型中所包含的各棵树的主干已经被第一区域的服务器通过第一区域的样本数据确定出来,但每棵树中的叶子节点还没有被确定。目标区域的服务器在得到上述第一风险识别模型后,可以在目标区域中,利用目标区域的样本数据对上述第一风险识别模型进行模型训练,以逐步地确定出该模型中每棵树中的叶子节点。当目标区域的服务器通过模型训练,确定出该模型中每棵树中的叶子节点,可以停止模型训练,并将此时得到的第一风险识别模型确定为目标风险识别模型。
在第一风险识别模型为梯度提升树模型的情况下,第一区域的服务器可以利用第一区域的样本数据,通过模型训练,先确定出模型中前预设个数棵树的模型,得到第一风险识别模型。其中,上述第一风险识别模型中所包含的前预设个数棵树已经被第一区域的服务器通过第一区域的样本数据确定出来,但该模型除前预设个数棵树以外的后面多棵树还没有被确定。其中,上述预设个数可以根据所选择使用的梯度提升树模型以及对模型的精度要求确定。目标区域的服务器在得到上述第一风险识别模型后,可以在目标区域中,利用目标区域的样本数据对上述第一风险识别模型进行模型训练,以逐步地确定出该模型中后面的多棵树。当目标区域的服务器通过模型训练,确定出该模型中后面的多棵树后,可以停止模型训练,并将此时得到的第一风险识别模型确定为目标风险识别模型。
当然,需要说明的是,上述所列举的建立第一风险识别模型,以及基于第一风险识别模型建立对应的目标风险识别模型的方式只是一种示意性说明。具体实施时,根据所采用的第一风险识别模型的模型类型,还可以采用其他与第一风险识别模型的模型类型对应的合适方式来建立第一风险识别模型,以及目标风险识别模型。对此,本说明书不作限定。
在一个实施例中,在在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型后,所述方法具体实施时,还可以包括以下内容:将所述目标风险识别模型发送至第一区域的服务器,其中,所述第一区域的服务器用于利用第一区域的样本数据在所述第一区域中,对所述目标风险识别模型进行调整,得到调整后的目标风险识别模型,并反馈调整后的目标风险识别模型;接收调整后的目标风险识别模型;在目标区域中,利用目标区域的样本数据,在目标区域中对所述调整后的目标风险识别模型进行训练,以获取更新后的目标风险识别模型。
在本实施例中,为了进一步提高所建立的目标风险识别模型的准确度,目标区域的服务器可以与第一区域的服务器进行多轮交互,以便对目标风险识别模型进行多次的调整、改进。
具体的,目标区域的服务器在得到了目标风险识别模型后,为了进一步提高目标风险识别模型的准确度,可以先将目标风险识别模型发送回第一区域的服务器。第一区域的服务器可以利用第一区域的样本数据,对该目标风险识别模型进行模型训练,在模型训练过程中可以对该目标风险识别模型的模型参数进行调整,得到调整后的目标风险识别模型,并将调整后的目标风险识别模型反馈给目标区域的服务器。目标区域的服务器在接收到上述调整后的目标风险识别模型后,可以利用目标区域的样本数据,对该调整后的目标风险模型进行模型训练,在模型训练过程中对该调整后的目标风险识别模型的模型参数进行调整,得到准确度相对更高的目标风险识别模型作为上述更新后的目标风险识别模型。进而后续可以利用准确度相对更好的更新后的目标风险识别模型替换之前确定目标风险识别模型,以便更加准确地确定目标区域中用户的风险等级。
在本实施例中,如果上述更新后的目标风险识别模型的准确度仍让不满足准确度要求,则可以按照上述方式,通过第一区域的服务器和目标区域的服务器交互进行多次的调整,直到得到的更新后的目标风险识别模型的准确度满足准确度要求。
在本实施例中,以第一风险识别模型为梯度提升树模型为例,具体实施时,第一区域的服务器在接收到目标风险识别模型后,可以先对目标风险识别模型中第1棵树进行调整,再将调整后的目标风险识别模型发送回目标区域的服务器。目标区域的服务器可以紧接着对第1棵树之后的第2棵树进行调整,再反馈给第一区域的服务器,以便对第3棵树进行调整。按照上述方式通过多次交互,依次调整完模型中的各棵树后,得到了更新后的目标风险识别模型。
由上可见,本说明书实施例提供的目标风险识别模型的建立方法,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据;再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的样本数据,影响目标区域的模型训练的技术问题,从而能充分地利用第一区域积累的建模经验,基于第一风险识别模型通过迁移学习,高效、准确地在目标区域中建立针对目标区域的目标风险识别模型,提高了在目标区域中建立风险识别模型的准确度,以及建模效率;还通过在目标区域中,利用目标区域的样本数据对第一风险识别模型进行训练,得到目标风险识别模型后,还将得到的目标风险识别模型发送回第一区域的服务器,以便第一区域的服务器利用第一区域的样本数据对目标风险识别模型进行修改调整;再获得第一区域的服务器反馈的调整后的目标风险识别模型后,再次利用目标区域的样本数据对调整后的目标风险识别模型进行训练,得到更新后的目标风险识别模型,从而降低了模型误差,进一步提高了模型的准确度。
本说明书实施例提供了另一种目标风险识别模型的建立方法,以便得到准确度更高的目标风险识别模型,其中,该方法具体可以应用于布设于目标区域的服务器一侧。具体实施时,该方法可以包括以下内容。
S1:获取目标区域的样本数据,以及多个风险识别模型,其中,所述多个风险识别模型分别为利用对应区域的样本数据在对应区域中训练得到的初始模型,所述多个区域分别为与目标区域不同的区域;
S2:融合所述多个风险识别模型,得到初始的目标风险识别模型;
S3:在目标区域中利用目标区域的样本数据,在目标区域中对所述初始的目标风险识别模型进行训练,得到所述目标风险识别模型。
在本实施例中,为了进一步提高目标风险识别模型的准确度,同时也为了应对可能存在的综合第一区域的样本数据和目标区域的样本数据仍无法满足目标风险模型的建模要求的情况,具体实施时,还可以获取多个基于不同区域的样本数据得到的风险识别模型,再结合目标区域的样本数据来建立对应目标区域的目标风险识别模型。
在本实施例中,目标区域的服务器所获取的多个风险识别模型分别为对应多个区域的服务器获取并根据本区域的样本数据通过模型训练得到的。其中,上述多个区域分别为与目标区域不同的区域。例如,多个区域可以包括:第一区域、第二区域、第三区域等等。
在本实施例中,目标区域的服务器在获取了多个风险识别模型后,可以先综合多个区域的建模经验,将多个风险识别模型进行融合,以得到初始的目标风险识别模型。
在本实施例中,上述融合所述多个风险识别模型,得到初始的目标风险识别模型,具体实施时,可以包括以下内容:根据多个区域与目标区域的近似程度确定对应多个风险识别模型的权重参数。例如,与目标区域的近似度较高的区域所对应风险识别模型的权重参数的数值可以设置得相对较大,与目标区域的近似度较低的区域所对应的风险识别模型的权重参数的数值可以设置得相对较小。再根据多个风险识别模型,以及对应的权重参数进行加权处理,得到上述初始的目标风险识别模型。当然,需要说明的是,上述所列举的融合方式只是一种示意性说明。具体实施时,根据具体的应用场景,还可以采用其他合适的方式来融合多个风险识别模型,得到初始的目标风险识别模型。对此,本说明书不作限定。
在本实施例中,目标区域的服务器在得到了上述初始的目标风险识别模型后,可以利用所获取的目标区域的样本数据,在目标区域中对初始的目标风险识别模型进行模型训练,以确定出初始的目标风险识别模型中还没有被确定的模型参数,从而得到了具有较高准确度的目标风险识别模型。
参阅图7所示,本说明书实施例提供了一种业务数据处理方法,其中,该方法具体可以应用于布设于目标区域的服务器一侧。具体实施时,该方法可以包括以下内容。
S71:获取目标区域中的目标数据;
S73:利用针对目标区域的目标业务处理模型对所述目标数据进行数据处理,得到业务处理结果,其中,所述目标业务处理模型为在目标区域中,根据目标区域的样本数据和第一业务处理模型得到的;所述第一业务处理模型为在第一区域中,利用第一区域的样本数据进行训练得到的。
在本实施例中,上述目标数据具体可以理解为目标区域中待处理的数据。例如,目标区域中识别风险等级的用户数据,或者目标区域中待分类的信息数据等等。对于上述目标数据的具体内容和类型,本说明书不作限定。
在本实施例中,上述目标业务处理模型具体可以理解为根据目标区域的样本数据,结合基于第一区域的样本数据所得到的能够反映建模经验的第一业务处理模型,所得到对应目标区域中目标数据的数据处理的模型。
在本实施例中,具体实施时,目标区域的服务器可以将待处理的目标数据作为模型输入,输入进上述目标业务处理模型中;目标业务处理模型可以对目标数据进行相应的数据处理,得到对应的模型输出,作为业务处理结果。从而可以利用综合目标区域的样本数据以及第一区域的第一业务处理模型得到的目标业务处理模型高效、准确地完成针对目标区域的目标数据的业务数据处理。
本说明书实施例提供了一种目标业务处理模型的建立方法,其中,该方法具体可以应用于布设于目标区域的服务器一侧。具体实施时,该方法可以包括以下内容。
S1:获取目标区域的样本数据,以及关于第一业务处理模型的模型数据,其中,所述第一业务处理模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域;
S2:根据所述模型数据,在目标区域中建立第一业务处理模型;
S3:在目标区域中,利用目标区域的样本数据,在目标区域中对第一业务处理模型进行训练,得到所述目标业务处理模型。
在本实施例中,通过上述方式可以在不获取使用第一区域的样本数据的情况下,综合利用目标区域的样本数据,以及基于第一区域的样本数据所得到的能够反映第一区域的建模经验的第一业务处理模型,高效、准确地得到对应于目标区域的业务数据处理的目标业务处理模型。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标区域中的目标用户的特征数据;利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
为了能够更加准确地完成上述指令,参阅图8所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口801、处理器802以及存储器803,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口801,具体可以用于获取目标区域中的目标用户的特征数据。
所述处理器802,具体可以用于利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
所述存储器803,具体可以用于存储处理器802所基于的相应的指令程序。
在本实施例中,所述网络通信端口801可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器802可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器803可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述用户风险的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标区域中的目标用户的特征数据;利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;根据所述识别结果,确定目标用户的风险等级。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图9所示,在软件层面上,本说明书实施例还提供了一种用户风险的确定装置,该装置具体可以包括以下的结构模块:
获取模块901,具体可以用于获取目标区域中的目标用户的特征数据;
处理模块902,具体可以用于利用针对目标区域的目标风险识别模型对目标用户的特征数据进行识别处理,得到识别结果;其中,所述目标风险识别模型为在目标区域中,根据目标区域的样本数据和第一风险识别模型得到的;所述第一风险识别模型为在第一区域中,利用第一区域的样本数据进行训练得到的;
确定模块903,具体可以用于根据所述识别结果,确定目标用户的风险等级。
在一个实施例中,所述目标用户的特征数据具体可以包括以下至少之一:目标用户的登录地址、目标用户的登录设备、目标用户的历史交易记录、目标用户的身份信息等。
在一个实施例中,所述装置具体还可以包括业务模块,具体可以用于根据目标用户的风险等级,向目标用户提供与所述风险等级匹配的业务。
在一个实施例中,所述第一风险识别模型具体可以按照以下方式获取:接收第一区域的服务器反馈的关于第一风险识别模型的模型数据,其中,所述第一区域为与目标区域不同的区域;根据所述模型数据,在所述目标区域中建立所述第一风险识别模型。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的用户风险的确定装置,由于通过先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据,再在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,进而可以通过处理模块和确定模块利用上述目标风险识别模型来识别确定目标区域中目标用户的风险等级,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的样本数据影响目标区域的模型训练的技术问题,从而能充分地利用第一区域积累的建模经验,通过迁移学习,在目标区域中建立针对目标区域的目标风险识别模型,并通过基于上述方式得到目标风险识别模型,综合了目标区域的样本数据,以及基于第一区域的样本数据得到的建模经验,高效、准确地识别确定出目标区域中目标用户的风险等级,降低了识别误差。
参阅图10所示,在软件层面上,本说明书实施例还提供了一种目标风险识别模型的建立装置,该装置具体可以包括以下的结构模块:
获取模块1001,具体可以用于获取目标区域的样本数据,以及关于第一风险识别模型的模型数据,其中,所述第一风险识别模型为在第一区域中利用第一区域的样本数据训练得到的初始模型,所述第一区域为与目标区域不同的区域;
建立模块1002,具体可以用于根据所述模型数据,在所述目标区域中建立第一风险识别模型;
训练模块1003,具体可以用于在目标区域中,利用所述目标区域的样本数据对第一风险识别模型进行训练,得到所述目标风险识别模型。
在一个实施例中,所述装置具体实施时,还可以用于将所述目标风险识别模型发送至第一区域的服务器,其中,所述第一区域的服务器用于利用第一区域的样本数据在所述第一区域中,对所述目标风险识别模型进行调整,得到调整后的目标风险识别模型,并反馈调整后的目标风险识别模型;接收调整后的目标风险识别模型;在目标区域中,利用目标区域的样本数据,在目标区域中对所述调整后的目标风险识别模型进行训练,以获取更新后的目标风险识别模型。
在一个实施例中,所述第一风险识别模型具体可以包括以下至少之一:神经网络模型、随机森林模型、梯度提升树模型等等。
由上可见,本说明书实施例提供的用户风险的确定装置,由于通过获取模块先获取目标区域的样本数据,以及在第一区域中利用第一区域的样本数据训练得到的第一风险识别模型,而不是第一区域的样本数据,再通过建立模块和训练模块在目标区域中利用目标区域的样本数据对第一风险识别模型进行模型训练得到针对目标区域的目标风险识别模型,解决了由于第一区域和目标区域之间的数据隔离导致的无法有效地迁移利用第一区域的数据资源的技术问题,从而能充分地利用第一区域积累的建模经验,通过迁移学习,高效、准确地在目标区域中建立针对目标区域的目标风险识别模型,提高了在目标区域中建立风险识别模型的准确度,以及建模效率。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。