具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
考虑到基于现有的业务风险的确定方法,在用于识别多个业务中的各个业务的业务风险时,往往会出现识别不够准确、效果不够理想的状况。
本申请首先对现有的两种业务风险的确定方法分别进行了分析和研究。发现基于现有方法中的第一种方法,具体实施时前,往往会先利用样本数据为对应每一个业务场景的业务风险识别分别建立并训练单独的识别模型;再通过对应的识别模型来识别用户在对应的一种业务场景下的业务风险。具体可以参阅图1所示。这种方法通过单独分析各个业务场景下的业务风险的识别特点,训练建立只对应一个业务场景的分立的识别模型,以专门对该业务场景的业务风险进行识别。再利用各个独立的识别模型分别对目标用户的属性数据进行识别,以分别单独预测目标用户在各个业务场景下的业务风险。但在识别模型的建立过程中,由于只关注本场景中的业务风险的识别特点,会忽略掉不同业务场景的业务风险识别之间所存在的共性特点,导致无法提取到不同业务场景中用于业务风险识别的共性特征,影响所建立的识别模型准确度,甚至还会使得所建立的识别模型存在过拟合的风险。同时,基于上述方法,在训练建立识别模型的过程中,针对每一业务场景必须分别使用对应业务场景的样本数据进行模型训练,即每一个样本数据可能只能用于一种或少数几种的业务场景的识别模型的训练,因此,还会存在样本数据利用率不高的问题,使得某一些业务场景的识别模型可能由于所对应的样本数据较少,使得训练得到的识别模型的准确度相对较低,进而又导致基于该识别模型进行业务风险的识别确定存在误差、不够准确。
而基于现有方法中的第二种方法,具体实施时前,往往会先利用样本数据只对一个笼统的业务风险的识别模型进行训练,得到一个可以识别确定多种业务场景下的业务风险的综合的识别模型;再通过该识别模型根据目标用户的属性数据,同时识别出该用户在多种业务场景下的业务风险。具体可以参阅图2所示。这种方法由于是将多种业务场景不作区分地放在一起进行学习、训练,缺乏对各个业务场景的精细刻画,即不能充分地表征出各个业务场景的业务识别的差异性,使得所建立的识别模型在识别不同业务场景下的业务风险时的准确度不够可靠,尤其当其中的一种业务场景与其他多个业务场景的差异化较大时,基于这种识别模型在识别该种业务场景下的业务风险的错误率会很高,导致无法基于上述方法得到识别模型往往不能同时准确地识别出各个业务场景下的具体的业务风险。
针对产生上述问题的根本原因,本说明书考虑可以在具体实施时前,建立并训练包括串联在一起的第一模型和第二模型的预设的业务风险识别模型。其中,第一模型被训练用于提取用于进行多种业务场景的业务风险识别的特征数据。这样可以避免模型遗漏掉不同业务场景下的业务风险识别共性特征,使得所提取的特征数据更加丰富、全面。同时,第二模型具体包括有多个并联的子模型,其中,每一个子模型又分别对应于一种业务场景下的业务风险的识别。这样可以有区分地对每一个业务场景下的业务风险的识别进行有针对性的训练,从而可以对每一个业务场景下的业务风险都进行精细的刻画,避免模型遗漏掉各个业务场景下的业务风险识别的差异化特征。再基于上述训练好的预设的业务风险识别模型对用户的属性数据进行处理:通过第一模型提取得到内容丰富的特征数据,再通过第二模型所包含的多个并联的子模型分别对各个业务场景下的业务风险进行预测确定,从而能高效、准确地同时预测出用户在多个业务中的各个业务的业务风险,解决了现有方法中存在的由于无法兼顾有效挖掘并利用多个业务风险识别之间的共性特征和对各个业务风险识别进行精细描述,导致在识别用户在多个业务中的具体业务风险时存在的确定结果不够准确、误差大的问题。
本说明书实施例提供一种业务风险的确定方法,所述业务风险的确定方法具体可以应用于包含有服务器和客户端的系统架构中。具体可以参阅图3所示。客户端和服务器可以通过有线或无线的方式耦合,以便可以相互之间进行数据的交互。
其中,客户端具体可以用于接收待确定业务风险的用户,即目标用户的属性数据,并将目标用户的属性数据发送至服务器。服务器具体可以用于获取目标用户的属性数据;利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别;根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。进一步,服务器还可以根据目标用户在多个业务中的业务风险,为目标用户选择风险合适的业务作为目标业务,推荐给该目标用户。
在本实施例中,所述服务器可以是一种应用于网络平台的后台一侧,能够实现数据传输、数据处理等功能的后台业务服务器。具体的,所述服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施方式中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述客户端可以是一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端设备。具体地,所述客户端例如可以为台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、具有网络访问功能的电视机等。或者,所述客户端也可以为能够运行于上述电子设备中的软件应用。例如,可以是在手机上运行的某APP等。
在一个场景示例中,可以参阅图4所示,XX支付网站应用本说明书实施例所提供的业务风险的确定方法为用户甲预测对应于对待推广的A、B、C、D这4种不同的投资产品的准入风险,再向用户甲推荐合适的投资产品。
具体实施时,XX支付网站的后台系统的服务器可以通过用户甲的客户端获取用户甲的属性数据。例如,用户甲的过去参与过的投资的历史记录、用户甲计划投入的资源数据、用户甲剩余可自由支配的资源数据、用户甲的风险意识调查数据、用户甲的常用的投资策略等等。当然,上述所列举的属性数据只是一种示意性说明,具体实施时,根据具体的应用场景还可以引入其他类型的数据的作为上述属性数据。对此,本说明书不作限定。
服务器在获取了用户甲的上述属性数据后,可以将上述属性数据作为模型输入,输入进事先通过对样本数据进行学习训练所建立的,用于预测用户针对上述4中投资产品的准入风险的预设的业务风险识别模型中。
其中,可以参阅图4所示,上述预设的业务风险识别模型的模型结构不同于普通的识别模型,包括第一模型和第二模型两个部分。其中,第二模型包含有4个业务子模型:A模型、B模型、C模型和D模型,分别用于识别用户针对投资产品A、B、C、D的准入风险的。具体的,A模型可以为一种训练好的只用于识别用户针对投资产品A的准入风险的识别器,B模型可以为一种训练好的只用于识别用户针对投资产品B的准入风险的识别器,C模型可以为一种训练好的只用于识别用户针对投资产品C的准入风险的识别器,D模型可以为一种训练好的只用于识别用户针对投资产品D的准入风险的识别器。第一模型为一种训练好的用于提取4种业务子模型在进行准入风险识别时所需要的特征数据的特征表示结构。
参阅图4所示,进一步可知,上述第一模型与第二模型串联,且第二模型中所包括的4个业务子模型:A模型、B模型、C模型和D模型。这样由第一模型根据输入的用户的属性数据所提取出的特征数据可以作为第二模型的输入,分别输入进:A模型、B模型、C模型和D模型中,以便得到上述4个业务子模型的输出结果。
在本实施例中,服务器可以将用户甲的属性数据作为输入数据输入至预设的业务风险识别模型中,这时该属性数据会先输入进第一模型中。已经训练好的第一模型可以对用户甲的属性数据进行识别处理,提取出对应用户甲的特征数据,作为第一模型的输出数据。由于地模型与第二模型是串联的,所以可以将第一模型所得到的上述用户甲的特征数据作为第二模型的输入数据输入至第二模型中。
又由于第二模型中的A模型、B模型、C模型和D模型是并联的业务子模型。因此,输入进第二模型的特征数据会进一步分成4组,作为4组输入数据并行输入进A模型、B模型、C模型和D模型中。已经训练好的A模型、B模型、C模型和D模型可以分别根据所接收到的用户甲的特征数据对用户甲对所对应的投资产品的准入风险进行预测。具体的,A模型可以基于自身的模型识别器,根据用户甲的特征数据进行识别处理,得到用户甲对应于投资产品A的准入风险a作为A模型的输出结果。B模型可以基于自身的模型识别器,根据用户甲的特征数据进行识别处理,得到用户甲对应于投资产品B的准入风险b作为B模型的输出结果。C模型可以基于自身的模型识别器,根据用户甲的特征数据进行识别处理,得到用户甲对应于投资产品C的准入风险c作为C模型的输出结果。D模型可以基于自身的模型识别器,根据用户甲的特征数据进行识别处理,得到用户甲对应于投资产品D的准入风险d作为D模型的输出结果。
预设的业务风险识别模型可以将上述4个业务子模型分别得到4个输出结果做一个结果数据输出,而该结果数据包含有用户甲分别对应于投资产品A、B、C和D的4种准入风险。服务器得到了上述结果数据,进而可以对上述结果数据进行解析处理,从而可以确定出:用户甲对应于投资产品A的准入风险a、用户甲对应于投资产品B的准入风险b、用户甲对应于投资产品C的准入风险c、用户甲对应于投资产品D的准入风险d。
进一步,服务器可以根据用户甲对应上述4种不同投资产品的准入风险,结合由用户根据自身情况设置的预设的风险阈值,从上述4种不同的投资产品筛选出准入风险小于预设的风险阈值的投资产品A和C作为适用于用户甲的投资产品。并将生成关于上述投资产品A和C的推荐信息,以及投资产品A和C的相关链接发送至客户端。再由客户端向用户甲展示投资产品A和C的推荐信息,以及投资产品A和C的相关链接。由于上述筛选出的两种投资产品是符合用户甲设置的预设的风险阈值的,能够较为精准地贴合于用户甲的需求,用户甲的用户体验也会相对较好。进而,用户甲也会更有可能去选择投资所推荐的投资产品A和C,促进成单。
在另一个场景示例中,可以参阅图5所示,服务器在利用上述预设的业务风险识别模型从4种不同的投资产品中确定适合用户甲的投资产品进行推荐之前,还可以先通过对样本数据的学习训练,建立用于预测用户针对4种投资产品的准入风险的预设的业务风险识别模型。
具体实施时,服务器可以随机抽取XX支付网站的注册用户作为测试用户,并获取例如上述测试用户的对应的过去参与过的投资的历史记录、计划投入的资源数据、可自由支配的资源数据、风险意识调查数据等属性数据作为样本数据。再利用上述4种投资产品:A、B、C、D对上述测试用户分别进行测试,并采集相应的测试数据。根据所采集的测试数据分别计算每一个测试用户分别对应于投资产品A、B、C、D的风险值。再利用所计算出的风险值在对应用户的属性数据上依次标注出该用户所对应的投资产品A、B、C、D的风险值,得到标注后的样本数据。例如,在测试用户乙的属性数据中标注出用户对应于投资产品A的风险值为5,对应于投资产品B的风险值为4,对应于投资产品C的风险值为1,对应于投资产品D的风险值为4。
在完成上述标注,得到上述标注后的样本数据后。需要先建立用于学习训练的初始的预设模型。考虑到在预设的业务风险识别模型中,第一模型和第二模型需要串联,以便第二模型可以获取第一模型的输出数据作为输入数据使用。因此,具体实施时,可以选择可微分结构的模型作为预设结构的初始模型来使用,以建立第一模型和第二模型。
具体的,可以选择神经网络模型这种可微分结构的模型作为上述预设结构的初始模型来使用。当然,上述所列举的神经网络模型只是一种示意性说明。具体实施时,根据具体情况和处理要求也可以选取使用其他可微分结构的模型作为上述预设结构的初始模型使用。对此,本说明书不作限定。
具体实施时,可以选取基于神经网络模型的特征表示结构模型作为预设结构的初始模型,来建立初始的第一模型,可以记为f(x)。同时,可以选取4个同样基于神经网络模型的识别器结构模型作为预设结构的初始模型,可以分别记为g_A(y)、g_B(y)、g_C(y)、g_D(y),并将上述4个预设结构的初始模型并联,建立得到第二模型。在得到上述第一模型和第二模型后,可以通过梯度数据将上述第一模型和第二模型串联在一起,得到对应的初始的预设模型,可以记为Y=(g_A(f(x))、g_B(f(x))、g_C(f(x))、g_D(f(x)))。
进一步,可以利用之前获取的标注后的样本数据对上述初始的预设模型进行学习、训练。在具体进行模型学习、训练时,可以获取并根据每次学习、训练时对应4g_A(y)、g_B(y)、g_C(y)、g_D(y)4个模型的损失函数,通过反向传播算法(Back-propagation,BP),沿着待确定的网络参数的反梯度方向不断地搜索最优点,进行优化直至收敛。从而可以逐步优化调整上述初始的预设模型中的网络参数,最终得到预设模型中的收敛、稳定的网络参数,完成了模型的学习、训练,得到了预设的风险识别模型。进而后续可以利用上述训练好的预设的风险识别模型根据任意用户的属性数据,准确地预测出该用户分别对应于投资产品A、投资产品B、投资产品C、投资产品D的准入风险。
需要说明的是,由于在学习、训练的过程中,第一模型是对标注有对应多个投资产品的风险值的用户的属性数据不作区分地统一进行学习、训练的,因此,最终通过学习、训练得到的预设的业务风险的识别模型中的第一模型可以不受某个单独的投资产品的场景制约,除了能提取出对应单个的投资产品的风险识别的特征数据,还能提取到对应不同投资产品的风险识别之间的共有的特征数据,即共性特征。又由于在学习、训练的过程中,第二模型所包含的多个并联的业务子模型是相互独立、并列地利用相同的特征数据分别进行对应的投资产品的风险识别的学习、训练的,因此,最终通过学习、训练得到的预设的业务风险的识别模型中的第二模型所包含的多个业务子模型可以分别精细地刻画出所对应的投资产品的风险识别时的特点和区别,进而可以基于上述第二模型有针对性地分别识别出所对应的4个投资产品中各个投资产品具体的风险值。
由上述场景示例可见,本说明书提供的业务风险的确定方法,由于通过利用预先训练好的即包含有用于统一提取对应多个业务风险识别的特征数据的第一模型,又包含有用于有区分性地基于统一提取的特征数据能对多个业务风险有针对性地进行识别确定的第二模型的预设的业务风险识别模型来对目标用户的属性数据进行处理,进而根据处理得到结果数据确定出目标用户在多个业务中的各个业务的业务风险,有效地避免遗漏掉不同业务风险识别之间的共性特征,同时也能分别对不同的业务风险进行精细识别,从而能高效、准确地同时预测出目标用户在多个业务中的各个业务的业务风险,解决了现有方法中存在的由于无法兼顾有效挖掘并利用多个业务风险识别之间的共性特征和对各个业务风险识别进行精细描述,导致在识别目标用户在多个业务中的具体业务风险时存在的确定结果不够准确、误差大的问题。
参阅图6所示,本说明书实施例提供了一种业务风险的确定方法,其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容:
S61:获取目标用户的属性数据。
在实施例中,上述目标用户具体可以理解为一种待预测对应的业务风险、待推荐风险合适的业务的用户。具体的,例如,可以是待推荐风险合适的投资产品的用户,也可以是待推荐风险合适的线上收银方案的商户,还可以是待推荐风险合适的生产方案的工厂等等。当然,上述所列举的目标用户只是为了更好地说明本实施例。对于目标用户的具体类型,本说明书不作限定。需要补充的,上述目标用户还可以是只需要预测所对应的业务风险,不需要推荐风险合适的业务的用户。
在本实施例中,上述属性数据具体可以理解为一种针对用户的与待预测的业务风险的业务相关的参数数据。具体实施时,根据业务所涉及的应用场景不同,上述属性数据可以包括不同类型的参数数据。例如,以向用户推荐风险合适的投资产品的应用场景为例,所对应的属性数据具体可以包括:用户参与过的投资产品(即业务)的历史记录、计划投入的资源数据(例如计划投资的金额)、用户剩余的资源数据(例如用户剩余可支配的金额)、用户的风险意识调查数据等等。其中,上述用户的风险意识调查数据可以通过对用户进行关于风险意识的问卷调查采集得到。需要说明的是,上述所列举的属性数据只是一种示意性说明。具体实施时,根据具体的应用场景,还可以引入其他类型的数据作为上述属性数据。例如,根据具体的应用场景,还可以获取目标用户的历史交易记录(具体可以包括:历史交易的金额、余额、交易次数,以及交易对象的优质程度等信息)、客户端内置传感器所记录的目标用户的运动参数(具体可以包括:GPS位置、用户位移、霍尔传感器的变化值、加速度传感器的变化值等参数)、目标用户的行为记录(具体可以包括:目标用户的每个动作的统计计数和分布、每个动作之间的发生的时间间隔等)等作为属性数据。对此,本说明书不作限定。
在本实施例中,上述获取目标用户的属性数据,具体实施时,服务器可以通过布设于目标用于一侧的客户端获取该目标用户的属性数据。具体的,服务器可以通过预设于客户端的程序模块,自动搜集目标用户的属性数据,也可以由目标用户自行通过客户端输入并向服务器发送对应的属性数据等。对此,本说明书不作限定。
S63:利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别。
在本实施例中,上述预设的业务风险识别模型具体可以理解为一种事先通过对样本数据的学习、训练,所建立起来的既能够提取包括多个业务的业务风险识别之间的共性特征在内的用于多个业务风险识别的统一的特征数据;又能够分别根据各个业务的业务风险识别的特点和区别,基于同一的特征数据,对各个业务的业务风险分别进行有针对性的预设和确定的模型。
在本实施例中,上述预设的业务风险识别模型的模型结构区别于现有方法中所使用的识别模型。上述预设的业务风险识别模型具体可以包括有串联在一起的第一模型和第二模型两个部分。其中,上述第一模型可以用于基于用户的属性数据提取用于对应多种业务的业务风险识别的统一的特征数据。上述第二模型具体可以包括有多个并联在一起的业务子模型,其中,上述多个并联在一起的业务子模型中的各个业务子模型分别可以理解为一个已经训练好的,对应于一个业务的业务风险识别的识别器。又由于第一模型和第二模型串联。因此,通过上述第二模型可以获取第一模型输出的特征数据作为模型输入,再基于上述特征数据,通过并联的多个业务子模型分别基于特征数据,有针对性地对用户对应于各个业务的业务风险进行预测确定。
在本实施例中,具体实施时,服务器可以先通过预设的业务风险识别中的第一模型根据目标用户的属性数据,得到对应该目标用户的特征数据。再将上述特征数据作为第二模型的输入数据,传输至第二模型。第二模型中并联的多个业务子模型分别根据上述特征数据进行识别处理,得到该目标用户在所对应的业务的中业务风险作为业务子模型的输出结果。再将上述基于并联的多个业务子模型得到的多个输出结果进行合并,得到了对应该目标用户的结果数据,作为该预设的业务风险的识别模型的输出结果。
通过上述预设的业务风险识别可以有效地挖掘并利用不同业务的业务风险识别之间的共性特征,同时也可以区分不同业务的业务风险识别,有针对性地分别预测确定对应业务的业务风险,进而可以使得所得到输出结果更加的准确、可靠。
S65:根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。
在本实施例中,在得到目标用户的结果数据后,服务器可以对通过对上述结果数据进行解析处理,确定出该目标用户在多个业务中的各个业务的具体业务风险。
在本实施例中,在得到上述目标用户在多个业务中的各个业务的具体业务风险后,进一步,服务器可以根据上述业务风险,筛选出业务风险适合目标用户的业务推荐给目标用户。例如,可以筛选出业务风险最小的业务推荐给目标用户。也可以根据用户设置的预设的风险条件,筛选出业务风险满足预设的风险条件的业务推荐给用户。还可以不作推荐,而直接将目标用户对应于各个业务的业务风险发送给客户端,并通过客户端展示给用户,供用户参考等等。当然,需要说明的是,上述所列举的应用方式只是一种示意性说明。
由上可见,本说明书实施例提供的业务风险的确定方法,由于通过利用预先训练好的即包含有用于统一提取对应多个业务风险识别的特征数据的第一模型,又包含有用于有区分性地基于统一提取的特征数据能对多个业务风险有针对性地进行识别确定的第二模型的预设的业务风险识别模型来对目标用户的属性数据进行处理,进而根据处理得到结果数据确定出目标用户在多个业务中的各个业务的业务风险,有效地避免遗漏掉不同业务风险识别之间的共性特征,同时也能分别对不同的业务风险进行精细识别,从而能高效、准确地同时预测出目标用户在多个业务中的各个业务的业务风险,解决了现有方法中存在的由于无法兼顾有效挖掘并利用多个业务风险识别之间的共性特征和对各个业务风险识别进行精细描述,导致在识别目标用户在多个业务中的具体业务风险时存在的确定结果不够准确、误差大的问题。
在一个实施例中,所述目标用户的属性数据具体可以包括以下至少之一:目标用户参与过的业务的历史记录、目标用户计划投入的资源数据、目标用户剩余的资源数据、目标用户的风险意识调查数据等等。当然,需要说明的是,上述所列举的属性数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理需求还可以引入其他类型的数据作为上述属性数据。对此,本说明书不作限定。
在一个实施例中,在根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险后,所述方法具体实施时,还可以包括以下内容:从所述多个业务中筛选出业务风险值小于目标用户预设的风险值阈值的业务作为目标业务;向所述目标用户推荐所述目标业务。
在本实施例中,上述目标用户预设的风险阈值具体可以由目标用户根据自身情况自己设置一个风险阈值。也可以是服务器结合用户的风险意识调查数据,结合用户以往参与过的业务的历史记录所自动生成的适合于目标用户的一个风险阈值的参考数值等等。对于上述目标用户预设的风险阈值的具体获取方式,本说明书不作限定。
在本实施例中,通过上述方式筛选出的目标业务是贴合目标用户的具体情况、风险合适的业务,因此目标用户会更容易接受并参与该目标业务,从而能提高用户体验。
在一个实施例中,所述预设的业务风险识别模型具体可以按照以下方式建立:选取预设结构的初始模型,以建立初始的第一模型;选取多个预设结构的初始模型并联,以建立初始的第二模型,其中,所述初始的第二模型中的并联的多个预设结构的初始模型用于生成对应的并联的多个业务子模型;利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型;获取标注后的样本数据,并利用标注后的样本数据对所述初始的预设模型进行模型训练,得到所述预设的业务风险识别模型。
在本实施例中,考虑到需要将第一模型和第二模型串联在一起才能得到预设的业务风险识别模型,为了便于后续将第一模型和第二模型拼接在一起,可以选取适合于进行拼接的模型结构作为预设结构的初始模型,进而可以基于预设结构的初始模型分别建立第一模型和第二模型。
在本实施例中,具体实施时,可以选择使用可微分结构的模型作为预设结构的初始模型。这样基于上述预设结构的初始模型得到的第一模型和第二模型后续可以通过梯度数据串联在一起。具体的,可以选用满足可微分结构的神经网络模型作为预设结构的初始模型等。当然,需要说明的是,上述所列举的神经网络模型只是一种示意性说明。具体实施时,根据具体情况,也可以选用其他合适的可微分结构模型作为上述预设结构的初始模型。对此,本说明书不作限定。
在本实施例中,具体实施时,可以选取基于例如神经网络等预设结构的初始模型作为相应的特征表示结构,作为初始的第一模型,可以记为f(x),其中,x具体可以表示为第一模型的输入数据。可以选取多个基于例如神经网络等预设结构的初始模型作为对应业务的业务风险的识别器进行并联,得到初始的第二模型,可以记为g_i(y),其中,i具体可以表示第二模型中的业务子模型的编号,y具体可以表示为第二模型的输入数据。
在本实施例中,在按照上述方式得到初始的第一模型和初始的第二模型后,可以根据梯度数据,将上述两种模型拼接在一起的初始的预设模型,可以记为g_i(f(x))。进一步,可以利用标注后的样本数据对上述初始的预设模型进行学习、训练,以不断优化确定出上述初始的预设模型中的各个网络参数,得到最终的预设的业务风险识别模型。
在本实施例中,上述利用标注后的样本数据对所述初始的预设模型进行模型训练,具体实施时,可以包括以下内容:分别向初始的预设模型输入标注后的样本数据,得到对应的测试结果数据;根据上述测试结果数据,计算模型的损失函数;根据模型的损失函数,多次优化、调整初始的预设模型中的网络参数,从而获得上述预设的风险识别模型。
具体的,以输入标注后的样本数据v为例,可以得到初始的预设模型的输出数据,即测试结果数据为:Y_v=(g_1(f(v))、g_2(f(v))…g_i(f(v))…g_n-1(f(v))、g_n(f(v)))。其中,i可以表示为第二模型中的业务子模型的编号,n为第二模型中的业务子模型的数量。进一步,可以根据上述测试结果数据计算模型的损失函数:Loss(v,Y)=loss_1(v,g_1(f(v))+loss_2(v,g_2(f(v))+…+loss_i(v,g_i(f(v))+…+loss_n-1(v,g_n-1(f(v))+loss_n(v,g_n(f(v))。其中,Loss(v,Y)具体可以表示为初始的预设模型针对当前输入的标注后的样本数据v的损失函数,即模型损失函数,loss_i(v,g_i(f(v))具体可以表示为第二模型中的编号为i的业务子模型针对当前输入的标注后的样本数据v的损失函数。按照上述方式,可以计算得到对应每一个标注后的样本数据的模型损失函数,得到多个模型损失函数。进一步可以根据上述多个模型损失函数按照预设的优化规则不断地优化、调整初始的预设模型中网络参数,最终得到预设的业务风险的识别模型。
在本实施例中,具体实施时,可以根据上述多个模型损失函数,通过利用梯度后传的算法(或者反向传播算法,BP)对模型中的网络参数θ进行多次迭代学习,直至收敛。具体的,可以先对损失函数求取关于网络参数θ的梯度,再通过梯度下降的方法,不断地对网络参数θ进行优化调整,逼近得到一个稳定的网络参数θ,从而确定出模型网络,得到预设的业务风险识别模型。当然,需要说明的是,上述所列举的对初始的预设模型进行学习、训练得到预设的业务风险识别模型的方式只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他合适的方式来得到预设的业务风险的识别模型。对此,本说明书不作限定。
在本实施例中,上述通过梯度下降的方法,不断地对网络参数θ进行优化调整,具体可以包括,通过以下所列举的一种或多种梯度下降的方法,不断地对网络参数θ进行优化调整:随机梯度下降法、动量下降法、拟牛顿下降法等等。当然,需要说明的是,上述所列举的梯度下降的方法只是一种示意性说明。具体实施时,根据具体情况也可以采用除上述所列举的方法以外其他合适的方法作为梯度下降的方法来对网络参数进行优化调整。对此,本说明书不作限定。
在一个实施例中,在利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型后,所述方法具体实施时,还可以包括以下内容:确定多个业务中各个业务的关注度;根据所述多个业务中的各个业务的关注度,设置所述第二模型中的各个业务子模型所对应的损失函数的权重参数。
在本实施例中,具体实施时,可以根据具体的应用场景和处理要求灵活地确定不同业务的关注度。例如,大多数用户都对业务A感兴趣,则可以将业务A的关注度设置得相对其他业务的关注度更高。又例如,多个业务中业务B的业务风险的预测难度相对更高,为了保证针对业务B的业务风险的预测的准确度,可以将业务B的关注度设置得相对更高等等。当然,需要说明的是,上述所列举的确定各个业务的关注度的方式只是一种示意性说明。具体实施时,可以根据具体情况灵活地设置各个业务的关注度。对此,本说明书不作限定。
在本实施例中,具体实施时,可以根据各个业务的关注度设置对应业务子模型的损失函数的权重参数。具体的,例如,对于某个关注度较高的业务,可以将与该业务对应的业务子模型的损失函数的权重参数的数值设置得相对较大。对于某个关注度较低的业务,可以将与该业务对应的业务子模型的损失函数的权重参数的数值设置得相对较小。进而后续结合上述方式确定的权重参数和损失函数,利用标注后的样本数据对初始的预设模型进行学习、训练时,第一模型所涉及的特征数据提取的训练方向会向权重参数较大的,即关注度较高的业务所对应的业务子模型偏移。例如,在计算模型的损失函数时,可以按照以下方式结合各个业务子模型的权重参数,来计算:Loss(v,Y)=h_1·loss_1(v,g_1(f(v))+h_2·loss_2(v,g_2(f(v))+…+h_i·loss_i(v,g_i(f(v))+…+h_n-1·loss_n-1(v,g_n-1(f(v))+h_n·loss_n(v,g_n(f(v)),其中,h_i具体可以表示为编号为i的业务所对应的业务子模型的权重参数。这样可以有针对性地在学习、训练的过程中,通过调整损失函数中的业务子模型的权重参数调整模型参数,从而对第一模型的训练方向进行调整,向较为关注的业务所对应的业务子模型偏移,使得后续基于第一模型所提取得到的特征数据对较为关注的业务所对应的业务子模型具有相对更高的使用价值,进而可以使得基于第二模型所得到的对应于较为关注的业务的业务风险具有相对更高的准确度。
在一个实施例中,上述获取标注后的样本数据,具体实施时,可以包括以下内容:获取样本数据;在所述样本数据中标注出对应多个业务的业务风险值,得到标注后的样本数据。
在本实施例中,上述样本数据具体可以理解为一种预先采集获取的用于进行模型训练的测试用户的属性数据。具体的,上述样本数据可以包括:测试用户参与过的投资产品(即业务)的历史记录、测试用户计划投入的资源数据(例如计划投资的金额)、测试用户剩余的资源数据(例如用户剩余可支配的金额)、测试用户的风险意识调查数据等等。需要说明的是,上述所列举的样本数据只是一种示意性说明。具体实施时,根据具体的应用场景,还可以引入其他类型的数据作为上述样本数据。对此,本说明书不作限定。
在本实施例中,在获取了上述样本数据后可以根据预设的判定规则,根据测试用户的属性数据对测试用户对应多个业务中的各个业务的业务风险值进行计算,得到各个业务的风险值,再在该测试用户所对应的样本数据中标注出各个业务的风险值,从而完成了标注,得到了标注后的样本数据。
在本实施例中,具体实施时,可以直接在样本数据中标注出对应各个业务的业务风险的具体数值作为上述各个业务风险值。也可以根据各个业务风险的具体数值,在样本数据中标注出对应的业务的风险级别作为上述各个业务风险值等等。当然,上述所列举的标注方式只是一种示意性说明。对此,本说明书不作限定。
在一个实施例中,所述预设结构的初始模型具体可以包括:可微分结构的模型等。
在本实施例中,为了能够使得所得到的预设的业务风险识别模型中所包括的第一模型和第二模型能够准确、有效地连接在一起,以便第二模型可以以第一模型的模型输出作为模型输入,进行具体业务风险确定,因此可以选用可微分结构的模型作为预设结构的初始模型,来建立初始的第一模型和初始的第二模型,以便后续可以通过基于微分的梯度数据将两种模型串联在一起。
在本实施例中,上述可微分结构的模型具体可以包括神经网络模型等。当然,上述所列举的神经网络模型只是一种示意性说明。具体实施时,根据具体情况还可以选择使用其他类型合适可微分结构模型作为预设结构的初始模型。对此,本说明书不作限定。
由上可见,本说明书实施例提供的业务风险的确定方法,由于通过利用预先训练好的即包含有用于统一提取对应多个业务风险识别的特征数据的第一模型,又包含有用于有区分性地基于统一提取的特征数据能对多个业务风险有针对性地进行识别确定的第二模型的预设的业务风险识别模型来对目标用户的属性数据进行处理,进而根据处理得到结果数据确定出目标用户在多个业务中的各个业务的业务风险,有效地避免遗漏掉不同业务风险识别之间的共性特征,同时也能分别对不同的业务风险进行精细识别,从而能高效、准确地同时预测出目标用户在多个业务中的各个业务的业务风险,解决了现有方法中存在的由于无法兼顾有效挖掘并利用多个业务风险识别之间的共性特征和对各个业务风险识别进行精细描述,导致在识别目标用户在多个业务中的具体业务风险时存在的确定结果不够准确、误差大的问题;还通过在训练预设的业务风险的识别模型时,先根据具体情况和处理需求,确定各个业务的关注度;再通过根据各个业务的关注度,设置各个业务子模型所对应的损失函数的权重参数,以对第一模型所涉及的特征数据提取的训练方向进行有针对性的调整和偏移,从而能够更加贴合具体情况,得到更加准确的预设的业务风险的识别模型,进而基于该模型可以提高所确定的目标用户在各个业务中的业务风险的准确度。
参阅图7所示,本说明书实施例还提供了一种模型训练方法,以建立能高效、准确地同时针对多个场景下的数据进行处理的预设的多场景处理模型。其中,该方法具体实施时,可以包括以下内容:
S71:选取预设结构的初始模型,以建立初始的第一模型,其中,所述初始的第一模型用于生成第一模型,所述第一模型用于提取特征数据;
S73:选取多个预设结构的初始模型并联,以建立初始的第二模型,其中,所述初始的第二模型用于生成第二模型,所述第二模型包括多个并联的场景子模型,所述多个场景子模型分别用于得到对应场景下的处理数据,所述多个场景子模型根据所述并联的多个预设结构的初始模型生成;
S75:利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型;
S77:获取标注后的样本数据,并利用标注后的样本数据对所述初始的预设模型进行模型训练,得到预设的多场景处理模型,其中,所述预设的多场景处理模型包括串联的第一模型和第二模型。
在本实施例中,为了能够将第一模型和第二模型串联在预设的多场景处理模型中,可以选择可微分结构的模型作为预设结构的初始模型来建立初始的第一模型和初始的第二模型,并将初始的第一模型和初始的第二模型连接在一起。
在本实施例中,上述可微分结构的模型具体可以包括神经网络模型等等。当然,上述所列举的神经网络模型只是一种示意性说明。具体实施时,根据具体情况,也可以选择使用其他合适类型的可微分结构的模型作为上述预设结构的初始模型。对此,本说明书不作限定。
在本实施例中,初始的第二模型包括并联的多个预设结构的初始模型,其中,上述多个预设结构的初始模型分别对应于学习、训练后得到的预设的多场景处理模型中第二模型所包括的并联的多个场景子模型。
在本实施例中,上述每一个场景子模型分别对应一种场景下的数据处理,用于得到对应该种场景下基于输入数据的处理数据。这样后续可以通过训练好的预设的多场景处理模型同时得到多个场景下对应的处理数据。
在本实施例中,上述多个场景具体可以是多个业务场景,多个产品场景,或者多个任务场景等等。对于上述场景,本说明书不作限定。
在本实施例中,上述多个场景下的数据处理具体可以是多个场景下的风险识别,多个场景下的收益预测,或者多个场景下的用户接收度的预测等等。对此,本说明书不作限定。
在本实施例中,上述获取标注后的样本数据,具体实施时,可以包括:获取样本数据;确定样本数据在多个场景下的处理数据;在所述样本数据中标注出所对应的各个场景的处理数据,得到标注后的样本数据。
在本实施例中,在利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型后,所述方法具体实施时,可以包括以下内容:确定多个场景中各个场景的关注度;根据所述多个场景中的各个场景的关注度,设置第二模型中的各个场景子模型所对应的损失函数的权重参数。进而后续对初始的预设模型进行学习、训练时,可以结合各个场景子模型所对应的损失函数的权重参数,利用标注后的样本数据对所述初始的预设模型进行模型训练来优化模型的网络参数,从而可以通过权重参数对第一模型的训练方向进行调整,得到更满足个性化要求的预设的多场景处理模型。
本说明书实施例还提供了一种数据处理方法,以利用根据上述方法所建立的预设的多场景处理模型高效、准确地进行多场景下的数据处理。其中,该方法具体实施时,可以包括以下内容:
S1:获取目标属性数据;
S2:利用预设的多场景处理模型根据所述目标属性数据,得到结果数据;其中,所述预设的多场景处理模型包括串联的第一模型和第二模型,所述第一模型用于提取特征数据,所述第二模型包括多个并联的场景子模型,所述多个场景子模型分别用于得到对应场景下的处理数据;
S3:根据所述结果数据,确定多个场景下的处理数据。
在本实施例中,按照上述方式可以利用预先训练好的预设的多场景处理模型,对输入的目标属性数据同时进行多场景的数据处理,从而可以高效、准确地得到多个场景下对应的处理数据,完成多场景下的数据处理。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标用户的属性数据;利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别;根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。
为了能够更加准确地完成上述指令,参阅图8所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口801、处理器802以及存储器803,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口801,具体可以用于获取目标用户的属性数据。
所述处理器802,具体可以用于利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别;根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。
所述存储器803,具体可以用于存储处理器802所基于的相应的指令程序。
在本实施例中,所述网络通信端口801可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器802可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器803可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述业务风险的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标用户的属性数据;利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别;根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图9所示,在软件层面上,本说明书实施例还提供了一种以风险的确定装置,该装置具体可以包括以下的结构模块:
获取模块901,具体可以用于获取目标用户的属性数据;
处理模块902,具体可以用于利用预设的业务风险识别模型根据所述目标用户的属性数据,得到针对目标用户的结果数据;其中,所述预设的业务风险识别模型包括串联的第一模型和第二模型,所述第一模型用于提取用于业务风险识别的特征数据,所述第二模型包括多个并联的业务子模型,所述多个业务子模型分别对应于一种业务的业务风险的识别;
确定模块903,具体可以用于根据所述目标用户的结果数据,确定目标用户在多个业务中的业务风险。
在一个实施例中,所述目标用户的属性数据具体可以包括以下至少之一:目标用户参与过的业务的历史记录、目标用户计划投入的资源数据、目标用户剩余的资源数据、目标用户的风险意识调查数据等等。
在一个实施例中,所述装置具体还可以包括推荐模块,具体可以用于从所述多个业务中筛选出业务风险值小于目标用户预设的风险值阈值的业务作为目标业务;向所述目标用户推荐所述目标业务。
在一个实施例中,所述装置具体还可以包括建立模块,具体可以用于建立预设的业务风险识别模型,所述建立模块具体可以包括以下结构单元:
第一建立单元,具体可以用于选取预设结构的初始模型,以建立初始的第一模型;
第二建立单元,具体可以用于选取多个预设结构的初始模型,以建立初始的第二模型,其中,所述初始的第二模型中的并联的多个预设结构的初始模型用于生成对应的并联的多个业务子模型;
第三建立单元,具体可以用于利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型;
获取单元,具体可以用于获取标注后的样本数据;
训练单元,具体可以用于利用标注后的样本数据对所述初始的预设模型进行模型训练,得到所述预设的业务风险识别模型。
在一个实施例中,所述获取单元,具体实施时,可以用于获取样本数据;在样本数据中标注出对应多个业务的业务风险值,得到标注后的样本数据。
在一个实施例中,所述预设结构的初始模型具体可以包括:可微分结构的模型等等。
在一个实施例中,所述第三建立单元具体还可以用于在利用梯度数据连接所述初始的第一模型和所述初始的第二模型,以建立初始的预设模型后,确定多个业务中各个业务的关注度;根据所述多个业务中的各个业务的关注度,设置多个业务子模型中各个业务子模型所对应的损失函数的权重参数。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的业务风险的确定装置,由于通过处理模块利用预先训练好的即包含有用于统一提取对应多个业务风险识别的特征数据的第一模型,又包含有用于有区分性地基于统一提取的特征数据能对多个业务风险有针对性地进行识别确定的第二模型的预设的业务风险识别模型来对目标用户的属性数据进行处理,进而通过确定模块根据处理得到结果数据确定出目标用户在多个业务中的各个业务的业务风险,有效地避免遗漏掉不同业务风险识别之间的共性特征,同时也能分别对不同的业务风险进行精细识别,从而能高效、准确地同时预测出目标用户在多个业务中的各个业务的业务风险,解决了现有方法中存在的由于无法兼顾有效挖掘并利用多个业务风险识别之间的共性特征和对各个业务风险识别进行精细描述,导致在识别目标用户在多个业务中的具体业务风险时存在的确定结果不够准确、误差大的问题。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。