WO2018214933A1

WO2018214933A1 - 确定用户风险等级的方法及装置、计算机设备

Info

Publication number: WO2018214933A1
Application number: PCT/CN2018/088192
Authority: WO
Inventors: 杨帆; 付歆
Original assignee: 阿里巴巴集团控股有限公司; 杨帆; 付歆
Priority date: 2017-05-26
Filing date: 2018-05-24
Publication date: 2018-11-29
Also published as: TWI679604B; CN107203939A; US20200090268A1; TW201901578A

Abstract

一种确定确定用户风险等级的方法及装置、计算机设备，以提高用户风险等级的准确性。其中，确定用户风险等级的方法包括：获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。

Description

确定用户风险等级的方法及装置、计算机设备

技术领域

本申请涉及大数据技术领域，尤其涉及一种确定用户风险等级的方法及装置、计算机设备。

背景技术

随着互联网的发展，很多业务都可以通过互联网平台来实现。在一些业务的运营过程中，平台需要对用户的风险水平进行评估，并利用评估出的各个用户的风险水平来支撑业务的运营。例如，在互联网投资理财场景下，平台给用户推荐的理财产品应该符合用户的风险水平。

目前，互联网平台普遍采用问卷调查方式让用户填写与风险水平评估相关的内容，以确定出用户的风险水平指数，但是，问卷调查方式效率较低，且并不能保证用户填写的内容与其自身实际情况相符，导致无法准确地确定出每一用户的风险水平。

发明内容

有鉴于此，本申请提供一种确定用户风险等级的方法及装置、计算机设备。

为实现上述目的，本申请提供的技术方案如下：

根据本申请的第一方面，提出了一种确定用户风险等级的方法，包括：

获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。

根据本申请的第二方面，提出了一种确定用户风险等级的方法，包括：

获取用户的用于反映至少一种用户属性的用户数据，所述用户属性与用户的风险承受能力相关；

根据所述用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第一指数，确定所述用户的用户风险等级。

根据本申请的第三方面，提出了一种确定用户风险等级的装置，包括：

第一获取单元，获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

第一确定单元，根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

第二确定单元，根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

风险等级确定单元，根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。

根据本申请的第四方面，提出了一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

通过以上技术方案可以看出，上述过程通过获取用户数据，并根据获取到的用户数据来确定第一指数和/或第二指数，并根据第一指数和/或第二指数来确定用户的风险等级，最终得到的用户风险等级准确性高，且效率高。

附图说明

图1为根据一示例性实施例示出的一种确定用户风险等级的方法的流程；

图2为根据一示例性实施例示出的一种训练机器分类模型的过程；

图3为根据一示例性实施例示出的一种确定与用户的风险偏好程度有相关性的设定变量的过程；

图4为根据一示例性实施例示出的一种系统架构；

图5为根据一示例性实施例示出的一种电子设备的硬件结构。

具体实施方式

本申请旨在寻找一种能快速、准确地衡量用户对可能面临的各类风险的接受程度或偏好程度的方法，该方法可以通过大数据技术来实现。以用户在投资理财过程中所面临的投资风险为例，可通过两个主要方面来评估用户在投资理财时的用户风险水平：其一，用户主观上对风险的偏好，即用户在心理上对投资风险、波动性、投资可能造成的损失等是否偏好或厌恶，以及偏好或厌恶的程度；其二，用户客观的风险承受能力，即衡量投资风险、投资可能造成的损失等因素对用户的实际生活、或用户的生活目标等产生的影响大小。其中，关于用户主观上对风险的偏好，不同的用户对风险的偏好不尽相同，有的用户偏向于购买高风险、高回报的理财产品(如股票、基金等)，有的用户则偏向于购买低风险、低回报的理财产品(如余额宝等第三方活期资金理财产品)。为更好地服务于用户，互联网平台需要对用户主观上对风险的偏好程度进行评估，以根据用户的风险偏好程度，向用户推荐合适的金融产品，或评估销售给用户的金融产品是否适合该用户等。

在相关技术中，可以通过填写问卷的形式来获得用户风险水平，问卷中的问题包括：家庭组成、收入情况、风险偏好类型等。然而，问卷调查方式至少存在如下弊端中的一种或多种：

第一，无法获得与实际情况尽可能一致的结果。主要因素包括：用户在问卷上所填写的内容往往与用户自身实际情况不符，存在主管上造假的可能性；或者，对于问卷上的部分问题，用户不知如何回答，例如，询问用户能承受多少百分比的损失，这种问题用户并不知道如何回答；等等。

第二，问卷的形式过于简单，数据证明问卷调查的结果与用户真正表现出来的行为差异巨大。总之，问卷调查的形式获得的结果准确性有待提高，为提高准确性，本申请提出一种能够更为准确、高效地确定用户风险水平的方法，以下通过各种实施例来叙述这一技术方案。

图1示出了一示例性实施例提供的一种确定用户风险等级的方法的流程。该方法可应用于计算机设备(如提供投资理财业务的平台服务器、云计算平台等)。如图1所示，在一实施例中，该方法包括下述步骤101～104，其中：

在步骤101中，获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据。

关于第一用户数据，可以是用户在使用各类APP的过程中产生的用户数据。这类第一用户数据所反映的用户属性可以包括但不限于：用户的年龄，性别，家庭组成，所处的人生阶段，收入情况，个人资产，家庭资产，贷款情况等。上述各类用户属性的属性特征可以通过应用内容由用户填写的数据直接得到，也可以通过各类用户数据进行计算而间接得到。后者例如，用户的收入，可以通过银行卡的流水情况来计算；用户的资产情况，可以通过名下所拥有的房产情况以及其他资产情况来估算，等等。

所述业务可为通过互联网形式来实现的各类为用户提供服务的业务，如：自助缴费等生活服务类业务、投资理财等金融类业务。一般地，可开发提供上述业务的应用APP，让用户通过APP来参与这些业务，并且，可在同一个APP上提供多种涉及风险的业务。其中，这类业务通常涉及到风险，包括如下情况：①用户参与业务后可能面临风险，如：用户参与投资理财业务后可能造成资金亏损。②与业务相关的特定事件存在风险，如：用户通过违章缴费业务进行自动缴费，与该业务相关的事件为交通驾驶事件，而交通驾驶事件是存在风险的；又比如，用户通过医疗服务业务来预约体检或预约看病等，体检事件或看病事件也涉及到用户在身体健康上所面临的风险；等等。

用户在通过APP针对上述涉及风险的各类业务进行操作的过程中，可以产生各类用户数据。在一实施例中，用户数据可以是与用户的操作行为对应的行为数据，以投资理财业务为例，用户的操作行为包括但不限于：用户在APP上针对某类信息的搜索行为，用户在APP上针对某类信息的查看行为，用户在APP上针对某类信息的评论行为，以及用户在APP上针对某类金融产品的购买行为。其中，用户的各种操作行为可以发生在投资的各个阶段，如：投资行为发生之前、投资中以及结束投资行为之后。上述行为数据可包括但不限于：用户查看的内容，用户的查看动作发生的时刻(起始时刻或终止时刻)，查看动作持续的时长等。在一实施例中，用户数据也可以是与业务相关的其他事件所反映的数据。如，用户的交通驾驶事件涉及的数据(包括违章次数，违章类型等)，用户的体检事件涉及的数据(包括体检的时间，体检的内容等)。产生的用户数据可被存储到数据库中，以便在需要确定用户的风险偏好时能获取到相关的用户数据。

在上述步骤101完成之后，进入步骤102以及步骤103。

在步骤102中，根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数。

用户的风险承受能力主要受用户所处的人生阶段以及用户的财富水平影响。在一实施例中，步骤102可具体通过如下过程来实现：

步骤1021：根据所述第一用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征。

步骤1022：根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数。

在一可选实施例中，在步骤1022中，可以将所述属性特征输入第一机器分类模型，并将所述第一机器分类模型的输出确定为用于表征所述用户的风险承受能力的第一指数。

其中，可以为每一种用户属性预先确定一个或多个区间，并为每个区间对应一个属性特征。例如，用户属性为个人资产，按照金额设定多个区间为：0～50万RMB，50～200万RMB，200～1000万RMB等。其中，可定义0～50万RMB对应的属性特征为“1”(代表财富水平低的人群)，可定义50～200万RMB对应的属性特征为“2”(代表财富水平中等的人群)，可定义200～1000万RMB对应的属性特征为“3”(代表财富水平高的人群)。以此类推，可以按照获取到的第一用户数据，分别确定各个用户属性下的属性特征。

在一实施例中，所述第一指数可为所述用户的风险承受能力等级。例如，可在风险承受能力这个维度，将用户的风险承受能力等级分为低、中低、中、中高、高五类。其中，财富水平低，且年纪大、生活压力大的用户可被分到“低”这一类；财富水平高，且年轻小、生活压力小的用户可被分到“高”这一类；其余三类为介于“低”和“高”之间的用户。当然，第一指数也可以是表征用户的风险承受能力的数值(可介于0～1之间)，其中该数值越大，表明用户的风险承受能力越高。

其中，上述第一机器分类模型可以通过机器学习算法来训练获得。

在其他实施例中，也可以通过人为经验来确定与每种用户属性对应的影响系数，并利用确定的各个影响系数进行加权求和，来计算得到最终的第一指数。

在步骤103中，根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数。

在一实施例中，步骤103可以通过如下过程来实现：

步骤1031：根据所述第二用户数据确定所述用户在多个设定变量中每个设定变量下的特征值，其中，所述设定变量中包括至少一个确定影响用户的风险偏好程度的设定变量。

实际上，涉及风险的业务中所产生的第二用户数据，并不是所有数据都能够反映用户的风险偏好程度，即并不是所有数据都与用户的风险偏好程度存在关联性。通常，只有部分第二用户数据是实际与用户的风险偏好程度存在关联性，这部分数据是在确定用户风险偏好时需要获取的目标数据。例如，用户的体检事件可以反映出用户在面临健康风险时的态度，按照常规理解，这可以反映出用户对其他类型风险的态度，则与体检事件对应的某些数据可能与用户的风险编好程度存在关联性。

为此，可以设定好一个或多个能够影响到用户的风险偏好程度的设定变量。以用户的信息搜索行为为例，如果用户在APP内搜索的内容大多包含“股票”或“基金”等词条，或搜索的金融产品的类型为“股票类”或“基金类”，则在一定程度上可以反映出该用户偏好于高风险(即用户对投资风险的偏好程度高)，反之，如果用户经常搜索的内容是低风险的金融产品，则可以反映出该用户偏好于低风险(即用户对投资风险的偏好程度低)。在该例子中，上述搜索行为对应的设定变量便为：搜索内容所属的类型，相应地，可以针对每一种内容类型，预先确定一个与该内容类型对应的特征值(即设定变量的赋值)。例如：将内容类型分为高风险类型、中风险类型及低风险类型，与高风险类型对应的特征值为1，与中风险类型对应的特征值为0.5，与低风险类型对应的特征值为0。以用户的信息查看行为为例，用户A在购买某一金融产品X之前，需要查看100个其他金融产品，用户B在购买某一金融产品X之前，需要查看10个其他金融产品，则表明用户A对投资风险是较为理性的，而用户B对投资风险则不太在意，也就是说，用户A对风险的偏好程度要低于用户B对风险的偏好程度。在该例子中，设定变量为：用户在投资行为发生之前查看的金融产品的数目。设定变量的种类很多，本文不再一一作列举。

在一实施例中，可以预先定义出多种候选的设定变量，并通过相关技术手段来逐一验证这些候选的设定变量是否与用户对投资风险的偏好程度之间存在相关性，并最终选出与用户的风险偏好程度有相关性的设定变量。关于如何验证出与用户的风险偏好程度有相关性的设定变量的过程，将在下文予以详述。

需提及的是，所述多个设定变量中可以包括部分对用户的风险偏好程度没有影响或影响性较低(或相关性较低)的设定变量，例如，将这类设定变量的影响系数设定为0或接近于0。

用户在使用APP过程中的操作所产生的用户数据，通常是一种统计值。在一可选的实施例中，为了更加准确地计算出用户的风险偏好指数，可以预先为每一种设定变量设定多个统计值区间，并利用这些统计值区间来确定目标用户在各个设定变量下的特征值。以用户在投资之前查看的高风险类金融产品的数目为例，可以预先定义三个统计值区间：1～10，10～20，20～50，并定义这三个统计值区间对应的特征值分别为：0.1，0.2，0.3，则，当某用户在在投资之前查看的高风险类金融产品的数目介于1～10时，该设定变量的特征值为0.1；当某用户在在投资之前查看的高风险类金融产品的数目介于10～20时，该设定变量的特征值为0.2；当某用户在在投资之前查看的高风险类金融产品的数目介于20～50时，该设定变量的特征值为0.3。同理，按照这一规则可以确定出其他类型的设定变量的特征值。

能够想到的是，用户在生活中面临的风险种类(包括投资理财类风险及非投资类风险)很多，为了更加准确地确定出能够衡量用户的风险偏好程度的高低的风险偏好指数，需要尽可能获取用户在面临各类风险时的行为数据，并依据用户在面临各类风险时所作出的选择或操作，来确定用户的风险偏好程度的高低。举例来说，非投资类风险包括但不限于：用户在职业上面临的风险、用户在身体健康状况上面临的风险、用户在从事体育运动所面临的风险、用户开车时所面临的风险、其他金融场景下所面临风险等。其中，用户面临职业风险时，设定变量可包括：选择自主创业还是银行政府等高稳定行业，或用户换工作的频率等；用户面临身体健康上的风险时，设定变量可包括用户体验的频率，稳定性，或用户购买保健用品的情况等；用户在从事体育运动时，设定变量可包括：用户是否喜欢从事高风险运动，例如登山，滑雪以及用户是否喜欢从事低风险运动，例如钓鱼；用户开车时面临的风险，设定变量可包括：用户开车的速度，是否经常超速或违章次数等；当用户的其他金融场景，设定变量可包括：用户是否购买充足的保险防范未来，用户偏好于选择信用卡支付，提前消费，还是储蓄卡消费等。上述各类风险相关的用户数据，也可以通过提供相关业务的APP对应的后台数据库来获取。

可针对其他非投资类风险设计出一个或多个设定变量，并通过相关技术手段来逐一验证每一个设定变量是否为与用户的风险偏好程度有相关性的设定变量。

步骤1032：将所述用户在每个设定变量下的特征值输入第二机器分类模型，并将所述第二机器分类模型的输出确定为用于表征所述用户的风险偏好程度的第二指数。

其中，在一实施例中，可为每个设定变量预先确定一个影响系数，则计算风险偏好指数的过程大致为：先将每个设定变量的特征值乘以该设定变量对应的影响系数，再将各个乘积相加，将相加所得的和值确定为用户的风险偏好指数。

在另一实施例中，可预先训练出机器分类模型，则在步骤103中，将所述用户在每个设定变量下的特征值输入机器分类模型，并将所述机器分类模型的输出确定为所述用户的风险偏好指数。上述机器分类模型的输入为所述多个设定变量中每个设定变量下的特征值，所述机器分类模型的输出为用户被分类为高风险偏好类型的可能性。其中，若将对风险的偏好程度最低的这一类用户定义为“低风险偏好类型的用户”，若将对风险的偏好程度最高的这一类用户定义为“高风险偏好类型的用户”，则，“低风险偏好类型的用户”对应的风险偏好指数等于或无限接近于0，“高风险偏好类型的用户”对应的风险偏好指数等于或无限接近于1。其中，若某个用户的风险偏好指数越接近于0，则代表该用户属于“低风险偏好类型的用户”的可能性越高，若某个用户的风险偏好指数越接近于1，则代表该用户属于“高风险偏好类型的用户”的可能性越高。

图2为根据一示例性实施例示出的一种训练机器分类模型的过程。如图2所示，在一可选的实施例中，为提高准确性，可以通过以下过程训练出所述机器分类模型：

步骤11：筛选出多个样本用户，所述多个样本用户包括多个高风险偏好类型的样本用户和多个低风险偏好类型的样本用户。

其中，属于高风险偏好类型的样本用户通常是在投资中表现出对风险或损失不在乎甚至喜好的态度。相反，属于低风险偏好类型的样本用通常是在投资中极度厌恶风险，并极力避免损失的产生。一般地，两类样本在行为上具有明显的差异性。

关于如何筛选出多个样本用户的过程，又多种可行的实现方式，本文列举两种：

在一实施例中，步骤11可以具体通过如下过程来实现：

基于定义的高风险偏好规则和低风险偏好规则。将用户数据符合所述高风险偏好规则的用户确定为高风险偏好类型的样本用户，将用户数据符合所述低风险偏好规则的用户确定为低风险偏好类型的样本用户。与常规的定义不同，规则的定义不依赖于用户是否买了高风险产品。本文涉及的规则的定义取自于心理学、行为金融学以及决策科学下的相关理论。例如，通过考察用户在面临损失时的心理状态和实际行为来定义用户所归属的风险偏好类型。在该场景下，定义的一种“高风险偏好规则”可为“亏了后不在乎，继续买”，例如：用户在亏损的资金比例≥20％，和/或亏损金额≥500RMB时，仍继续购买一定数量的高风险产品；定义的一种“低风险偏好规则”可为“亏了以后就不敢看”：用户在账户盈利时频繁地查看个人资产盈利情况，而账户产生大幅亏损时，就不敢再查看个人资产盈利情况。再比如，通过考察用户在波动行情下的心理状况和实际行为来定义用户所归属的风险偏好类型。在该场景下，定义的“低风险偏好规则”为“波动时更敏感”：在股票大盘平稳时，用户不关心自己的资产，但每当大盘大幅波动时(例如下跌1％)，用户就频繁地登录并查看自己的资产。当然，为提高筛选出的样本用户的准确性，可以分别定义出多种不同的“高风险偏好规则”以及多种不同的“低风险偏好规则”，并利用这些规则以及已有的用户数据，筛选出符合各类规则的样本用户，并打上“高风险偏好”或“低风险偏好”的类型标签。

在另一实施例中，步骤11可以具体通过如下过程来实现：

基于用于测试用户风险偏好的实验应用及定义的高风险偏好规则和低风险偏好规则，将在所述实验应用中的行为符合所述高风险偏好规则的用户确定为高风险偏好类型的样本用户，将在所述实验应用中的行为符合所述低风险偏好规则的用户确定为低风险偏好类型的样本用户。例如，开发一款“吹气球”的游戏，游戏中用户的任务是不断地吹气球，并获得与所吹气球大小正相关的金钱数额。与实际生活中的气球一样，如果用户将气球吹得过大(用户吹的次数越多，气球越大)，气球会爆炸，但是，气球被吹多大会爆是未知的。每一轮游戏用户都面临吹一次或离开的选择。如果用户选择吹气球，则将会有两种结果：①气球变大，获得的金钱更多，②气球吹爆了，已获得的金钱归零。而如果用户选择离开，则用户可以获得当前已经积累的金钱。在该游戏中，可以将吹气球的次数超过一定数量阈值a(设定的值)的用户定义成高风险偏好用户，而将低于另一数量阈值b(设定的值)的用户定义成低偏好偏好用户，将介于a、b之间的用户定义为不明确用户。当然，用于获得样本的实验游戏还可以为其它类型，本文不一一列举。

步骤12：获取所述多个样本用户中每个样本用户在预设的多个设定变量中每个设定变量下的特征值。其中，所述特征值可以根据各个样本用户的用户数据来确定。这里的设定变量是预先设计的各种可能与风险偏好相关的变量。

步骤13：根据所述多个样本用户中每个样本用户在每个设定变量下的特征值，以及每个样本用户对应的风险偏好类型，训练出所述机器分类模型；其中，所述机器分类模型的输入为所述多个设定变量中每个设定变量下的特征值，所述机器分类模型的输出为用户被分类为高风险偏好类型的可能性。其中，训练模型所采用的机器学习方法可以包括但不限于：线性回归(linear regression)、逻辑回归(logistic regression)等。

在训练出备用的机器分类模型之后，便可以将所述目标用户在每个设定变量下的特征值输入机器分类模型，以输出所述目标用户的风险偏好指数。其中，可根据需要将用户的风险偏好程度划分为多个等级，如：低、中、高，并根据输出的风险偏好指数来确定用户的风险偏好程度的等级。例如，风险偏好指数介于0～0.3时，风险偏好程度的等级为“低”，风险偏好指数介于0.3～0.6时，风险偏好程度的等级为“中”，风险偏好指数介于0.6～1时，风险偏好程度的等级为“高”。

关于如何确定影响用户的风险偏好程度的设定变量，在本申请一实施例中，可以利用上述确定的样本用户来验证。如图3所示，可通过如下过程确定影响用户的风险偏好程度的设定变量：

步骤21：筛选出多个样本用户，所述多个样本用户包括多个高风险偏好类型的样本用户和多个低风险偏好类型的样本用户。

步骤22：对于任一待验证的设定变量，获取所述多个样本用户中每一样本用户在该待验证的设定变量下的特征值。

步骤23：利用每一样本用户在该待验证的设定变量下的特征值及每一样本用户对应的风险偏好类型，验证所述待验证的设定变量是否为影响用户的风险偏好程度的设定变量。

在一可选实施例中，该步骤23可以具体通过如下过程来实现：

步骤231：基于每一样本用户在该待验证的设定变量下的特征值，确定所述多个高风险偏好类型的样本用户在该待验证的设定变量下的特征值规律，以及所述多个低风险偏好类型的样本用户在该待验证的设定变量下的特征值规律。例如：所述特征值规律包括：对多个特征值进行求平均运算所得的均值，或多个特征值的分布区间等。

步骤232：如果所述高风险偏好类型对应的特征值规律和所述低风险偏好类型对应的特征值规律之间的差异符合设定条件，将所述待验证的设定变量确定为影响用户的风险偏好程度的设定变量。

其中，对于影响用户的风险偏好程度的设定变量，“高风险偏好类型”和“低风险偏好类型”的用户样本在该设定变量上的特征值规律会呈现较大的差异，反之，若某设定变量对用户的风险偏好程度不产生影响，则“高风险偏好类型”和“低风险偏好类型”的用户样本在该设定变量上的特征值规律会差异较小甚至几乎相同。为此，可以设定用于衡量差异的设定条件，来判断“高风险偏好类型”和“低风险偏好类型”的用户样本在该设定变量上的特征值规律差异是否满足该设定条件，以最终确定出符合条件的设定变量。

例如，倘若待验证的设定变量为“用户在投资行为发生之前查看的金融产品的数目”，假设预先筛选的“高风险偏好类型”的8个用户样本在该设定变量下的特征值分别为：

{3、1、4、10、5、6、1、3}；

假设预先筛选的“低风险偏好类型”的8个用户样本在该设定变量下的特征值分别为：

{9、6、7、10、13、8、8、11}；

若定义的设定条件为：“高风险偏好类型”的用户样本在该设定变量下的各特征值的均值x和“低风险偏好类型”的用户样本在该设定变量下的各特征值的均值y之间的差值大于4。

通过计算，得出x＝4.15，y＝9，可见，满足上述设定条件，可确定“用户在投资行为发生之前查看的金融产品的数目”为影响用户的风险偏好程度的设定变量。

在另一可选的实施例中，上述步骤23也可以具体通过如下过程来实现：

分别统计大于设定阈值的特征值在所述多个样本用户中分布情况，并根据分布情况来确定该设定变量是否为影响用户的风险偏好程度的设定变量。

例如，在上述例子中，如设定阈值为5，则统计得出，大于5的特征值的分布情况为：2个“高风险偏好类型”的样本用户以及8个“低风险偏好类型”的样本用户，可见，该设定变量对应的特征值在两种类型的用户样本上的分布情况存在明显的不均匀，表明该设定变量对用户风险偏好产生较大的影响，可将其确定为影响用户的风险偏好程度的设定变量。

当然，在可选的其他实施例中，可以根据人为经验来设计一种或多种影响用户的风险偏好程度的设定变量。

在上述步骤102和步骤103完成之后，进入步骤104。

在步骤104中，根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。

在一实施例中，上述第一指数和第二指数可以分别是用于反映风险承受能力以及风险偏好程度的分值(如介于0～1之间)。其中，通常，分值越大，可表示风险承受能力越高或风险偏好程度越高。

在一实施例中，则上述步骤104具体通过如下过程来实现：

根据所述第一指数确定所述用户的风险承受能力等级；其中，可以将用户的风险承受能力从低到高划分出多个等级，每个等级可以对应于一个关于第一指数的值区间。

根据所述第二指数确定所述用户的风险偏好程度等级；其中，同样地，可以将用户的风险偏好程度从低到高划分出多个等级，每个等级可以对应于一个关于第二指数的值区间。

根据预先确定的等级对应表，确定所述用户的用户风险等级，其中，所述等级对应表用以描述所述风险承受能力等级、所述风险偏好程度等级以及所述用户风险等级之间的对应关系。本申请实施例中，根据一般需求，需要将风险承受能力等级和风险偏好程度等级进行融合，以得到一个最终能够反映出用户在投资方面的风险水平的用户风险等级。通常，用户的风险承受能力等级越高或风险偏好程度等级越高，该用户的用户风险等级也相应越高。

在一实施例中，可以通过如下过程来确定上述等级对应表：

分别确定风险承受能力等级、风险偏好程度等级以及用户风险等级的等级数。其中，可以根据实际需求，人为设定上述各个等级的等级数。或者，由计算机根据预定义的规则来确定上述各个等级对应的等级数。例如，根据平台用户数来确定各个等级相关的等级数，可以定义当平台用户数大于一定数量时，增加等级数；或者，定义用户风险等级对应的等级数不小于上述风险承受能力等级以及风险偏好程度等级对应的等级数，等等。

基于确定的等级数，确定与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级，得到所述等级对应表。

在设定好上述各类等级相对应的等级数之后，可以分别确定出与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级。其中，同样地，可以人为确定与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级，也可以由计算机按照预定义规则来确定，其中，预定义规则例如：关于每个用户风险等级在表中出现的次数，中间等级在表中出现的次数可以大于高等级或低等级出现的次数，等等。

在其他实施例中，也可以分别为“风险偏好程度”和“风险承受能力”设定相应的权重，根据预先划分的风险偏好程度等级以及风险承受能力等级，并结合上述权重，计算出每一个风险偏好程度等级和风险承受能力等级的结合点所对应的分值(该分值反映出最终的用户风险等级的高低)，最终，可以根据计算出的各个分值，来确定出与上述每个结合点对应的用户风险等级。本文关于确定等级对应表的过程不作限制，当然，等级的对应关系可以不以表格的形式存在。

例如，上述等级对应表如下表1所示：

表1：

其中，若以风险承受能力为主，以风险偏好程度为辅，即风险承受能力等级相同时，风险偏好程度等级越高，用户风险等级越高；风险偏好程度等级相同时，风险承受能力等级越高，用户风险等级越高。依据该原则，可将用户风险等级分为0～6这7个等级。其中，“0”代表用户风险等级最低的用户，其风险偏好程度最低，风险承受能力也最低。“6”代表用户风险等级最高的用户，其风险承受能力最高，风险偏好程度等级也最高。

在实际实现时，上述计算用户风险等级的过程可以是每隔一段特定时长(如每天)就执行一遍，每天都会获取最新的用户数据来确定用户风险等级，确保数据能够及时更新。

在另一实施例中，还提供一种确定用户风险等级的方法，包括：

获取用户的用于反映至少一种用户属性的用户数据，所述用户属性与用户的风险承受能力相关。

根据所述用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征。

根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数。

根据所述第一指数，确定所述用户的用户风险等级。

在本实施例中，可以仅获取用于确定用户的风险承受能力的用户数据，并依据这些用户数据确定出用户的风险承受能力，并最终根据第一指数来确定出用户风险等级。

通过以上技术方案可以看出，上述过程通过获取用户数据，并根据获取到的用户数据来确定第一指数和/或第二指数，并根据第一指数和/或第二指数来确定用户的风险等级，最终得到的用户风险等级准确性高，且效率高。并且，也能保证数据的及时更新。

如图4所示，为一种系统架构。在一实施例中，该系统可以包括：用户设备100，与用户设备交互的服务器300，服务器300连接的第一数据库400，确定用户风险等级的装置200以及第二数据库500、第三数据库600。其中，用户设备100上可以安装具有投资理财业务的APP，服务器300为该APP对应的平台服务端，平台服务端将用户在参与涉及风险的业务过程中产生的第二用户数据存放于第一数据库400中，以备确定用户风险等级的装置200来获取。第三数据库600可以存放有能够影响用户的风险承受能力的第一用户数据，并且可以供确定用户风险等级的装置200来获取，其中第三数据库600中的数据可以是服务器300直接写入的，也可以是其他应用服务器来采集并写入的，对此本文均不作限制。其中，确定用户风险等级的装置200可以是存在于服务器300上的一种以程序代码形式存在的虚拟装置。当然，需说明的是，该装置200也可以存在于另外一个计算机装置上。当需要确定用户的风险等级时，该装置200从上述第一数据库400中获取到所需要的第二用户数据，并提取各设定变量的特征值，输入到预先提供的机器分类模型，输出第二指数(表征用户的风险偏好)。该装置200还可以从上述第三数据库600中获取到所需要的第一用户数据，并提取出各个属性特征，输入到预设的机器分类模型，输出第一指数(表征用户的风险承受能力)。最终，该装置200根据上述第一指数和第二指数确定用户风险等级并存放于第二数据库500中，以备各种应用场景调用用户风险等级。当然，上述各个数据库中的至少部分数据库也可以是同一个数据库，对此不作限制。

图5示出了一示例性实施例提供的一种电子设备的结构。如图5所示，所述电子设备可以为计算机设备(如支付平台服务器或理财平台服务器等)，该电子设备可以包括处理器、内部总线、网络接口、存储器(包括内存以及非易失性存储器)，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在一实施例中，上述确定用户风险等级的装置200可以包括：

获取单元210，获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

第一确定单元220，根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

第二确定单元230，根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

风险等级确定单元240，根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。

在一可选的实施例中，所述第一确定单元220包括：

属性特征确定单元，根据所述第一用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

第一计算单元，将所述属性特征输入第一机器分类模型，并将所述第一机器分类模型的输出确定为用于表征所述用户的风险承受能力的第一指数。

在一可选的实施例中，所述第二确定单元230包括：

特征值确定单元，根据所述第二用户数据确定所述用户在多个设定变量中每个设定变量下的特征值，所述设定变量中包括至少一个确定影响用户的风险偏好程度的设定变量；

第二计算单元，将所述用户在每个设定变量下的特征值输入第二机器分类模型，并将所述第二机器分类模型的输出确定为用于表征所述用户的风险偏好程度的第二指数。

在一可选的实施例中，所述风险等级确定单元240包括：

第一等级确定单元，根据所述第一指数确定所述用户的风险承受能力等级；

第二等级确定单元，根据所述第二指数确定所述用户的风险偏好程度等级；

第三等级确定单元，根据预先确定的等级对应表，确定所述用户的用户风险等级，其中，所述等级对应表用以描述所述风险承受能力等级、所述风险偏好程度等级以及所述用户风险等级之间的对应关系。根据预先确定的风险承受能力等级、风险偏好等级两者和用户风险等级之间的对应关系，确定所述用户的用户风险等级。

在一可选的实施例中，还包括：

等级数确定单元，分别确定风险承受能力等级、风险偏好程度等级以及用户风险等级的等级数；

等级对应表确定单元，基于确定的等级数，确定与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级，得到所述等级对应表。

在一可选的实施例中，所述涉及风险的业务包括存在资金损失风险的业务、和/或相关联的事件存在风险的业务。

在一实施例中，还提供了一种确定用户风险承受能力的装置，包括：

获取单元，获取用户的用于反映至少一种用户属性的用户数据，所述用户属性影响所述用户的风险承受能力；

第三确定单元，根据所述用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

第四确定单元，根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数。

在一实施例中，还提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如下步骤：

获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

获取用户的用于反映至少一种用户属性的用户数据，所述用户属性影响所述用户的风险承受能力；

在一实施例中，还提供了一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

在一实施例中，还提供了一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

根据所述第一指数，确定所述用户的用户风险等级。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于计算机设备实施例、或装置实施例、或计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种确定用户风险等级的方法，包括：

获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。
根据权利要求1所述的方法，所述根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数，包括：

根据所述第一用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

将所述属性特征输入第一机器分类模型，并将所述第一机器分类模型的输出确定为用于表征所述用户的风险承受能力的第一指数。
根据权利要求1所述的方法，所述根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数，包括：

根据所述第二用户数据确定所述用户在多个设定变量中每个设定变量下的特征值，所述设定变量中包括至少一个确定影响用户的风险偏好程度的设定变量；

将所述用户在每个设定变量下的特征值输入第二机器分类模型，并将所述第二机器分类模型的输出确定为用于表征所述用户的风险偏好程度的第二指数。
根据权利要求1所述的方法，所述根据所述第一指数和所述第二指数，确定所述用户的用户风险等级，包括：

根据所述第一指数确定所述用户的风险承受能力等级；

根据所述第二指数确定所述用户的风险偏好程度等级；

根据预先确定的等级对应表，确定所述用户的用户风险等级，其中，所述等级对应表用以描述所述风险承受能力等级、所述风险偏好程度等级以及所述用户风险等级之间的对应关系。
根据权利要求4所述的方法，通过如下过程确定所述等级对应表：

分别确定风险承受能力等级、风险偏好程度等级以及用户风险等级的等级数；

基于确定的等级数，确定与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级，得到所述等级对应表。
根据权利要求1所述的方法，所述涉及风险的业务包括存在资金损失风险的业务、和/或相关联的事件存在风险的业务。
一种确定用户风险等级的方法，包括：

获取用户的用于反映至少一种用户属性的用户数据，所述用户属性与用户的风险承受能力相关；

根据所述用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第一指数，确定所述用户的用户风险等级。
一种确定用户风险等级的装置，包括：

获取单元，获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

第一确定单元，根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

第二确定单元，根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

风险等级确定单元，根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。
根据权利要求8所述的装置，所述第一确定单元包括：

属性特征确定单元，根据所述第一用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

第一计算单元，将所述属性特征输入第一机器分类模型，并将所述第一机器分类模型的输出确定为用于表征所述用户的风险承受能力的第一指数。
根据权利要求8所述的装置，所述第二确定单元包括：

特征值确定单元，根据所述第二用户数据确定所述用户在多个设定变量中每个设定变量下的特征值，所述设定变量中包括至少一个确定影响用户的风险偏好程度的设定变量；

第二计算单元，将所述用户在每个设定变量下的特征值输入第二机器分类模型，并将所述第二机器分类模型的输出确定为用于表征所述用户的风险偏好程度的第二指数。
根据权利要求8所述的装置，所述风险等级确定单元包括：

第一等级确定单元，根据所述第一指数确定所述用户的风险承受能力等级；

第二等级确定单元，根据所述第二指数确定所述用户的风险偏好程度等级；

第三等级确定单元，根据预先确定的等级对应表，确定所述用户的用户风险等级，其中，所述等级对应表用以描述所述风险承受能力等级、所述风险偏好程度等级以及所述用户风险等级之间的对应关系。
根据权利要求11所述的装置，还包括：

等级数确定单元，分别确定风险承受能力等级、风险偏好程度等级以及用户风险等级的等级数；

等级对应表确定单元，基于确定的等级数，确定与每一个用户风险等级相对应的风险承受能力等级和风险偏好程度等级，得到所述等级对应表。
根据权利要求8所述的装置，所述涉及风险的业务包括存在资金损失风险的业务、和/或相关联的事件存在风险的业务。
一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

获取用户的第一用户数据和第二用户数据，所述第一用户数据反映至少一种与用户的风险承受能力相关的用户属性，所述第二用户数据为所述用户在涉及风险的业务中产生的行为数据；

根据所述第一用户数据，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第二用户数据，确定用于表征所述用户的风险偏好程度的第二指数；

根据所述第一指数和所述第二指数，确定所述用户的用户风险等级。
一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

获取用户的用于反映至少一种用户属性的用户数据，所述用户属性与用户的风险承受能力相关；

根据所述用户数据，确定所述用户在多个用户属性中每个用户属性下的属性特征；

根据所述属性特征，确定用于表征所述用户的风险承受能力的第一指数；

根据所述第一指数，确定所述用户的用户风险等级。