CN109427010B

CN109427010B - 通信费用透支额度分配方法、装置、存储介质和计算机设备

Info

Publication number: CN109427010B
Application number: CN201710774647.3A
Authority: CN
Inventors: 陈玲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-08-31
Filing date: 2017-08-31
Publication date: 2022-05-27
Anticipated expiration: 2037-08-31
Also published as: CN109427010A

Abstract

本发明涉及一种通信费用透支额度分配方法、装置、存储介质和计算机设备，包括：获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，所述多个用户行为场景包括用户通信行为场景；根据所述目标用户标识所对应的各用户行为场景下的用户特征数据，确定所述目标用户标识属于恶意用户标识类的概率；将所述目标用户标识属于恶意用户标识类的概率，映射为所述目标用户标识相应的信用分值；其中，所述目标用户标识相应的信用分值与所述目标用户标识属于恶意用户标识类的概率负相关；为所述目标用户标识分配与所述信用分值相对应的通信费用透支额度。本案提高了通信费用透支额度分配的准确性。

Description

通信费用透支额度分配方法、装置、存储介质和计算机设备

技术领域

本发明涉及计算机技术领域，特别是涉及一种通信费用透支额度分配方法、装置、存储介质和计算机设备。

背景技术

随着计算机技术的不断发展，通过计算机实现资源的分配越来越普遍。比如通信费用透支额度的分配等。通信费用透支额度的提供者可以在计算机平台上将通信费用透支额度分配至通信费用的使用者。

传统的通信费用透支额度分配方式在对通信费用的使用者进行通信费用透支额度分配时，通常是采用特定的评分策略对通信费用的使用者进行评分，再根据分值为通信费用的使用者分配通信费用透支额度。然而传统的这种通信费用透支额度分配方式具有局限性，在进行评分时会出现不准确的情况，导致通信费用透支额度的分配也不准确。

发明内容

基于此，有必要针对传统的通信费用透支额度分配方法导致的通信费用透支额度分配准确性低的问题，提供一种通信费用透支额度分配方法、装置、存储介质和计算机设备。

一种通信费用透支额度分配方法，包括：

获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，所述多个用户行为场景包括用户通信行为场景；

根据所述目标用户标识所对应的各用户行为场景下的用户特征数据，确定所述目标用户标识属于恶意用户标识类的概率；

将所述目标用户标识属于恶意用户标识类的概率，映射为所述目标用户标识相应的信用分值；其中，所述目标用户标识相应的信用分值与所述目标用户标识属于恶意用户标识类的概率负相关；

为所述目标用户标识分配与所述信用分值相对应的通信费用透支额度。

一种通信费用透支额度分配装置，包括：

获取模块，用于获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，所述多个用户行为场景包括用户通信行为场景；

确定模块，用于根据所述目标用户标识所对应的各用户行为场景下的用户特征数据，确定所述目标用户标识属于恶意用户标识类的概率；

映射模块，用于将所述目标用户标识属于恶意用户标识类的概率，映射为所述目标用户标识相应的信用分值；其中，所述目标用户标识相应的信用分值与所述目标用户标识属于恶意用户标识类的概率负相关；

分配模块，用于为所述目标用户标识分配与所述信用分值相对应的通信费用透支额度。

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

在一个实施例中，所述根据所述目标用户标识所对应的各用户行为场景下的用户特征数据，确定所述目标用户标识属于恶意用户标识类的概率，包括：

将所述目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型；

分别获得通过各所述恶意用户预测子模型输出的、所述目标用户标识属于恶意用户标识类的中间概率；

根据分别获得的所述目标用户标识属于恶意用户标识类的中间概率，生成所述目标用户标识属于恶意用户标识类的概率。

在一个实施例中，所述计算机程序被处理器执行时，还使得所述处理器执行以下步骤：

收集包括用户通信行为场景的多个用户行为场景下的用户特征数据；

对收集到的所述用户特征数据进行数据清洗；

将清洗后的所述用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集；

根据各所述样本集训练得到相应用户行为场景下的恶意用户预测子模型。

在一个实施例中，所述根据各所述样本集训练得到相应用户行为场景下的恶意用户预测子模型，包括：

将各用户行为场景下的样本集中包括的样本划分为训练样本和测试样本；

分别根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型；

采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

在一个实施例中，所述根据分别获得的所述目标用户标识属于恶意用户标识类的中间概率，生成所述目标用户标识属于恶意用户标识类的概率，包括：

将分别获得的所述目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到所述恶意用户预测模型输出的所述目标用户标识属于恶意用户标识类的概率。

一种计算机设备，包括存储器和处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

对收集到的所述用户特征数据进行数据清洗；

上述通信费用透支额度分配方法、装置、存储介质和计算机设备，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行通信费用透支额度分配的准确性。

附图说明

图1为一个实施例中通信费用透支额度分配方法的应用环境图；

图2为一个实施例中通信费用透支额度分配方法的流程示意图；

图3为一个实施例中模型训练过程的原理示意图；

图4为另一个实施例中通信费用透支额度分配方法的流程示意图；

图5为一个实施例中通信费用透支额度分配装置的结构框图；

图6为另一个实施例中通信费用透支额度分配装置的结构框图；

图7为又一个实施例中通信费用透支额度分配装置的结构框图；

图8为再一个实施例中通信费用透支额度分配装置的结构框图；

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1为一个实施例中通信费用透支额度分配方法的应用环境图。参照图1，该通信费用透支额度分配方法应用于通信费用透支额度分配系统。该通信费用透支额度分配系统包括分配服务器110和多个用户行为场景各自对应的服务器集群120。分配服务器110和服务器集群120通过网络连接。其中，服务器集群 120可包括用户通信行为场景对应的服务器集群121和用户社交行为场景对应的服务器集群122等。分配服务器110具体可以是独立的物理服务器，也可以是物理服务器集群。分配服务器110可用于执行该通信费用透支额度分配方法，从多个用户行为场景各自对应的服务器集群120中，获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，这多个用户行为场景包括用户通信行为场景。分配服务器110再根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率，即可将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，所述目标用户标识相应的信用分值与所述目标用户标识属于恶意用户标识类的概率负相关。分配服务器110再为目标用户标识分配与该信用分值相对应的通信费用透支额度。

本领域技术人员可以理解，图1中示出的应用环境，仅仅是与本申请方案相关的部分应用环境，并不构成对本申请方案所应用的应用环境的限定，具体的应用环境可以包括比图中所示更多或更少的计算机设备。比如，该通信费用透支额度分配系统还可以包括目标用户标识对应的用户终端，分配服务器可从用户终端获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，以继续执行通信费用透支额度分配方法。

图2为一个实施例中通信费用透支额度分配方法的流程示意图。本实施例主要以该方法应用于上述图1中的分配服务器110来举例说明。参照图2，该通信费用透支额度分配方法具体包括如下步骤：

S202，获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景。

其中，用户行为场景是与用户相关且存在用户行为的场景。比如通话场景、购物场景、发表微博消息场景或者评论场景等。在本实施例中，用户行为场景具体包括用户通信行为场景。用户通信行为场景是存在用户通信行为的场景。在一个实施例中，用户行为场景至少还包括用户社交行为场景。用户社交行为场景是存在用户社交行为的场景。

用户特征数据是可以反映用户特性的数据。某一特定用户行为场景下用户特征数据是反映用户在该用户行为场景下特性的数据。用户通信行为场景下的用户特征数据，可包括用户通信记录数据、用户生活状态数据或者用户通信消耗资源使用数据等。其中，用户通信记录数据比如短信记录、通话记录或者移动网络数据使用记录等。用户生活状态数据比如用户长期居住地区或者用户临时居住地区等。用户通信消耗资源使用数据比如通信费用账单或者用户使用通信消耗资源类型列表等。

用户社交行为场景下的用户特征数据，可包括用户基础数据、用户社交行为数据、用户资源使用数据或者用户生活数据等。其中，用户基础数据比如姓名、性别、年龄或者学历等。用户社交行为数据比如社交会话数据、社交消息发布数据或者社交消息评论信息等。用户资源转移数据比如理财数据或者资源使用数据等。用户生活数据比如视频观看数据或者音乐收听数据等。

目标用户标识可以是包括数字、字母和符号中的至少一种字符的字符串，用于唯一标识一个目标用户。目标用户标识是待进行通信费用透支额度分配的用户标识。

具体地，分配服务器可从各用户行为场景对应的服务器中，拉取与目标用户标识对应的用户特征数据。在一个实施例中，分配服务器可将目标用户标识，分别发送到各用户行为场景对应的服务器，各用户行为场景对应的服务器在接收到目标用户标识后，查找与该目标用户标识对应的用户特征数据，再将查找到的用户特征数据反馈至分配服务器。

其中，用户行为场景对应的服务器包括用户通信行为场景对应的服务器，比如通信服务器等；还包括用户社交行为场景对应的服务器，比如微信服务器等。一个用户行为场景对应的服务器可以是一个或者多个。比如，用户通信行为场景对应的通信服务器，用户社交行为场景对应的微信服务器、微博服务器和豆瓣服务器等社交服务器。

在一个实施例中，分配服务器还可从目标用户标识对应的终端，拉取多个用户行为场景下分别与目标用户标识对应的用户特征数据。具体地，分配服务器可与目标用户标识对应的终端建立通信连接，获取与目标用户标识对应的终端上存储的、多个用户行为场景下分别与目标用户标识对应的用户特征数据。

S204，根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率。

其中，恶意用户标识用于标识存在恶意行为的用户。恶意行为比如恶意使用通信消耗资源等。通信消耗资源是通信过程中需要消耗的资源。比如通话时长、短信数量、移动数据流量或者通信费用等。目标用户标识属于恶意用户标识类的概率，反映目标用户标识为恶意用户标识的可能性。目标用户标识属于恶意用户标识类的概率越大，表示目标用户标识属于恶意用户标识类的可能性越大，也就是目标用户标识所标识的目标用户存在恶意行为的可能性越大。

在一个实施例中，分配服务器，可以直接通过预先训练得到的恶意用户预测总模型来预测该目标用户标识属于恶意用户标识类的概率。其中，恶意对象预测总模型，是用于预测目标用户标识是否属于恶意用户标识类的机器学习模型。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。神经网络模型比如卷积神经网络、反向传播神经网络、反馈神经网络、径向基神经网络或者自组织神经网络等。

具体地，分配服务器，可将目标用户标识所对应的各用户行为场景下的用户特征数据，共同作为预先训练得到的恶意用户预测总模型的输入，以使该恶意用户预测总模型输出该目标用户标识属于恶意用户标识类的概率。

在一个实施例中，分配服务器在预先训练该恶意用户预测总模型时，可先收集若干用户标识所对应的各用户行为场景下的用户特征数据作为训练的样本，根据收集的用户特征数据判断该用户特征数据对应的用户标识属于恶意用户标识类，还是不属于恶意用户标识类，以给这些样本添加训练标签。

对于每个用户标识，当根据该用户标识所对应的各用户行为场景下的用户特征数据，判断该用户标识属于恶意用户标识类时，为该用户标识所对应的各用户行为场景下的用户特征数据，添加属于恶意用户标识类的训练标签。当根据该用户标识所对应的各用户行为场景下的用户特征数据，判断该用户标识不属于恶意用户标识类时，为该用户标识所对应的各用户行为场景下的用户特征数据，添加不属于恶意用户标识类的训练标签。分配服务器再根据收集的样本及为训练样本添加的训练标签，训练得到恶意用户预测总模型。

其中，分配服务器，可预先设置判断用户标识是否属于恶意用户标识类的判断条件。该判断条件可以是用户标识对应的恶意行为的次数超过预设次数。当分配服务器通过用户标识所对应的各用户行为场景下的用户特征数据，得到该用户标识对应的恶意行为的次数超过预设次数，则判定该判断条件被满足，分配服务器可为该用户标识对应的所对应的各用户行为场景下的用户特征数据，添加属于恶意用户标识类的训练标签。判断条件具体可以是预设时间间隔内，用户标识对应的恶意使用通信消耗资源的次数超过预设次数。预设时间间隔具体可以是多个自然月。判断条件比如半年内通话费用透支的次数超过一次。

在一个实施例中，分配服务器，可预先分别针对每个用户行为场景训练相应的恶意用户预测子模型，再将各恶意用户预测子模型的输出作为训练样本训练恶意用户预测模型，该恶意用户预测模型将各恶意用户预测子模型的输出作为输入，输出目标用户标识属于恶意用户标识类的概率，从而分两个阶段得到目标用户标识属于恶意用户标识类的概率。

具体地，分配服务器将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型，得到各恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率，再将这些中间概率输入恶意用户预测模型，得到目标用户标识属于恶意用户标识类的概率。

S206，将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关。

其中，信用分值是将用户信用量化后的数值。目标用户标识对应的信用分值越大，说明目标用户标识对应的用户信用越好。

具体地，分配服务器，可按照目标用户标识属于恶意用户标识类的概率与目标用户标识相应的信用分值的映射关系，将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值。

在一个实施例中，目标用户标识属于恶意用户标识类的概率与目标用户标识相应的信用分值的映射关系，具体可以是以目标用户标识属于恶意用户标识类的概率为自变量，以目标用户标识相应的信用分值为因变量的映射函数。其中，映射函数满足自变量与因变量之间为负相关的函数关系。也就是说，自变量的取值越大，因变量的取值越小。从而使得目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关。

在一个具体的实施例中，分配服务器可通过以下映射函数，将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值。

其中，S为目标用户标识对应的信用分值；base为信用量化基准值；p为目标用户标识属于恶意用户标识类的概率；step为步长，用于增大恶意用户与非恶意用户之间的信用分值差值，从而增大恶意用户与非恶意用户之间的区分度。

在具体的实施例中，base具体可取值为300，step可取值为30。其中base 与step可根据资源的种类相应调整。

S208，为目标用户标识分配与信用分值相对应的通信费用透支额度。

具体地，分配服务器，可确定目标用户标识对应的信用分值所对应的通信费用透支额度，将确定的该通信费用透支额度分配至该目标用户标识。

在一个实施例中，分配服务器可事先设置信用分值与通信费用透支额度的对应关系，以使分配服务器在需要进行通信费用透支额度分配时，根据该对应关系确定通信费用透支额度。

其中，分配服务器事先设置的信用分值与通信费用透支额度的对应关系，可以是一一对应的对应关系。也就是一个信用分值对应一个通信费用透支额度。比如信用分值为100时，对应100份通信费用透支额度，或者信用分值为200 时，对应200份通信费用透支额度。分配服务器事先设置的信用分值与通信费用透支额度的对应关系，也可以是多对一的对应关系。也就是多个信用分值对应一个通信费用透支额度，这多个信用分值为连续的信用分值。比如信用分值为100-110时，对应100份通信费用透支额度，或者信用分值为20-30时，对应 20份通信费用透支额度。

上述通信费用透支额度分配方法，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行通信费用透支额度分配的准确性。

在一个实施例中，S204包括：将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型；分别获得通过各恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率；根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率。

其中，恶意用户预测子模型，是根据用户特征数据预测相应的用户标识属于恶意用户标识类的概率的机器学习模型。不同的用户行为场景下的恶意用户预测子模型的输入，分别为各自对应的用户行为场景下的用户特征数据。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。神经网络模型比如卷积神经网络、反向传播神经网络、反馈神经网络、径向基神经网络或者自组织神经网络等。

具体地，分配服务器，可将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型。从而得到各个恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率。分配服务器，可再根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率。

其中，根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率，可以是将各中间概率进行求和运算、求平均值运算或者加权求平均值运算等至少一种运算，得到目标用户标识属于恶意用户标识类的概率。根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率，可以是将各中间值输入事先训练的恶意用户预测模型，得到目标用户标识属于恶意用户标识类的概率。该恶意用户预测模型，被训练为以各恶意用户预测子模型的输出作为输入，输出目标用户标识属于恶意用户标识类的概率。

在一个实施例中，恶意用户预测子模型，根据训练样本集并通过逻辑回归(Logistic Regression，LR)算法进行训练获得的预测模型。逻辑回归是对线性回归的非线性转换，逻辑回归的逻辑分布是一个S型分布函数，将逻辑回归模型输出的预测的概率限定的0到1之间。本实施例中，采用逻辑回归算法训练获得的预测模型，对目标用户标识是否属于恶意用户标识类进行预测获得的概率更接近真实的概率。

上述实施例中，将预测目标用户标识属于恶意用户标识类的概率的过程分为两个阶段，先在各用户行为场景下分别根据相应的用户特征数据进行预测，再根据各个用户行为场景下的预测结果得到最终的预测结果，使得对目标用户标识是否属于恶意用户标识类进行预测获得的概率更接近真实的概率。

在一个实施例中，通信费用透支额度分配方法还包括：收集包括用户通信行为场景的多个用户行为场景下的用户特征数据；对收集到的用户特征数据进行数据清洗；将清洗后的用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集；根据各样本集训练得到相应用户行为场景下的恶意用户预测子模型。

其中，数据清洗是发现并纠正数据中可识别的错误，包括检查数据一致性，处理无效值和缺失值等。对残缺数据进行填补、对错误数据的更正以及对重复数据的删除等。

具体地，分配服务器，可从各用户行为场景对应的服务器中，拉取与大量用户标识对应的用户特征数据。对拉取的用户特征数据进行数据清洗，并在数据清洗完成后，将清洗后的用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集。也就是每个用户行为场景对应一个样本集，该样本集中仅包括清洗后的、该用户行为场景下的用户特征数据。比如，用户通信行为场景下的样本集中仅包括清洗后的、用户通信行为场景下用户特征数据。

进一步地，分配服务器，可对每个样本集中包括的样本添加训练标签。训练标签用于表示样本所对应的用户标识是否属于恶意用户标识类。分配服务器，可预先设置判断用户标识是否属于恶意用户标识类的判断条件。该判断条件，可以是根据用户标识对应的某一用户行为场景下的用户特征数据设置，比如用户标识对应的某一用户行为场景下的恶意行为的次数超过预设次数。该判断条件，也可以是根据用户标识对应的各用户行为场景下的用户特征数据设置，比如用户标识对应的各用户行为场景下的恶意行为的次数超过预设次数。

当分配服务器通过用户标识所对应的用户特征数据，判定该判断条件被满足时，可为该用户标识对应的所对应的各用户行为场景下的样本，添加属于恶意用户标识类的训练标签。判断条件具体可以是预设时间间隔内，用户标识对应的恶意使用通信消耗资源的次数超过预设次数。预设时间间隔具体可以是多个自然月。判断条件比如半年内通话费用透支的次数超过一次。

分配服务器，再根据各样本集以及样本集中各样本的训练标签，训练得到相应用户行为场景下的恶意用户预测子模型。

举例说明，分配服务器收集到A、B和C三个用户标识的分别在用户行为场景1下对应的用户特征数据A1、B1和C1，在用户行为场景2下的用户特征数据A2、B2和C2。分配服务器可根据A1、或者根据A2、或者结合A1和A2，判断A是否属于恶意用户标识类，并在判断A属于或者不属于恶意用户标识类时，为A1和A2均相应添加属于或者不属于恶意用户标识类的训练标签。

在一个实施例中，对收集到的用户特征数据进行数据清洗，包括：去除收集到的用户特征数据中包括的坏数据；和/或，采用预设数据对未收集到的用户特征数据字段进行补充；和/或，对收集到的用户特征数据进行去重。

其中，坏数据也称脏数据，是错误的、具有误导性的、格式非法的数据。预设数据是预先设置的用于进行数据补充的默认数据。

具体地，分配服务器，可事先设置各用户行为场景下需要收集的用户特征数据的用户特征数据字段，还可设置这些用户特征数据字段中数据范围，以便判断是否有坏数据或者缺失的数据。分配服务器，可对收集的用户特征数据中的缺失数据、错误数据或者重复数据进行补充、更正或者删除。

在本实施例中，在将收集到的用户特征数据作为样本进行训练时，先进行数据清洗，这样可以保证进行训练的用户特征数据的准备性，以便通过准确的用户特征数据来真实反映用户真实的信用情况。

在一个实施例中，根据各样本集训练得到相应用户行为场景下的恶意用户预测子模型，包括：将各用户行为场景下的样本集中包括的样本划分为训练样本和测试样本；分别根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型；采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

其中，训练样本是用于训练模型的样本。测试样本是用于在模型训练后进行模型矫正的样本。

具体地，对于每个用户行为场景下的样本集，分配服务器可随机从中选取部分样本作为训练样本，再从选取的训练样本中提取特征，根据提取的特征以及训练样本的训练标签，通过逻辑回归算法进行训练，获得该用户行为场景下的恶意用户预测子模型。分配服务器可再将该用户行为场景下的样本集中剩余的样本作为测试样本，对训练得到的该用户行为场景下的恶意用户预测子模型进行校准。

进一步地，采用测试样本对训练得到的该用户行为场景下的恶意用户预测子模型进行校准，具体可以是将测试样本输入训练得到的该用户行为场景下的恶意用户预测子模型，将该恶意用户预测子模型的输出与测试样本的训练标签进行对比，若两者之间的差值落在允许的误差范围内，则完成对恶意用户预测子模型的校准，若两者之间的差值落在允许的误差范围外，则对恶意用户预测子模型进行参数调整，减少两者之间的差值，以完成对恶意用户预测子模型的校准。

在本实施例中，将样本集中的测试样本分为训练样本和测试样本两部分，在采用训练样本训练得到恶意用户预测子模型后，使用测试样本对恶意用户预测子模型进行校准，提高了训练得到的恶意用户预测子模型的准确性和稳定性。

在一个实施例中，分配服务器，还可设置恶意用户预测子模型的使用期限。使用期限具体可以是多个自然日或者多个自然月等。当分配服务器判断当前时间达到恶意用户预测子模型的使用期限时，可重新收集近期的用户特征数据，重新训练各恶意用户预测子模型，以保证恶意用户预测子模型的时效性和准确性。

上述实施例中，利用机器学习算法强大的学习和表示能力进行用户特征数据与用户是否属于恶意用户的对应关系学习，所训练得到的各恶意用户预测子模型对用户进行预测时，较传统方法对用户进行预测的效果更好。

在一个实施例中，根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率，包括：将分别获得的目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到恶意用户预测模型输出的目标用户标识属于恶意用户标识类的概率。

具体地，分配服务器在获得目标用户标识属于恶意用户标识类的各中间概率后，可将这些中间概率共同作为输入，输入恶意用户预测模型中，得到恶意用户预测模型输出的目标用户标识属于恶意用户标识类的概率。其中，恶意用户预测模型是事先训练得到的用于预测用户是否为恶意用户的模型。

在一个实施例中，通信费用透支额度分配方法还包括：确定各样本集中各样本所对应的样本用户标识；将对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率样本；根据每个样本用户标识属于恶意用户标识类的多个中间概率样本，训练得到恶意用户预测模型。

其中，样本用户标识用于标识收集到的用户特征数据所属的用户。中间概率样本是用于作为样本训练恶意用户预测模型的中间概率。

具体地，分配服务器，可在训练得到各用户行为场景下的恶意用户预测子模型后，利用各恶意用户预测子模型来训练最终预测的恶意用户预测模型。分配服务器，可确定各样本集中各样本所对应的样本用户标识，再将每个样本用户标识对应的多个样本，分别输入样本相应的用户行为场景下的恶意用户预测子模型，得到在各用户行为场景下预测的、样本用户标识属于恶意用户标识类的中间概率。

进一步地，分配服务器可将每个样本用户标识对应的多个中间概率，作为训练恶意用户预测模型的中间概率样本，将中间概率样本来自的样本的训练标签作为中间概率样本的训练标签，根据中间概率样本和中间概率样本的训练标签训练得到恶意用户预测模型。

在本实施例中，利用机器学习算法强大的学习和表示能力，进行各用户行为场景下用户属于恶意用户的中间概率与用户最终是否属于恶意用户的对应关系学习，所训练得到的恶意用户预测模型对用户进行最终预测时，较传统方法对用户进行预测的效果更好。

上述实施例中，将各用户行为场景下用户属于恶意用户的中间概率共同作为输入，通过恶意用户预测模型结合各场景下分别预测的结果进行预测，使得对用户的预测结果更准确。

在一个实施例中，通信费用透支额度分配方法还包括：将每个样本用户标识属于恶意用户标识类的多个中间概率样本，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率；将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本；根据降序排列的各信用分值样本划分信用等级量化值区间。为目标用户标识分配与信用分值相对应的通信费用透支额度包括：将信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识。

其中，信用等级量化值区间是对应信用等级的信用分值的取值范围。在本实施例中，分配服务器可预先设置一定数量的信用等级。比如，20个信用等级等。一个信用等级对应一个信用等级量化值区间。

具体地，分配服务器，可将每个样本用户标识属于恶意用户标识类的多个中间概率样本，共同输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率。分配服务器，可再根据用户标识属于恶意用户标识类的概率与信用分值的映射关系，将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本。

进一步地，分配服务器，再将各信用分值样本按照数值大小降序排序，根据最大信用分值与最小信用分值形成的信用分值数值范围，划分得到预设数量的信用等级量化值区间。其中，预设数量即预设的信用等级的数量。

在一个实施例中，各个信用等级对应的信用等级量化值区间的区间长度可以相等，也可以不相等。分配服务器可根据具体的应用场景进行划分。在本实施例中，分配服务器对最大信用分值与最小信用分值形成的信用分值数值范围进行均匀划分，得到区间长度相等的多个信用等级量化值区间。

举例说明，假设最大信用分值为300，最小信用分值为200，预先设置的信用等级的数量为5，那么区间长度为(300-200)/5＝20，也就是等级1对应的信用等级量化值区间为[100，120)，等级2对应的信用等级量化值区间为[120，140)，等级3对应的信用等级量化值区间为[140，160)，等级4对应的信用等级量化值区间为[160，180)，以及等级5对应的信用等级量化值区间为[180，200)。

更进一步地，分配服务器，可再将映射得到的信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识。具体地，分配服务器可事先设置信用等级量化值区间与通信费用透支额度的对应关系，以使分配服务器在需要进行通信费用透支额度分配时，根据该对应关系确定通信费用透支额度。

其中，分配服务器事先设置的信用等级量化值区间与通信费用透支额度的对应关系，可以是一一对应的对应关系。也就是一个信用等级量化值区间对应一个通信费用透支额度。比如信用等级量化值区间为[160，180)时，对应100份通信费用透支额度，或者信用等级量化值区间为[100，120)时，对应50份通信费用透支额度。分配服务器事先设置的信用等级量化值区间与通信费用透支额度的对应关系，也可以是多对一的对应关系。也就是多个信用等级量化值区间对应一个通信费用透支额度，这多个信用等级量化值区间为连续的信用等级量化值区间。比如信用等级量化值区间[100，120)和[120，140)均对应100份通信费用透支额度。

在一个实施例中，将信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识包括：确定信用分值所属的信用等级量化值区间；根据确定的信用等级量化值区间和信用分值，计算与信用分值相对应的通信费用透支额度；将计算得到的通信费用透支额度分配至目标用户标识。

具体地，分配服务器，可预先设置通过信用等级量化值区间和信用分值，计算与信用分值相对应的通信费用透支额度的计算公式。该计算公式如下式所示。

其中，H为通信费用透支额度，S为信用分值，S'为预设的用户量化值阈值，用于控制通信费用透支额度的上限值。N_d为目标用户标识对应的信用分值所在的信用等级，

为目标用户标识对应的信用分值所在的平均信用等级或者是预设的信用等级，用于控制低于信用分值阈值的信用分值相对应的通信费用透支额度。

表示选取0和

中较大的数。20表示划分得到的信用等级量化值区间的个数，也就是信用等级的个数，可根据实际情况调整。

这样，信用分值越高则相对应的通信费用透支额度越高，反之，信用分值越低则相对应的通信费用透支额度越低，当信用分值低于信用分值阈值时，则将该信用分值相对应的通信费用透支额度设置为0，避免了为信用过低的用户分配通信费用透支额度的情况。

举例说明，假设目标用户标识A、B和C对应的信用分值分别为500、700 和800，所在的信用等级分别为6、11、14，S'为400，

为10，则目标用户标识A、B和C相对应的通信费用透支额度如下表一所示。

表一：

目标用户标识	信用分值	信用等级	通信费用透支额度
				A	500	6	0
B	700	11	15
				C	800	14	80

上述实施例中，以样本对应的信用分值为依据进行信用等级量化值区间划分，在将根据样本训练得到的模型预测得到的概率映射为信用分值后，根据信用等级量化值区间为目标用户标识分配通信费用透支额度，使得用于预测的模型以及用于确定分配的资源份额的依据均来源于样本，从而保证了通信费用透支额度分配的合理性。

图3示出了一个实施例中模型训练过程的原理示意图。假设用户行为场景包括用户行为场景1、用户行为场景2和用户行为场景3，分配服务器收集了样本用户标识A的用户行为数据A1、A2和A3，样本用户标识B的用户行为数据 B1、B2和B3，以及样本用户标识C的用户行为数据C1、C2和C3。从A1和/ 或A2和/或A3判断A属于恶意用户标识类，则为A1、A2和A3添加属于恶意用户标识类的训练标签。从B1和/或B2和/或B3判断B不属于恶意用户标识类，则为B1、B2和B3添加不属于恶意用户标识类的训练标签。从C1和/或C2和/ 或C3判断C不属于恶意用户标识类，则为C1、C2和C3添加不属于恶意用户标识类的训练标签。

在通过A1、B1、C1和相应的训练标签训练得到用户行为场景1下的恶意用户预测子模型1，通过A2、B2、C2和相应的训练标签训练得到用户行为场景 2下的恶意用户预测子模型2，以及通过A3、B3、C3和相应的训练标签训练得到用户行为场景3下的恶意用户预测子模型3后，分配服务器再将A1、B1和 C1分别输入恶意用户预测子模型1输出中间概率Pa1、中间概率Pb1和中间概率Pc1，将A2、B2和C2分别输入恶意用户预测子模型2输出中间概率Pa2、中间概率Pb2和中间概率Pc2，以及将A3、B3和C3分别输入恶意用户预测子模型3输出中间概率Pa3、中间概率Pb3和中间概率Pc3。

分配服务器再将A1、A2和A3的训练标签作为Pa1、Pa2和Pa3的训练标签，将B1、B2和B3的训练标签作为Pb1、Pb2和Pb3的训练标签，将C1、C2 和C3的训练标签作为Pc1、Pc2和Pc3的训练标签，通过将Pa1、Pa2和Pa3作为共同输入、Pb1、Pb2和Pb3作为共同输入，以及将Pc1、Pc2和Pc3作为共同输入，训练得到恶意用户预测模型。在训练完成后，再次输入得到Pa1、Pa2 和Pa3的输出Pa，Pb1、Pb2和Pb3的输出Pb，以及Pc1、Pc2和Pc3的输出Pc，也就是最终的A、B和C分别属于恶意用户标识类的概率。

如图4所示，在一个具体的实施例中，通信费用透支额度分配方法具体包括以下步骤：

S402，收集包括用户通信行为场景和用户社交行为场景的多个用户行为场景下的用户特征数据。

S404，去除收集到的用户特征数据中包括的坏数据；和/或，采用预设数据对未收集到的用户特征数据字段进行补充；和/或，对收集到的用户特征数据进行去重。

S406，将清洗后的用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集。

S408，将各用户行为场景下的样本集中包括的样本划分为训练样本和测试样本；分别根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型；采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

S410，确定各样本集中各样本所对应的样本用户标识；将对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率样本；根据每个样本用户标识属于恶意用户标识类的多个中间概率样本，训练得到恶意用户预测模型。

S412，将每个样本用户标识属于恶意用户标识类的多个中间概率样本，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率；将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本；根据降序排列的各信用分值样本划分信用等级量化值区间。

S414，获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景。

S416，将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型；分别获得通过各恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率。

S418，将分别获得的目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到恶意用户预测模型输出的目标用户标识属于恶意用户标识类的概率。

S420，将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关。

S422，确定信用分值所属的信用等级量化值区间；根据确定的信用等级量化值区间和信用分值，计算与信用分值相对应的通信费用透支额度；将计算得到的通信费用透支额度分配至目标用户标识。

其中，本实施例中的通信费用透支额度分配方法分为两个阶段，分别为进行模型训练的模型训练阶段和使用训练得到的模型进行预测以进行资源分配的模型使用阶段。其中，S402至S412为模型训练阶段，S414至S422为模型使用阶段。S414至S422中预测目标用户标识属于恶意用户标识类的概率所用到的恶意用户预测子模型和恶意用户模型，为S402至S412中训练得到的恶意用户预测子模型和恶意用户模型。

在本实施例中，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行资源分配的准确性。

如图5所示，在一个实施例中，提供了一种通信费用透支额度分配装置500。参照图，该通信费用透支额度分配装置500包括：获取模块501、确定模块502、映射模块503和分配模块504。

获取模块501，用于获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景。

确定模块502，用于根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率。

映射模块503，用于将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关。

分配模块504，用于为目标用户标识分配与信用分值相对应的通信费用透支额度。

上述通信费用透支额度分配装置500，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行通信费用透支额度分配的准确性。

在一个实施例中，确定模块502还用于将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型；分别获得通过各恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率；根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率。

如图6所示，在一个实施例中，通信费用透支额度分配装置500还包括：收集模块505、清洗模块506和子模型训练模块507。

收集模块505，用于收集包括用户通信行为场景的多个用户行为场景下的用户特征数据。

清洗模块506，用于对收集到的用户特征数据进行数据清洗。

子模型训练模块507，用于将清洗后的用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集；根据各样本集训练得到相应用户行为场景下的恶意用户预测子模型。

在一个实施例中，清洗模块506还用于去除收集到的用户特征数据中包括的坏数据；和/或，采用预设数据对未收集到的用户特征数据字段进行补充；和/ 或，对收集到的用户特征数据进行去重。

在一个实施例中，子模型训练模块507还用于将各用户行为场景下的样本集中包括的样本划分为训练样本和测试样本；分别根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型；采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

在一个实施例中，确定模块503还用于将分别获得的目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到恶意用户预测模型输出的目标用户标识属于恶意用户标识类的概率。

如图7所示，在一个实施例中，通信费用透支额度分配装置500还包括：模型训练模块508。

模型训练模块508，用于确定各样本集中各样本所对应的样本用户标识；将对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率样本；根据每个样本用户标识属于恶意用户标识类的多个中间概率样本，训练得到恶意用户预测模型。

如图8所示，在一个实施例中，通信费用透支额度分配装置500还包括：区间划分模块509。

区间划分模块509，用于将每个样本用户标识属于恶意用户标识类的多个中间概率样本，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率；将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本；根据降序排列的各信用分值样本划分信用等级量化值区间。

分配模块504还用于将信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识。

在一个实施例中，分配模块504还用于确定信用分值所属的信用等级量化值区间；根据确定的信用等级量化值区间和信用分值，计算与信用分值相对应的通信费用透支额度；将计算得到的通信费用透支额度分配至目标用户标识。

在一个实施例中，用户行为场景至少还包括用户社交行为场景；通信费用透支额度为通信费用透支额度。

图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的分配服务器110。如图9所示，该计算机设备包括通过系统总线连接的处理器、处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现发表内容处理方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行发表内容处理方法。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的通信费用透支额度分配装置可以实现为一种计算机程序的形式，计算机程序可在如图9所示的计算机设备上运行，计算机设备的非易失性存储介质可存储组成该通信费用透支额度分配装置的各个程序模块，比如，图5所示的获取模块501、确定模块502、映射模块503和分配模块504等。各个程序模块中包括计算机程序，计算机程序用于使计算机设备执行本说明书中描述的本申请各个实施例的通信费用透支额度分配方法中的步骤。

例如，计算机设备可以通过如图5所示的通信费用透支额度分配装置500 中的获取模块501获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景。通过确定模块502根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率。通过映射模块503将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关。通过分配模块 504为目标用户标识分配与信用分值相对应的通信费用透支额度。

在一个实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时，使得处理器执行以下步骤：获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景；根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率；将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关；为目标用户标识分配与信用分值相对应的通信费用透支额度。

在一个实施例中，根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率，包括：将目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型；分别获得通过各恶意用户预测子模型输出的、目标用户标识属于恶意用户标识类的中间概率；根据分别获得的目标用户标识属于恶意用户标识类的中间概率，生成目标用户标识属于恶意用户标识类的概率。

在一个实施例中，该计算机程序被处理器执行时，还使得处理器执行以下步骤：收集包括用户通信行为场景的多个用户行为场景下的用户特征数据；对收集到的用户特征数据进行数据清洗；将清洗后的用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集；根据各样本集训练得到相应用户行为场景下的恶意用户预测子模型。

在一个实施例中，该计算机程序被处理器执行时，还使得处理器执行以下步骤：确定各样本集中各样本所对应的样本用户标识；将对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率样本；根据每个样本用户标识属于恶意用户标识类的多个中间概率样本，训练得到恶意用户预测模型。

在一个实施例中，该计算机程序被处理器执行时，还使得处理器执行以下步骤：将每个样本用户标识属于恶意用户标识类的多个中间概率样本，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率；将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本；根据降序排列的各信用分值样本划分信用等级量化值区间。为目标用户标识分配与信用分值相对应的通信费用透支额度，包括：将信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识。

在一个实施例中，将信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至目标用户标识，包括：确定信用分值所属的信用等级量化值区间；根据确定的信用等级量化值区间和信用分值，计算与信用分值相对应的通信费用透支额度；将计算得到的通信费用透支额度分配至目标用户标识。

上述存储介质，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行通信费用透支额度分配的准确性。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中储存有计算机程序，计算机程序被处理器执行时，使得处理器执行以下步骤：获取多个用户行为场景下分别与目标用户标识对应的用户特征数据，多个用户行为场景包括用户通信行为场景；根据目标用户标识所对应的各用户行为场景下的用户特征数据，确定目标用户标识属于恶意用户标识类的概率；将目标用户标识属于恶意用户标识类的概率，映射为目标用户标识相应的信用分值；其中，目标用户标识相应的信用分值与目标用户标识属于恶意用户标识类的概率负相关；为目标用户标识分配与信用分值相对应的通信费用透支额度。

上述计算机设备，获取多个用户行为场景下用于描述目标用户的用户特征数据，即可根据获取的这些用户数据确定该目标用户为恶意用户的概率，继而自动将确定目标用户为恶意用户的概率，映射为目标用户的信用分值，目标用户为恶意用户的概率越大，目标用户的信用分值也就越低，从而为目标用户分配与该信用分值相对应的通信费用透支额度。这样不仅在用户通信行为场景下获取用户特征数据，还在其他用户行为场景下获取用户特征数据，避免了数据来源的局限性，使得用于描述用户的数据多样化全面化，能够反映用户真实的生活状况，从而提高了对用户进行信用评估的准确性，进而提高了对用户进行通信费用透支额度分配的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的实施例中所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)，它用作外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路 (Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种通信费用透支额度分配方法，包括：

获取多个用户行为场景各自对应的样本集，每个所述样本集包括相应用户行为场景下的用户特征数据，所述多个用户行为场景至少包括用户通信行为场景，所述用户通信行为场景下的用户特征数据包括用户通信费用使用数据；

对于每个用户行为场景下的样本集，分别根据样本以及样本的训练标签进行训练，获得相应用户行为场景下的恶意用户预测子模型；

在训练得到的恶意用户预测子模型达到使用期限时，根据重新获取的多个用户行为场景各自对应的样本集，重新训练各个恶意用户预测子模型；在训练得到的恶意用户预测子模型未达到使用期限时，确定每个样本集中对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率，基于机器学习算法，根据所述属于恶意用户标识类的多个中间概率，以及所述中间概率来自的样本的训练标签进行训练得到恶意用户预测模型；

将每个样本用户标识属于恶意用户标识类的多个中间概率，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率，将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本，其中信用分值与属于恶意用户标识类的概率负相关；

将各信用分值样本按照数值大小降序排序，根据最大信用分值与最小信用分值形成的信用分值数值范围进行均匀划分，得到区间长度相等的多个信用等级量化值区间；

获取多个用户行为场景下分别与目标用户标识对应的用户特征数据；

将所述目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型，分别获得通过各所述恶意用户预测子模型输出的、所述目标用户标识属于恶意使用通信费用的恶意用户标识类的中间概率，将分别获得的所述目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到所述恶意用户预测模型输出的所述目标用户标识属于恶意用户标识类的概率；

将所述目标用户标识属于恶意用户标识类的概率，映射为所述目标用户标识相应的信用分值，将所述信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至所述目标用户标识。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对收集到的所述用户特征数据进行数据清洗；

将清洗后的所述用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集。

3.根据权利要求2所述的方法，其特征在于，所述对收集到的所述用户特征数据进行数据清洗，包括：

去除收集到的所述用户特征数据中包括的坏数据；和/或，

采用预设数据对未收集到的用户特征数据字段进行补充；和/或，

对收集到的所述用户特征数据进行去重。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型之后，采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

5.根据权利要求1所述的方法，其特征在于，所述将所述信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至所述目标用户标识，包括：

确定所述信用分值所属的信用等级量化值区间；

根据确定的所述信用等级量化值区间和所述信用分值，计算与所述信用分值相对应的通信费用透支额度；

将计算得到的所述通信费用透支额度分配至所述目标用户标识。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述用户行为场景至少还包括用户社交行为场景。

7.一种通信费用透支额度分配装置，包括：

收集模块，用于获取多个用户行为场景各自对应的样本集，每个所述样本集包括相应用户行为场景下的用户特征数据，所述多个用户行为场景至少包括用户通信行为场景，所述用户通信行为场景下的用户特征数据包括用户通信费用使用数据；

子模型训练模块，用于对于每个用户行为场景下的样本集，分别根据样本以及样本的训练标签进行训练，获得相应用户行为场景下的恶意用户预测子模型；

模型训练模块，用于在训练得到的恶意用户预测子模型达到使用期限时，根据重新获取的多个用户行为场景各自对应的样本集，重新训练各个恶意用户预测子模型；在训练得到的恶意用户预测子模型未达到使用期限时，确定每个样本集中对应相同样本用户标识的各样本，分别输入训练得到的相应用户行为场景下的恶意用户预测子模型，得到每个样本用户标识属于恶意用户标识类的多个中间概率，基于机器学习算法，根据所述属于恶意用户标识类的多个中间概率，以及所述中间概率来自的样本的训练标签进行训练得到恶意用户预测模型；

区间划分模块，用于将每个样本用户标识属于恶意用户标识类的多个中间概率，输入训练得到的恶意用户预测模型，得到每个样本用户标识属于恶意用户标识类的概率，将每个样本用户标识属于恶意用户标识类的概率，映射为每个样本用户标识相应的信用分值样本，其中信用分值与属于恶意用户标识类的概率负相关；将各信用分值样本按照数值大小降序排序，根据最大信用分值与最小信用分值形成的信用分值数值范围进行均匀划分，得到区间长度相等的多个信用等级量化值区间；

获取模块，用于获取多个用户行为场景下分别与目标用户标识对应的用户特征数据；

确定模块，用于将所述目标用户标识所对应的各用户行为场景下的用户特征数据，分别输入相应用户行为场景下的恶意用户预测子模型，分别获得通过各所述恶意用户预测子模型输出的、所述目标用户标识属于恶意使用通信费用的恶意用户标识类的中间概率，将分别获得的所述目标用户标识属于恶意用户标识类的中间概率，一同输入恶意用户预测模型，得到所述恶意用户预测模型输出的所述目标用户标识属于恶意用户标识类的概率；

映射模块，用于将所述目标用户标识属于恶意用户标识类的概率，映射为所述目标用户标识相应的信用分值；

分配模块，用于将所述信用分值所属的信用等级量化值区间相对应的通信费用透支额度，分配至所述目标用户标识。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

收集模块，用于收集包括用户通信行为场景的多个用户行为场景下的用户特征数据；

清洗模块，用于对收集到的所述用户特征数据进行数据清洗；

子模型训练模块，用于将清洗后的所述用户特征数据按用户行为场景分类，得到各用户行为场景下的样本集。

9.根据权利要求8所述的装置，其特征在于，所述清洗模块还用于去除收集到的所述用户特征数据中包括的坏数据；和/或，采用预设数据对未收集到的用户特征数据字段进行补充；和/或，对收集到的所述用户特征数据进行去重。

10.根据权利要求7所述的装置，其特征在于，所述子模型训练模块还用于将各用户行为场景下的样本集中包括的样本划分为训练样本和测试样本；在根据从各用户行为场景下的样本集中划分出的训练样本，训练得到相应用户行为场景下的恶意用户预测子模型之后，采用从各用户行为场景下的样本集中划分出的测试样本，分别对训练得到的相应用户行为场景下的恶意用户预测子模型进行校准。

11.根据权利要求7所述的装置，其特征在于，所述分配模块，还用于确定所述信用分值所属的信用等级量化值区间；根据确定的所述信用等级量化值区间和所述信用分值，计算与所述信用分值相对应的通信费用透支额度；将计算得到的所述通信费用透支额度分配至所述目标用户标识。

12.根据权利要求7至11任一项所述的装置，其特征在于，所述用户行为场景至少还包括用户社交行为场景。

13.一种计算机设备，包括存储器和处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至6任一项所述方法的步骤。

14.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6任一项所述方法的步骤。