CN109284920B - 基于大数据的用户信息风险评定的方法及系统 - Google Patents
基于大数据的用户信息风险评定的方法及系统 Download PDFInfo
- Publication number
- CN109284920B CN109284920B CN201811067711.5A CN201811067711A CN109284920B CN 109284920 B CN109284920 B CN 109284920B CN 201811067711 A CN201811067711 A CN 201811067711A CN 109284920 B CN109284920 B CN 109284920B
- Authority
- CN
- China
- Prior art keywords
- risk
- data
- dimension
- risk assessment
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及用户号码风险评定的方法、系统、计算机设备和存储介质。所述方法包括:获取待评估的号码,获取所述号码对应的衍生数据;将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;根据所述风险模型库的输出得到所述号码对应的各维度的风险值;通过各维度的风险值,得到所述号码的风险评定结果。上述方法用户号码风险评估效率高,并且相对于人工评估的失误,还有利于提高评估的准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及用户号码风险评定的方法、系统、计算机设备和存储介质。
背景技术
随着移动网络的发展,运营商除了提供可靠的网络服务,还会经常开展各种优惠活动以吸引用户消费。为了达到运营效果最大化,运营商会对申请优惠的号码先进行风险评定,利用系统中已收集的数据进行风险决策,对于评定为高风险号码可能会谨慎考虑优惠力度。
在实现本发明的过程中,发明人发现现有技术中存在如下问题,由于运营商对应的手机号码属性多,消费数据、欠费数据繁杂,需要判断的逻辑复杂,现有的风险评估是使用Excel进行人工评定,对于十万数量级别以上的号码及其衍生数据,因此存在效率低下的问题,并且容易出错。
发明内容
基于此,有必要针对现有方式对用户号码风险评定存在效率较低的问题,提供一种用户号码风险评定的方法、系统、计算机设备和存储介质。
一方面,本发明实施例提供一种用户号码风险评定的方法,包括:
获取待评估的号码,获取所述号码对应的衍生数据;
将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;
根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
通过各维度的风险值,得到所述号码的风险评定结果。
在其中一个实施例中,所述将所述衍生数据信息输入到预先建立的风险模型库中,之前还包括:
获取多个样本号码;
获取各样本号码对应的样本衍生数据;
获取预先设置的维度划分规则,根据所述维度划分规则将所述多个样本号码划分为多个维度;
获取各维度包含的全部样本号码的样本衍生数据;
针对各维度对应的样本衍生数据,构建对应的风险评估模型;
根据所述维度划分规则、所述风险评估模型,构建风险模型库。
在其中一个实施例中,所述根据所述维度划分规则将所述多个样本号码划分为多个维度,包括:
以样本号码为第一主键,统计所述样号码的来自不同数据源的样本衍生数据,得到第一维度;
以多个样本号码所属的群体为第二主键,统计属于同一群体的全部样本号码的样本衍生数据,得到第二维度。
在其中一个实施例中,所述针对各维度对应的样本衍生数据,构建对应的风险评估模型,之前还包括:
针对各维度对应的样本衍生数据,进行数据规整,得到各维度对应的规整后的样本衍生数据;
针对各维度规整后的样本衍生数据,提取特征数据,根据所述特征数据构建各维度对应的风险评估模型。
在其中一个实施例中,所述根据所述特征数据构建各维度对应的风险评估模型,包括:
针对所述第一维度,所述特征数据包括一年内申请优惠的次数以及欠费起始时间至今的时长,构建的风险评估模型包括:
f(x)=a1*fx_1+b1*fx_1;
针对所述第二维度,所述特征数据包括集团下存在欠费记录的号码的数据与号码总量的比例以及集团近半年的消费总额的升降信息,构建的风险评估模型包括:
g(y)=a2*gy_1+b2*gy_2;
其中,a1、a2、b1、b2为预先设定的权重系数。
在其中一个实施例中,所述通过各维度的风险值,得到所述号码的风险评定结果,包括:
获取所述号码在第一维度的风险值,作为第一风险值;
获取所述号码在第二维度的风险值,作为第二风险值;
根据所述第一风险值、第二风险值,得到所述号码的风险评定结果。
在其中一个实施例中,所述衍生数据包括:
订阅套餐信息、流量使用信息、号码归属信息、用户身份信息、欠费信息中的至少一项。
另一方面,提供一种用户号码风险评定的系统,包括:
号码及数据获取模块,用于获取待评估的号码,获取所述号码对应的衍生数据;
风险分析模块,用于将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;
分析结果获取模块,用于根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
风险评估模块,用于通过各维度的风险值,得到所述号码的风险评定结果。
再一方面,本发明实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例的用户号码风险评定方法的步骤。
再一方面,本发明实施例提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例的用户号码风险评定方法的步骤。
上述技术方案中的一个技术方案具有如下优点或有益效果:对于一个或者批量的待评估的号码,获取各号码对应的衍生数据;将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;根据所述风险模型库的输出得到所述号码对应的各维度的风险值;通过各维度的风险值,得到所述号码的风险评定结果。上述技术方案的评估效率高,并且相对于人工评估的失误,还有利于提高评估的准确性。
附图说明
图1为一个实施例中用户号码风险评定的方法的应用环境图;
图2为一实施例的用户号码风险评定的方法的示意性流程图;
图3为一实施例的用户号码风险评定的系统的示意性结构图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请提供的用户号码风险评定的方法,可以应用于如图1所示的应用环境中,系统架构包括:原始数据层、数据规整层、风险分析层、结果汇总层以及开放接口层,各层的交互逻辑和位置关系如图1所示。
其中,上述原始数据层,可以直接使用现在的数据存储技术,例如采用关系型数据库模型,通过原始数据层保存着多个用户号码的原始衍生数据,此外,原始衍生数据可以以文本信息、ftp数据、Excel文件、关系数据表等形式存储,其中,用户号码的原始衍生数据可以包括:手机号码在消费时产生的订阅套餐数据、流量使用数据、ARPU(Average RevenuePer User)每用户平均收入、号码欠费数据等,此外,所述原始数据层还可以包括集团用户包括的全部手机号码及其衍生数据,例如集团的消费总额,集团名下各号码的消费数据、欠费时长及金额等。这些数据是风险分析层进行风险评定、数据挖掘以及构建风险评估模型的基础,理论上,原始数据层的数据来源越可靠,通过该系统得到的风险评定结果就越精确,当原始数据层中不同来源的衍生数据有冲突时,风险分析层优先选取可靠性更高的数据来源,例如数据库数据通常比文本数据要可靠。
数据规整层用于对原始数据层的数据进行规则处理,包括:合并不同的数据来源信息,清洗不规范数据,提取用于风险评定的标签(即特征数据),原始数据由于来源渠道和来源格式的多样性,数据规整层在清洗时应先定一个统一标准,如涉及到金钱的数值,所有数据统一保留四位小数,涉及到日期的数据应根据具体情况,可以精确到天如欠费日期,也可以精确到秒如套餐订阅时间;对于不规范的数据如字段缺失、字段描述错误应根据情况取舍;如一些集团产品名称的缺失并不会影响相关的集团下号码的风险判定,应该保留;某些缺失时间的欠费数据因为无法判断是什么时候产生的欠费,这种数据是没有保留价值的,可以删除。通过数据规整层规整后的衍生数据可以生成多维度信息。多维度的划分可以以具体业务为准,也可以根据号码的某个属性来划分,例如可以先把多个号码归为不同的群体,同一群体里面的号码都具备相同或者相应的特征,以这个群体生成一个维度信息,提取对应特性数据。以集团下用户号码为例,号码都是有归属集团的,以集团编号为分组,当以集团这个维度去分析时,可以统计集团所有号码的衍生数据,例如分析集团所有号码的消费总值、消费最大值、消费最低值和/或消费平均值,能更加直观的评定集团下号码的风险。在数据规整层,为了方便计算机存取和使用,可以使用关系型数据库例如sqlserver,存储规则后的数据。
风险分析层的作用包括:
首先,风险分析层用于划分号码的多维度信息,例如针对一批号码,有对于个人号码的维度信息,也有号码归属的集团的集团维度信息,还能根据实际情况自定义划分其他维度规则。
然后,风险分析层还可用于制定不同维度的风险评定模型,大部分情况下,不同维度的风险评定模型不同。
此外,风险分析层还可用于根据划分好的维度和制定好的风险评定模型,迭代计算输入的待评估的号码的风险值,输出结果到汇总层。风险分析层输出的号码风险分析结果中,可以保存风险产生的详情信息,以集团维度的号码的风险分析结果为例,记录风险产生的原因和详情,例如该集团下所有欠费产品数量超过一半,并且该集团近半年消费金额下降。
结果汇总层,用于对风险分析结果数据进行汇总,例如生成工单、推送至外部系统、生成下载结果等。
开放接口层,用于提供一个开放接口给使用者上传待评估的号码,同时对于已有的风险评估模型,使用者还可以自由制定其他风险评估模型,此处的风险将单独生成一个维度参与到风险汇总计算中。其中,数据导出是系统的可选特征,因为系统的结果汇总层作为导出数据源,能够在将来对系统做出改进。
在一个实施例中,如图2所示,提供了一种用户号码风险评定的方法,以该方法应用于图1中的系统架构为例进行说明,所述方法包括以下步骤:
S110,获取待评估的号码,获取所述号码对应的衍生数据。
其中,待评估的号码可以是手机号码,也可以是固话号码。衍生数据可以包括:订阅套餐信息、流量使用信息、号码归属信息、用户身份信息、欠费信息中的至少一项。
S120,将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值。
S130,根据所述风险模型库的输出得到所述号码对应的各维度的风险值。
S140,通过各维度的风险值,得到所述号码的风险评定结果。
通过本实施例,对于一个或者批量的待评估的号码,获取各号码对应的衍生数据;将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;根据所述风险模型库的输出得到所述号码对应的各维度的风险值;通过各维度的风险值,得到所述号码的风险评定结果。上述技术方案的评估效率高,并且相对于人工评估的失误,还有利于提高评估的准确性。
进一步地,在一个实施例中,上述的用户号码风险评定的方法还包括构建风险模型库的步骤,该步骤具体可包括:
获取多个样本号码;获取各样本号码对应的样本衍生数据;获取预先设置的维度划分规则,根据所述维度划分规则将所述多个样本号码划分为多个维度;获取各维度包含的全部样本号码的样本衍生数据;针对各维度对应的样本衍生数据,构建对应的风险评估模型;根据所述维度划分规则、所述风险评估模型,构建风险模型库。
其中,样本号码可以是手机号码,也可以是固话号码,样本号码与上述的待评估的号码应当为同一类型,“样本”仅用于区分用在不同阶段的号码,不对号码本身产生限定。同理,“样本”也不对衍生数据本身产生限定。
在一些场景中,所述根据所述维度划分规则将所述多个样本号码划分为多个维度,包括:以样本号码为第一主键,统计所述样号码的来自不同数据源的样本衍生数据,得到第一维度;以多个样本号码所属的群体为第二主键,统计属于同一群体的全部样本号码的样本衍生数据,得到第二维度。由此可得到两个维度的衍生数据,进行两个维度的风险分析。
在一些场景中,所述针对各维度对应的样本衍生数据,构建对应的风险评估模型,之前还包括:针对各维度对应的样本衍生数据,进行数据规整,得到各维度对应的规整后的样本衍生数据;针对各维度规整后的样本衍生数据,提取特征数据,根据所述特征数据构建各维度对应的风险评估模型。
其中参见上述数据规整层的作用,数据规整具体可以包括:如涉及到金钱的数值,所有数据统一保留四位小数,涉及到日期的数据应根据具体情况,可以精确到天如欠费日期,也可以精确到秒如套餐订阅时间;对于不规范的数据如字段缺失、字段描述错误应根据情况取舍。
在一些场景中,所述根据所述特征数据构建各维度对应的风险评估模型,包括:针对上述的第一维度,提取的特征数据包括:号码在一年内申请优惠的次数,以及号码欠费起始时间至今的时长,基于该特征数据可构建如下的风险评估模型:
f(x)=a1*fx_1+b1*fx_2;
针对上述的第二维度,提取的特征数据包括:集团下存在欠费记录的号码的数据与号码总量的比例,以及集团近半年的消费总额的升降信息,基于该特征数据可构建如下的风险评估模型:
g(y)=a2*gy_1+b2*gy_2;
其中,a1、a2、b1、b2为预先设定的权重系数。
在一些场景中,所述通过各维度的风险值,得到所述号码的风险评定结果,包括:获取所述号码在第一维度的风险值,作为第一风险值;获取所述号码在第二维度的风险值,作为第二风险值;若所述第一风险值、第二风险值中至少一个不为0,则将所述号码评定为高风险。
以上面集团维度的风险评估模型为例,当gy_1和gy_2两个至少一个风险判断均为真,即g(x)不为0时,则记录这个集团的风险评估结果为高风险,记录风险产生的原因和详情。接着进行单个号码维度的风险分析,单个号码维度对应的fx_1和fx_2的判断即便均为假,即f(x)=0,此时所述号码的风险评定结果评定仍然为高风险,因为两个维度中有一个维度评定出现了高风险。
需要说明的是,对于上述的维度划分和各维度的风险评估模型,仅仅为一个示例,根据实际情况,还可以采用其他维度划分方式和各维度的风险评估模型。
应该理解的是,对于前述的各方法实施例,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,方法实施例的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
基于与上述实施例中的用户号码风险评定的方法相同的思想,本文还提供用户号码风险评定的系统。
在一个实施例中,如图3所示,本实施例的用户号码风险评定的系统包括:
号码及数据获取模块301,用于获取待评估的号码,获取所述号码对应的衍生数据;
风险分析模块302,用于将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;
分析结果获取模块303,用于根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
风险评估模块304,用于通过各维度的风险值,得到所述号码的风险评定结果。
在一实施例中,上述用户号码风险评定的系统还包括风险模型库构建模块,该风险模型库构建模块具体包括:
样本获取单元,用于获取多个样本号码;以及用于获取各样本号码对应的样本衍生数据;
维度划分单元,用于获取预先设置的维度划分规则,根据所述维度划分规则将所述多个样本号码划分为多个维度;
维度数据获取单元,用于获取各维度包含的全部样本号码的样本衍生数据;
评估模型构建单元,用于针对各维度对应的样本衍生数据,构建对应的风险评估模型;
模型库构建单元,用于根据所述维度划分规则、所述风险评估模型,构建风险模型库。
在一实施例中,上述维度划分单元,具体用于以样本号码为第一主键,统计所述样号码的来自不同数据源的样本衍生数据,得到第一维度;以多个样本号码所属的群体为第二主键,统计属于同一群体的全部样本号码的样本衍生数据,得到第二维度。
在一实施例中,评估模型构建单元,具体用于针对各维度对应的样本衍生数据,进行数据规整,得到各维度对应的规整后的样本衍生数据;针对各维度规整后的样本衍生数据,提取特征数据,根据所述特征数据构建各维度对应的风险评估模型。
在一实施例中,评估模型构建单元,具体用于针对所述第一维度,所述特征数据包括一年内申请优惠的次数以及欠费起始时间至今的时长,构建的风险评估模型包括:
f(x)=a1*fx_1+b1*fx_1;
针对所述第二维度,所述特征数据包括集团下存在欠费记录的号码的数据与号码总量的比例以及集团近半年的消费总额的升降信息,构建的风险评估模型包括:
g(y)=a2*gy_1+b2*gy_2;
其中,a1、a2、b1、b2为预先设定的权重系数,为常量。
在一实施例中,风险评估模块304,具体用于获取所述号码在第一维度的风险值,作为第一风险值;获取所述号码在第二维度的风险值,作为第二风险值;若所述第一风险值、第二风险值中至少一个不为0,则将所述号码评定为高风险。
关于用户号码风险评定的系统的具体限定可以参见上文中对于用户号码风险评定的方法的限定,在此不再赘述。上述用户号码风险评定的系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
此外,上述示例的用户号码风险评定的系统的实施方式中,各程序模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的程序模块完成,即将所述用户号码风险评定的系统的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分功能。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户号码风险评定的系统的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户号码风险评定的方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待评估的号码,获取所述号码对应的衍生数据;
将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;
根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
通过各维度的风险值,得到所述号码的风险评定结果。
在一些实施例中,处理器执行计算机程序时还实现其他任意实施例的用户号码风险评定的方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待评估的号码,获取所述号码对应的衍生数据;
将所述衍生数据信息输入到预先建立的风险模型库中;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;
根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
通过各维度的风险值,得到所述号码的风险评定结果。
在一些实施例中,计算机程序被处理器执行时还实现其他任意实施例的用户号码风险评定的方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
本文实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或(模块)单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在本文中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种用户号码风险评定的方法,其特征在于,应用于预先搭建的风险评定系统,所述方法包括:
获取待评估的号码,包括:基于所述风险评定系统的开放接口层提供的开放接口,接收使用者上传的待评估的号码;
从所述风险评定系统的原始数据层获取所述号码对应的衍生数据;所述号码为手机号码或者固话号码;所述原始数据层保存着多个用户号码的原始衍生数据,所述原始数据层还包括集团用户包括的全部手机号码及其原始衍生数据;其中,所述原始衍生数据以文本信息、ftp数据、Excel文件、关系数据表中至少一种形式存储,其中,用户号码的原始衍生数据包括订阅套餐信息、流量使用信息、号码归属信息、用户身份信息、欠费信息中的至少两项;
将所述衍生数据信息输入到预先建立的风险模型库中以及所述使用者通过所述开放接口层提供的开放接口制定的其他风险评估模型;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;所述号码所属的维度至少包含:表征号码的来自不同数据源的衍生数据的第一维度和号码所归属群体的第二维度;不同维度对应不同风险评估模型;所述风险评估模型为基于对应特征数据的数学模型;根据所述风险模型库的输出得到所述号码对应的各维度的风险值;通过各维度的风险值,得到所述号码的风险评定结果;所述开放接口层还提供开放接口给所述使用者制定其他风险评估模型,所述其他风险评估模型将单独生成一个维度参与到所述号码的风险评定结果的汇总计算中;
通过所述风险评定系统的结果汇总层对风险评定结果数据进行汇总,包括生成工单、推送至外部系统和/或生成下载结果;
获取待评估的号码之前还包括:将多个样本号码划分为两个维度,获取各维度包含的全部样本号码的样本衍生数据,具体包括:以样本号码为第一主键,统计所述样本 号码的来自不同数据源的样本衍生数据,得到第一维度;以多个样本号码所属的群体为第二主键,统计属于同一群体的全部样本号码的样本衍生数据,得到第二维度;针对各维度的样本衍生数据,分别提取特征数据,根据所述特征数据构建各维度对应的风险评估模型;第一维度对应的特征数据包括一年内申请优惠的次数以及欠费起始时间至今的时长;第二维度对应的特征数据包括集团下存在欠费记录的号码的数据与号码总量的比例以及集团近半年的消费总额的升降信息;
其中,针对所述第一维度,构建的风险评估模型包括:
f(x)=a1*fx_1+b1*fx_2;
针对所述第二维度,构建的风险评估模型包括:
g(y)=a2*gy_1+b2*gy_2;
其中,a1、a2、b1、b2为预先设定的权重系数。
2.根据权利要求1所述的方法,其特征在于,所述将所述衍生数据信息输入到预先建立的风险模型库中,之前还包括:
获取多个样本号码;
获取各样本号码对应的样本衍生数据;
根据所述维度划分规则、所述风险评估模型,构建风险模型库。
3.根据权利要求1所述的方法,其特征在于,所述针对各维度的样本衍生数据,分别提取特征数据,根据所述特征数据构建各维度对应的风险评估模型,之前还包括:
针对各维度对应的样本衍生数据,进行数据规整,得到各维度对应的规整后的样本衍生数据。
4.根据权利要求1所述的方法,其特征在于,所述通过各维度的风险值,得到所述号码的风险评定结果,包括:
获取所述号码在第一维度的风险值,作为第一风险值;
获取所述号码在第二维度的风险值,作为第二风险值;
若所述第一风险值、第二风险值中至少一个不为0,则将所述号码评定为高风险。
5.一种用户号码风险评定的系统,其特征在于,应用于预先搭建的风险评定系统,包括:
号码及数据获取模块,用于获取待评估的号码,从所述风险评定系统的原始数据层获取所述号码对应的衍生数据;所述号码为手机号码或者固话号码;所述获取待评估的号码包括:基于所述风险评定系统的开放接口层提供的开放接口,接收使用者上传的待评估的号码;所述原始数据层保存着多个用户号码的原始衍生数据,所述原始数据层还包括集团用户包括的全部手机号码及其原始衍生数据;其中,所述原始衍生数据以文本信息、ftp数据、Excel文件、关系数据表中至少一种形式存储,其中,用户号码的原始衍生数据包括订阅套餐信息、流量使用信息、号码归属信息、用户身份信息、欠费信息中的至少两项;
风险分析模块,用于将所述衍生数据信息输入到预先建立的风险模型库中以及所述使用者通过所述开放接口层提供的开放接口制定的其他风险评估模型;所述风险模型库包含多个风险评估模型,所述风险模型库用于根据所述衍生数据信息确定所述号码所属的维度,采用各维度对应的风险评估模型计算对应维度的风险值;所述号码所属的维度至少包含:表征号码的来自不同数据源的衍生数据的第一维度和号码所归属群体的第二维度;不同维度对应不同风险评估模型;所述风险评估模型为基于对应特征数据的数学模型;所述开放接口层还提供开放接口给所述使用者制定其他风险评估模型,
分析结果获取模块,用于根据所述风险模型库的输出得到所述号码对应的各维度的风险值;
风险评估模块,用于通过各维度的风险值,得到所述号码的风险评定结果;所述其他风险评估模型将单独生成一个维度参与到所述号码的风险评定结果的汇总计算中;
汇总模块,用于通过所述风险评定系统的结果汇总层对风险评定结果数据进行汇总,包括生成工单、推送至外部系统和/或生成下载结果;
还包括模块,用于在获取待评估的号码之前,将多个样本号码划分为两个维度,获取各维度包含的全部样本号码的样本衍生数据,具体包括:以样本号码为第一主键,统计所述样本 号码的来自不同数据源的样本衍生数据,得到第一维度;以多个样本号码所属的群体为第二主键,统计属于同一群体的全部样本号码的样本衍生数据,得到第二维度;以及,针对各维度的样本衍生数据,分别提取特征数据,根据所述特征数据构建各维度对应的风险评估模型;第一维度对应的特征数据包括一年内申请优惠的次数以及欠费起始时间至今的时长;第二维度对应的特征数据包括集团下存在欠费记录的号码的数据与号码总量的比例以及集团近半年的消费总额的升降信息;
其中,针对所述第一维度,构建的风险评估模型包括:
f(x)=a1*fx_1+b1*fx_2;
针对所述第二维度,构建的风险评估模型包括:
g(y)=a2*gy_1+b2*gy_2;
其中,a1、a2、b1、b2为预先设定的权重系数。
6.根据权利要求5所述的系统,其特征在于,其中,所述通过各维度的风险值,得到所述号码的风险评定结果,包括:
获取所述号码在第一维度的风险值,作为第一风险值;
获取所述号码在第二维度的风险值,作为第二风险值;
若所述第一风险值、第二风险值中至少一个不为0,则将所述号码评定为高风险。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至4任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811067711.5A CN109284920B (zh) | 2018-09-13 | 2018-09-13 | 基于大数据的用户信息风险评定的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811067711.5A CN109284920B (zh) | 2018-09-13 | 2018-09-13 | 基于大数据的用户信息风险评定的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109284920A CN109284920A (zh) | 2019-01-29 |
CN109284920B true CN109284920B (zh) | 2023-01-06 |
Family
ID=65181059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811067711.5A Active CN109284920B (zh) | 2018-09-13 | 2018-09-13 | 基于大数据的用户信息风险评定的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109284920B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111833120A (zh) * | 2019-04-16 | 2020-10-27 | 上海丰荟信息技术有限公司 | 一种电子商务系统 |
CN111833122A (zh) * | 2019-04-17 | 2020-10-27 | 上海丰荟信息技术有限公司 | 一种基于电商产品供应链信息流程系统 |
CN111833001A (zh) * | 2019-04-17 | 2020-10-27 | 上海丰荟信息技术有限公司 | 一种基于移动端学生移动商务技能训练平台 |
CN111078880B (zh) * | 2019-12-12 | 2023-07-21 | 支付宝(杭州)信息技术有限公司 | 子应用的风险识别方法以及装置 |
CN112767056B (zh) * | 2021-02-04 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 业务数据预测方法、装置、计算机设备和存储介质 |
CN112801557A (zh) * | 2021-04-07 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 基于区块链的风险评价方法和装置 |
CN113672914A (zh) * | 2021-08-23 | 2021-11-19 | 郑州云智信安安全技术有限公司 | 一种用于app个人数据安全的风险评估方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416669A (zh) * | 2018-03-13 | 2018-08-17 | 腾讯科技(深圳)有限公司 | 用户行为数据处理方法、装置、电子设备及计算机可读介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650813A (zh) * | 2008-08-11 | 2010-02-17 | 阿里巴巴集团控股有限公司 | 一种网络评价的系统和方法 |
CN106845830A (zh) * | 2017-01-20 | 2017-06-13 | 武汉哒呤科技有限公司 | 一种对用户信用进行评定的方法和装置 |
CN108280759A (zh) * | 2018-01-17 | 2018-07-13 | 深圳市和讯华谷信息技术有限公司 | 风控模型优化方法、终端及计算机可读存储介质 |
-
2018
- 2018-09-13 CN CN201811067711.5A patent/CN109284920B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416669A (zh) * | 2018-03-13 | 2018-08-17 | 腾讯科技(深圳)有限公司 | 用户行为数据处理方法、装置、电子设备及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109284920A (zh) | 2019-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284920B (zh) | 基于大数据的用户信息风险评定的方法及系统 | |
CN111506498B (zh) | 测试用例的自动生成方法、装置、计算机设备及存储介质 | |
CN110489520B (zh) | 基于知识图谱的事件处理方法、装置、设备和存储介质 | |
CN108509485B (zh) | 数据的预处理方法、装置、计算机设备和存储介质 | |
WO2020186786A1 (zh) | 文件处理方法、装置、计算机设备和存储介质 | |
WO2020143233A1 (zh) | 评分卡模型的建立方法、装置、计算机设备和存储介质 | |
CN111176990B (zh) | 基于数据决策的测试数据生成方法、装置、计算机设备 | |
CN110287332B (zh) | 云环境下仿真模型选择方法与装置 | |
CN111784392A (zh) | 基于孤立森林的异常用户群组检测方法、装置、设备 | |
CN109783788A (zh) | 数据表填补方法、装置、计算机设备和存储介质 | |
CN112560444A (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN110390563A (zh) | 用户价值的量化方法、装置、计算机设备和存储介质 | |
CN111177217A (zh) | 数据预处理方法、装置、计算机设备及存储介质 | |
CN110532359A (zh) | 法律条文查询方法、装置、计算机设备和存储介质 | |
CN115062016A (zh) | 关联关系提取方法、装置和计算机设备 | |
CN110909975B (zh) | 科研平台效益评估方法、装置 | |
CN110555082A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN115952398B (zh) | 基于物联网的数据上传统计计算方法、系统和存储介质 | |
CN112541595A (zh) | 模型构建方法及装置、存储介质及电子设备 | |
CN109542947B (zh) | 数据统计方法、装置、计算机设备和存储介质 | |
CN112015723A (zh) | 数据等级划分方法、装置、计算机设备和存储介质 | |
CN109410069A (zh) | 结算数据处理方法、装置、计算机设备和存储介质 | |
CN110378481B (zh) | 基于粗糙集的决策处理方法、装置、计算机和存储介质 | |
CN112785335A (zh) | 一种面向电子政务绩效考核系统的数据处理方法和系统 | |
CN107463564A (zh) | 服务器中数据的特征分析方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |