CN105354210A - 移动游戏支付账户行为数据处理方法和装置 - Google Patents

移动游戏支付账户行为数据处理方法和装置 Download PDF

Info

Publication number
CN105354210A
CN105354210A CN201510613435.8A CN201510613435A CN105354210A CN 105354210 A CN105354210 A CN 105354210A CN 201510613435 A CN201510613435 A CN 201510613435A CN 105354210 A CN105354210 A CN 105354210A
Authority
CN
China
Prior art keywords
payment account
mobile game
credit
game payment
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510613435.8A
Other languages
English (en)
Inventor
丘越崑
吴赟
张永鑫
段云欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510613435.8A priority Critical patent/CN105354210A/zh
Publication of CN105354210A publication Critical patent/CN105354210A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/085Payment architectures involving remote charge determination or related payment systems
    • G06Q20/0855Payment architectures involving remote charge determination or related payment systems involving a third party

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种移动游戏支付账户行为数据处理方法和装置,所述方法包括:提取移动游戏支付账户行为数据;根据所述移动游戏支付账户行为数据生成移动游戏支付账户行为指标;在所述移动游戏支付账户行为指标中筛选信用评分指标;通过训练获得的信用评分模型,以根据所述信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值;根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值。本发明通过对移动游戏支付账户行为数据分析计算,得到移动游戏支付账户信用值,以便了解移动游戏支付账户的信用情况,同时使移动游戏支付账户行为数据得到充分利用,避免资源浪费。

Description

移动游戏支付账户行为数据处理方法和装置
技术领域
本发明涉及数据分析技术领域,特别是涉及一种移动游戏支付账户行为数据处理方法和装置。
背景技术
随着第三方支付和移动游戏领域的发展,在移动游戏中,用户往往需要利用移动游戏支付账户买一些游戏装备来提高游戏体验。在用户利用移动游戏支付账户进行游戏或消费过程中,会产生一些移动游戏支付账户行为数据,包括移动游戏支付账户游戏行为数据和移动游戏支付账户历史交易行为数据。这些移动游戏支付账户行为数据的存储占用了大量存储空间,同时这些移动游戏支付账户行为数据未被得到充分的利用,出现了数据闲置的情况,造成资源的浪费。
发明内容
基于此,有必要针对因数据闲置而造成资源浪费的问题,提供一种移动游戏支付账户行为数据处理方法和装置。
一种移动游戏支付账户行为数据处理方法,所述方法包括:
提取移动游戏支付账户行为数据;
根据所述移动游戏支付账户行为数据生成移动游戏支付账户行为指标;
在所述移动游戏支付账户行为指标中筛选信用评分指标;
通过训练获得的信用评分模型,以根据所述信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值;
根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户的信用分数。
在其中一个实施例中,所述移动游戏支付账户行为数据包括移动游戏支付账户历史交易行为数据和移动游戏支付账户游戏行为数据。
在其中一个实施例中,所述方法还包括:
对所述移动游戏支付账户行为数据进行数据清洗;或者,
对所述移动游戏支付账户行为指标进行数据清洗。
在其中一个实施例中,所述在所述移动游戏支付账户行为指标中筛选信用评分指标,包括:
通过聚类分组对所述移动游戏支付账户行为指标进行过滤;
利用主成分分析法在过滤后的所述移动游戏支付账户行为指标中提取信用评分指标。
在其中一个实施例中,所述在所述移动游戏支付账户行为指标中筛选信用评分指标之后,包括:
从所述移动游戏行为数据中获取模型样本数据集合;
从所述模型样本数据集合中提取训练样本;
根据所述训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
在其中一个实施例中,所述根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值,包括:
将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和生成移动游戏支付账户信用值。
上述移动游戏支付账户行为数据处理方法,提取移动游戏支付账户行为数据后,根据移动游戏支付账户行为数据生成移动游戏支付账户行为指标,在移动游戏支付账户行为指标中筛选出信用评分指标,通过训练获得的信用评分模型,用逻辑回归算法和随机森林算法分别对信用评分指标进行计算,根据两种算法的计算的中间信用值生成移动游戏支付账户信用值。这样,通过对移动游戏支付账户行为数据分析计算,得到移动游戏支付账户信用值,以便了解移动游戏支付账户的信用情况,同时使移动游戏支付账户行为数据得到充分利用。
一种移动游戏支付账户行为数据处理装置,所述装置包括:
数据提取模块,用于提取移动游戏支付账户行为数据;
指标生成模块,用于根据所述移动游戏支付账户行为数据生成移动游戏支付账户行为指标;
筛选模块,用于在所述移动游戏支付账户行为指标中筛选信用评分指标;
计算模块,用于通过训练获得的信用评分模型,以根据所述信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值;
信用值生成模块,用于根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值。
在其中一个实施例中,所述筛选模块包括:
过滤模块,用于通过聚类分组对所述移动游戏支付账户行为指标进行过滤;
指标提取模块,用于利用主成分分析法在过滤后的所述移动游戏支付账户行为指标中提取信用评分指标。
在其中一个实施例中,所述装置还包括:
获取模块,用于从所述移动游戏行为数据中获取模型样本数据集合;
样本提取模块,从所述模型样本数据集合中提取训练样本;
训练模块,用于根据所述训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
在其中一个实施例中,所述生成模块还用于将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和生成移动游戏支付账户信用值。
上述移动游戏支付账户行为数据处理装置,数据提取模块提取移动游戏支付账户行为数据后,指标生成模块根据移动游戏支付账户行为数据生成移动游戏支付账户行为指标,筛选模块在移动游戏支付账户行为指标中筛选出信用评分指标。计算模块通过训练获得的信用评分模型,用逻辑回归算法和随机森林算法分别对信用评分指标进行计算,信用值生成模块根据两种算法的计算的中间信用值生成移动游戏支付账户信用值。这样,通过对移动游戏支付账户行为数据分析计算,得到移动游戏支付账户信用值,以便了解移动游戏支付账户的信用情况,同时使移动游戏支付账户行为数据得到充分利用。
附图说明
图1为一个实施例中移动游戏支付账户行为数据处理方法的流程示意图;
图2为一个实施例中训练信用评分模型步骤的流程示意图;
图3为一个实施例中应用于数据平台的移动游戏支付账户行为数据处理方法的流程示意图;
图4为一个实施例中移动游戏支付账户行为数据处理装置的结构框图;
图5为另一个实施例中移动游戏支付账户行为数据处理装置的结构框图;
图6为一个实施例中移动游戏支付账户行为数据处理装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
如图1所示,在一个实施例中,提供一种移动游戏支付账户行为数据处理方法,该方法通过移动游戏支付账户行为数据处理程序实施,移动游戏支付账户行为处理程序运行在计算机上。该方法具体包括如下步骤:
步骤102,提取移动游戏支付账户行为数据。
在一个实施例中,计算机从核心交易库表、用户行为日志数据、客户系统数据以及移动游戏支付账户历史信用数据等各种系统业务数据中提取移动游戏支付账户行为数据。移动游戏支付账户行为数据是计算机以每个移动游戏支付账户为基准所提取的每个移动游戏支付账户的消费行为和游戏行为所产生的数据,比如在一个移动游戏支付账户下使用过多少终端进行交易的数据、交易行为所产生的数据或登录游戏时间所产生的数据等。
步骤104,根据移动游戏支付账户行为数据生成移动游戏支付账户行为指标。
移动游戏支付账户行为指标,是计算机根据移动游戏支付账户行为数据生成的可以用于移动游戏支付账户信用评分的指标的集合,包括原始指标和衍生指标。
在一个实施例中,计算机对移动游戏支付账户行为数据分析或计算生成移动游戏支付账户行为指标,移动游戏支付账户行为指标包括原始指标和衍生指标。原始指标为直接根据移动游戏支付账户行为数据生成,而衍生指标是计算机通过对移动游戏支付账户行为数据的计算生成的。比如移动游戏支付账户每次启动游戏的时间,计算机根据每次启动游戏时间来计算在一段时间内启动游戏的频率,每次启动游戏的时间为原始指标,启动游戏的频率为衍生指标。
步骤106,在移动游戏支付账户行为指标中筛选信用评分指标。
信用评分指标,是计算机在移动游戏支付账户行为指标中筛选出来可以用于移动游戏支付账户信用评分且能准确反映移动游戏支付账户信用情况的指标集合。
在一个实施例中,计算机对移动游戏支付账户行为指标进行求方差运算,并计算移动游戏支付账户行为指标方差的平均值,选取方差大于平均值的移动游戏支付账户行为指标作为信用评分指标。计算机通过对信用评分指标的计算可以得到移动游戏支付账户信用值。
在另一个实施例中,计算机利用逻辑回归算法或随机森林算法对移动游戏支付账户行为指标中指标选择前后信用评分模型的拟合度、预测准确度或误判概率计算,并设置一个误差值,选取拟合度、预测准确度或误判概率在误差值之内的移动游戏支付账户行为指标作为信用评分指标。
步骤108,通过训练获得的信用评分模型,以根据信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值。
中间信用值,是利用逻辑回归算法和随机森林算法对信用评分指标计算获得的值,对中间信用值进一步计算可以获得最终的移动游戏支付账户信用值。
在一个实施例中,计算机通过使用训练获得的信用评分模型对信用评分指标进行计算,提取信用评分模型中信用评分指标的权重系数,并对所筛选出的信用评分指标和指标相应的权重系数利用逻辑回归算法和随机森林进行计算,计算机根据两种算法分别计算得到的计算结果均为中间信用值。
步骤110,根据逻辑回归算法和随机森林算法计算获得的中间信用值生成移动游戏支付账户信用值。
逻辑回归算法,是分析一个指标同一个或多个预测指标之间的关系,例如分析X同预测指标X1,X2,X3….,之间的关系。逻辑回归是对线性回归的非线性转换,逻辑回归的逻辑分布是一个S型分布函数,将预估概率限定在0和1之间。
随机森林算法,是利用重抽样方法从原始样本中抽取多个样本指标,对每个样本指标进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。
在一个实施例中,对分别利用逻辑回归算法和随机森林算法计算获得的中间信用值进行求和运算、求平均值运算以及加权求平均值运算中的至少一种运算,运算结果为移动游戏支付账户信用值,移动游戏支付账户信用值可以反映每个移动游戏支付账户的信用情况。
本实施例中,计算机通过对移动游戏支付账户行为数据分析计算,得到移动游戏支付账户信用值,以便了解移动游戏支付账户的信用情况,同时使移动游戏支付账户行为数据得到充分利用。数据平台的风险控制系统可以根据移动游戏支付账户信用值来制定相应的策略,用以降低支付风险,确保用户支付安全。
在一个实施例中,移动游戏支付账户行为数据包括移动游戏支付账户历史交易行为数据和移动游戏支付账户游戏行为数据。
具体地,移动游戏支付账户历史交易行为数据是用户使用移动游戏支付账户登录数据平台后的各种操作所产生的数据,比如移动游戏支付账户进行交易的时间、交易频率以及支付成功率等数据。移动游戏支付账户游戏行为数据是用户使用移动游戏支付账户登录到游戏界面或游戏平台的各种操作所产生的数据,比如启动游戏的时间、启动游戏的频率以及该移动游戏支付账户下玩的游戏个数等数据。移动游戏支付账户历史交易行为数据和移动游戏支付账户游戏行为数据记载在核心交易库表、用户行为日志数据、客服系统数据以及移动游戏支付账户历史信用数据等各种业务数据系统中。
本实施例中,移动游戏支付账户行为数据具体包括移动游戏支付账户历史交易行为数据和移动游戏支付账户游戏行为数据,这些数据对于移动终端游戏领域的移动游戏支付账户信用评分有较强的针对性,能够准确反映移动游戏支付账户的信用情况。
在一个实施例中,移动游戏支付账户行为数据处理方法还包括以下步骤:对移动游戏支付账户行为数据进行数据清洗;或者,对移动游戏支付账户行为指标进行数据清洗。
数据清洗是指发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。对残缺数据进行填补、对错误数据的更正以及对重复数据的删除等。
在一个实施例中,在计算机选取移动游戏支付账户行为数据或者生成移动游戏支付账户行为指标之后或之前,计算机对移动游戏支付账户行为数据或移动游戏支付账户行为指标进行数据清洗。具体地,计算机对移动游戏支付账户行为数据或移动游戏支付账户行为指标中的缺失数据、错误数据或异常数据进行填补、更正或者删除,并保留准确的移动游戏支付账户行为数据或者移动游戏支付账户行为指标。
本实施例中,计算机在选取移动游戏支付账户行为数据或生成移动游戏支付账户行为指标时,需要不断的重复对数据或指标进行数据清洗,这样可以保证移动游戏支付账户行为数据和移动游戏支付账户行为指标的准确性,以便通过准确的数据或指标来真实反映移动游戏支付账户的信用情况。
在一个实施例中,步骤106具体包括以下步骤A和B:
步骤A,通过聚类分组对移动游戏支付账户行为指标进行过滤。
在一个实施例中,计算机对移动游戏支付账户行为指标利用无监督聚类的方法进行聚类,分析移动游戏支付账户行为指标的分布,并计算移动游戏支付账户行为指标的重要性度量,一方面,保留重要性度量值大于0的移动游戏支付账户行为指标,丢掉重要性度量值为0的移动游戏支付账户行为指标;另一方面,对于重要性度量大于0的移动游戏支付账户行为指标,丢掉聚类指标的聚类中心在各个分类区分度为10%以内。
在一个实施例中,计算机对移动游戏支付账户行为指标,采用Pearson相关系数进行计算相关性,对相关系数大于0.9的两对指标,丢掉其中一个;对相关系数在0.5~0.9之间的移动游戏支付账户行为指标,做线性组合处理,生成信用评分指标。丢掉原来两个相关性很高中的一个移动游戏支付账户行为指标,避免共线性的问题。共线性问题是指在模型中的移动游戏支付账户行为指标之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
步骤B,利用主成分分析法在过滤后的移动游戏支付账户行为指标中提取信用评分指标。
主成分分析法也称主分量分析法,旨在利用降维的思想,把多指标转化为少数几个综合指标。主成分分析法用较少的指标去解释原来资料中的大部分指标,将许多相关性很高的指标转化成彼此相互独立或不相关的指标。
在一个实施例中,计算机根据经过聚类分析的移动游戏支付账户行为指标生成标准化矩阵,再根据标准化矩阵建立协方差矩阵。计算机根据协方差矩阵求出指标的特征值和累计方差贡献率。选取特征值大于1,且累计方差贡献率大于85%的移动游戏支付账户行为指标作为信用评分指标。
在一个实施例中,也可以选取特征值大于0.9或0.8,且贡献率大于85%或者80%的移动游戏支付账户行为指标作为信用评分指标。
本实施例中,计算机通过聚类分析和主成分分析法提取到的信用评分指标对移动游戏支付账户信用评分影响较大,过滤掉对移动游戏支付账户信用评分影响较小的影响指标。这些信用评分是能够反映移动游戏支付账户信用的重要影响指标,进一步保证移动游戏支付账户信用评分的真实情况。
如图2所示,在一个实施例中,步骤106之后,还包括建立评分模型的步骤,具体步骤如下包括:
步骤202,从移动游戏支付账户行为数据中获取模型样本数据集合。
模型样本数据集合是计算机从移动游戏支付账户行为数据中根据正负样本的定义提取的用于训练模型的一个数据集合。模型样本包括训练样本和测试样本,在模型样本数据集合中,计算机选取一部分数据作为训练样本,则剩下的另一部分作为测试样本对信用评分模型进行测试。
步骤204,从模型样本数据集合中提取训练样本。
在一个实施例中,计算机从模型样本数据集合中随机选取或根据数据生成的时间顺序选取移动游戏支付行为数据作为训练样本。训练样本为从模型样本数据集合中提取的样本数据,用以训练信用评分模型。
步骤206,根据训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
在一个实施例中,计算机利用逻辑回归算法和随机森林算法分别对训练样本进行训练获得相应的模型,对两种模型所计算出的中间信用值加权运算,加权运算得到的结果为移动游戏支付账户信用值。
在另一个实施例中,计算机从模型样本数据集合中提取训练样本之后,以模型样本数据集合中剩下的移动游戏支付行为数据作为测试样本,利用测试样本对信用评分模型进行测试。计算机利用测试样本对信用评分模型进行测试,如果测试结果为信用评分模型不能准确对移动游戏支付账户信用值进行评估,则对信用指标和移动游戏支付账户行为数据进行核查或调整参数设置等。测试样本用以测试信用评分模型准确性的样本数据。
本实施例中,计算机利用逻辑回归和随机森林算法相结合的方法建立信用评分模型,并且在信用评分模型建立后,使用测试样本对信用评分模型进行测试,提高了信用评分模型的准确性和稳定性。
在一个实施例中,步骤110具体包括:将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和以生成移动游戏支付账户信用值。
具体地,计算机在使用信用评分模型时,信用评分模型分别利用逻辑回归算法和随机森林算法对信用评分指标计算得到中间信用值,通过对两种算法计算出的中间信用值的加权求和运算得到移动游戏支付账户信用值。
本实施例中,计算机通过逻辑回归和随机森林算法对信用评分指标计算得到中间信用值,为了得到更为准确的移动游戏支付账户信用值,对中间信用值进行加权求和运算,使得最终得到的移动游戏支付账户信用值值更加准确和可靠。
如图3所示,在一个实施例中,提供一种基于移动游戏支付账户行为数据处理方法的数据平台,该数据平台从各个业务系统数据中提取移动游戏支付账户交易行为数据和移动游戏支付账户游戏行为数据。各个业务系统数据包括核心交易库表、用户行为日志数据、客服系统数据和移动游戏支付账户历史信用数据等。
将移动游戏支付账户交易行为数据和移动游戏支付账户游戏行为数据经过转换加载至信用评分数据仓库,对信用评分数据仓库中的移动游戏支付账户交易行为数据和移动游戏支付账户游戏行为数据进行数据清洗,根据数据清洗后的移动游戏支付账户交易行为数据和移动游戏支付账户游戏行为数据建立移动游戏支付账户信用评分模型。通过移动游戏支付账户信用评分模型对移动游戏支付账户交易行为数据和移动游戏支付账户游戏行为数据进行计算得到移动游戏支付账户信用值。
数据平台可以根据移动游戏支付账户信用值为移动游戏支付账户提供借贷消费,提高用户的支付体验。移动游戏支付账户信用值越高,数据平台为移动游戏支付账户提供的借贷消费额度越大,移动游戏支付账户信用值越低,数据平台为移动游戏支付账户提供的借贷消费额度越小。数据平台的风险控制系统通过移动游戏支付账户信用值来降低为移动游戏支付账户提供借贷消费而产生的风险。
移动游戏支付账户的借贷消费行为所产生的数据又被记载在核心交易库表中,用于下次对移动游戏支付账户信用值的计算。在借贷消费之后,移动游戏支付账户的信用行为所产生的数据被存储在移动游戏支付账户历史信用数据中,同样用于下次对移动游戏支付账户信用值的计算。信用行为所产生的数据包括移动游戏支付账户的还款时间、还款金额以及还款期限等数据。
如图4所示,在一个实施例中,提供一种移动游戏支付账户行为数据处理装置400,所述装置包括:数据提取模块402、指标生成模块404、筛选模块406、计算模块408和信用值生成模块。
数据提取模块402,用于提取移动游戏支付账户行为数据。
指标生成模块404,用于根据移动游戏支付账户行为数据生成移动游戏支付账户行为指标。
筛选模块406,用于在移动游戏支付账户行为指标中筛选信用评分指标。
计算模块408,用于通过训练获得的信用评分模型,以根据信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值。
信用值生成模块410,用于根据逻辑回归算法和随机森林算法计算获得的中间信用值生成移动游戏支付账户信用值。
本实施例中,数据提取模块402提取移动游戏支付账户行为数据后,指标生成模块404根据移动游戏支付账户行为数据生成移动游戏支付账户行为指标,筛选模块406在移动游戏支付账户行为指标中筛选出信用评分指标。计算模块408通过训练获得的信用评分模型,用逻辑回归算法和随机森林算法分别对信用评分指标进行计算,信用值生成模块410根据两种算法的计算的中间信用值生成移动游戏支付账户信用值。这样,通过对移动游戏支付账户行为数据分析计算,得到移动游戏支付账户信用值,以便了解移动游戏支付账户的信用情况,同时使移动游戏支付账户行为数据得到充分利用。
如图5所示,在一个实施例中,所述筛选模块406包括:
过滤模块412,用于通过聚类分组对移动游戏支付账户行为指标进行过滤。
指标提取模块414,用于利用主成分分析法在过滤后的移动游戏支付账户行为指标中提取信用评分指标。
本实施例中,过滤模块412通过聚类分析过滤对移动游戏支付账户信用值影响较小的影响指标,指标提取模块414利用主成分分析法提取到的信用评分指标对移动游戏支付账户信用值影响较大。这些信用评分是能够反映移动游戏支付账户信用的重要影响指标,进一步保证移动游戏支付账户信用值的真实情况。
如图6所示,在一个实施例中,所述装置400还包括:
获取模块416,用于从移动游戏行为数据中获取模型样本数据集合。
样本提取模块418,从模型样本数据集合中提取训练样本。
训练模块420,用于根据训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
本实施例中,训练模块420通过利用逻辑回归和随机森林算法相结合的方法建立信用评分模型,并且在信用评分模型建立后,使用测试用本对信用评分模型进行测试,提高了信用评分模型的准确性和稳定性。
在一个实施例中,信用值生成模块410还用于将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和以生成移动游戏支付账户信用值。
本实施例中,信用值生成模块410通过逻辑回归和随机森林算法对信用评分指标计算得到中间信用值,为了得到更为准确的移动游戏支付账户信用值,对中间信用值进行了加权和处理,使得最终得到的移动游戏支付账户信用值值更加准确和可靠。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种移动游戏支付账户行为数据处理方法,所述方法包括:
提取移动游戏支付账户行为数据;
根据所述移动游戏支付账户行为数据生成移动游戏支付账户行为指标;
在所述移动游戏支付账户行为指标中筛选信用评分指标;
通过训练获得的信用评分模型,以根据所述信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值;
根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值。
2.根据权利要求1所述的方法,其特征在于,所述移动游戏支付账户行为数据包括移动游戏支付账户历史交易行为数据和移动游戏支付账户游戏行为数据。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述移动游戏支付账户行为数据进行数据清洗;或者,
对所述移动游戏支付账户行为指标进行数据清洗。
4.根据权利要求1所述的方法,其特征在于,所述在所述移动游戏支付账户行为指标中筛选信用评分指标,包括:
通过聚类分组对所述移动游戏支付账户行为指标进行过滤;
利用主成分分析法在过滤后的所述移动游戏支付账户行为指标中提取信用评分指标。
5.根据权利要求1所述的方法,其特征在于,所述在所述移动游戏支付账户行为指标中筛选信用评分指标之后,包括:
从所述移动游戏支付账户行为数据中获取模型样本数据集合;
从所述模型样本数据集合中提取训练样本;
根据所述训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
6.根据权利要求1所述的方法,其特征在于,所述根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值,包括:
将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和以生成移动游戏支付账户信用值。
7.一种移动游戏支付账户行为数据处理装置,其特征在于,所述装置包括:
数据提取模块,用于提取移动游戏支付账户行为数据;
指标生成模块,用于根据所述移动游戏支付账户行为数据生成移动游戏支付账户行为指标;
筛选模块,用于在所述移动游戏支付账户行为指标中筛选信用评分指标;
计算模块,用于通过训练获得的信用评分模型,以根据所述信用评分指标分别用逻辑回归算法和随机森林算法计算获得相应的中间信用值;
信用值生成模块,用于根据逻辑回归算法和随机森林算法计算获得的所述中间信用值生成移动游戏支付账户信用值。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块包括:
过滤模块,用于通过聚类分组对所述移动游戏支付账户行为指标进行过滤;
指标提取模块,用于利用主成分分析法在过滤后的所述移动游戏支付账户行为指标中提取信用评分指标。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
获取模块,用于从所述移动游戏行为数据中获取模型样本数据集合;
样本提取模块,从所述模型样本数据集合中提取训练样本;
训练模块,用于根据所述训练样本利用逻辑回归算法和随机森林算法训练获得信用评分模型。
10.根据权利要求7所述的装置,其特征在于,所述信用值生成模块还用于将逻辑回归算法计算获得的中间信用值和随机森林算法计算获得的中间信用值加权求和以生成移动游戏支付账户信用值。
CN201510613435.8A 2015-09-23 2015-09-23 移动游戏支付账户行为数据处理方法和装置 Pending CN105354210A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510613435.8A CN105354210A (zh) 2015-09-23 2015-09-23 移动游戏支付账户行为数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510613435.8A CN105354210A (zh) 2015-09-23 2015-09-23 移动游戏支付账户行为数据处理方法和装置

Publications (1)

Publication Number Publication Date
CN105354210A true CN105354210A (zh) 2016-02-24

Family

ID=55330183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510613435.8A Pending CN105354210A (zh) 2015-09-23 2015-09-23 移动游戏支付账户行为数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN105354210A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250481A (zh) * 2016-07-29 2016-12-21 深圳市永兴元科技有限公司 基于大数据的数据挖掘方法及装置
CN106875206A (zh) * 2016-07-18 2017-06-20 阿里巴巴集团控股有限公司 信息获取、评估、问卷调查方法、装置及服务器
CN107346464A (zh) * 2016-05-06 2017-11-14 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN108066990A (zh) * 2016-11-18 2018-05-25 腾讯科技(深圳)有限公司 一种从候选用户列表中选择用户的方法、装置及服务器
CN108665120A (zh) * 2017-03-27 2018-10-16 阿里巴巴集团控股有限公司 打分模型的建立、用户信用的评估方法及装置
CN108830470A (zh) * 2018-06-01 2018-11-16 北京金山数字娱乐科技有限公司 一种账号处理的方法及装置
CN109034799A (zh) * 2018-07-17 2018-12-18 唐剑虹 一种基于生物id身份认证的数字货币挖矿系统及方法
CN109191134A (zh) * 2018-08-23 2019-01-11 唐剑虹 一种基于生物识别技术的区块链虚拟征信体系
CN109308660A (zh) * 2017-07-27 2019-02-05 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
CN109426894A (zh) * 2017-08-22 2019-03-05 阿里巴巴集团控股有限公司 用户信息共享、竞价方法、装置、系统及电子设备
CN110278128A (zh) * 2019-07-05 2019-09-24 中邮建技术有限公司 一种微信支付数据清洗方法
CN110309219A (zh) * 2019-06-20 2019-10-08 吉旗物联科技(上海)有限公司 信用评分模型的生成方法及装置
WO2020125106A1 (zh) * 2018-12-21 2020-06-25 苏宁易购集团股份有限公司 基于相似度模型的数据处理方法及系统
CN113144609A (zh) * 2021-04-25 2021-07-23 上海雷鸣文化传播有限公司 一种基于遗传算法的游戏角色行为算法
CN118070050A (zh) * 2024-02-27 2024-05-24 宝艺新材料股份有限公司 一种瓦楞纸板纸箱的检测数据处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493913A (zh) * 2008-01-23 2009-07-29 阿里巴巴集团控股有限公司 一种评估网上用户信用的方法及系统
CN103839183A (zh) * 2014-03-19 2014-06-04 江苏苏大大数据科技有限公司 智能授信方法及智能授信装置
CN104794195A (zh) * 2015-04-17 2015-07-22 南京大学 一种用于电信潜在换机用户发现的数据挖掘方法
CN104866969A (zh) * 2015-05-25 2015-08-26 百度在线网络技术(北京)有限公司 个人信用数据处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493913A (zh) * 2008-01-23 2009-07-29 阿里巴巴集团控股有限公司 一种评估网上用户信用的方法及系统
CN103839183A (zh) * 2014-03-19 2014-06-04 江苏苏大大数据科技有限公司 智能授信方法及智能授信装置
CN104794195A (zh) * 2015-04-17 2015-07-22 南京大学 一种用于电信潜在换机用户发现的数据挖掘方法
CN104866969A (zh) * 2015-05-25 2015-08-26 百度在线网络技术(北京)有限公司 个人信用数据处理方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张勇,陈莉: "聚类与PCA融合的特征提取方法研究", 《计算机工程与应用》 *
方匡南: "《随机森林组合预测理论及其在金融中的应用》", 31 May 2012 *
肖智,李文娟: "基于主成分分析和支持向量机的个人信用评估", 《技术经济》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346464A (zh) * 2016-05-06 2017-11-14 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN107346464B (zh) * 2016-05-06 2021-04-16 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN106875206A (zh) * 2016-07-18 2017-06-20 阿里巴巴集团控股有限公司 信息获取、评估、问卷调查方法、装置及服务器
CN106250481A (zh) * 2016-07-29 2016-12-21 深圳市永兴元科技有限公司 基于大数据的数据挖掘方法及装置
CN108066990A (zh) * 2016-11-18 2018-05-25 腾讯科技(深圳)有限公司 一种从候选用户列表中选择用户的方法、装置及服务器
CN108665120A (zh) * 2017-03-27 2018-10-16 阿里巴巴集团控股有限公司 打分模型的建立、用户信用的评估方法及装置
US11188565B2 (en) 2017-03-27 2021-11-30 Advanced New Technologies Co., Ltd. Method and device for constructing scoring model and evaluating user credit
CN108665120B (zh) * 2017-03-27 2020-10-20 创新先进技术有限公司 打分模型的建立、用户信用的评估方法及装置
CN109308660B (zh) * 2017-07-27 2023-03-10 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
CN109308660A (zh) * 2017-07-27 2019-02-05 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
CN109426894A (zh) * 2017-08-22 2019-03-05 阿里巴巴集团控股有限公司 用户信息共享、竞价方法、装置、系统及电子设备
CN107633265B (zh) * 2017-09-04 2021-03-30 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN108830470A (zh) * 2018-06-01 2018-11-16 北京金山数字娱乐科技有限公司 一种账号处理的方法及装置
CN108830470B (zh) * 2018-06-01 2023-05-02 北京金山数字娱乐科技有限公司 一种账号处理的方法及装置
CN109034799A (zh) * 2018-07-17 2018-12-18 唐剑虹 一种基于生物id身份认证的数字货币挖矿系统及方法
CN109191134A (zh) * 2018-08-23 2019-01-11 唐剑虹 一种基于生物识别技术的区块链虚拟征信体系
WO2020125106A1 (zh) * 2018-12-21 2020-06-25 苏宁易购集团股份有限公司 基于相似度模型的数据处理方法及系统
CN110309219A (zh) * 2019-06-20 2019-10-08 吉旗物联科技(上海)有限公司 信用评分模型的生成方法及装置
CN110278128A (zh) * 2019-07-05 2019-09-24 中邮建技术有限公司 一种微信支付数据清洗方法
CN113144609A (zh) * 2021-04-25 2021-07-23 上海雷鸣文化传播有限公司 一种基于遗传算法的游戏角色行为算法
CN118070050A (zh) * 2024-02-27 2024-05-24 宝艺新材料股份有限公司 一种瓦楞纸板纸箱的检测数据处理方法及系统
CN118070050B (zh) * 2024-02-27 2024-08-09 宝艺新材料股份有限公司 一种瓦楞纸板纸箱的检测数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN105354210A (zh) 移动游戏支付账户行为数据处理方法和装置
KR102061987B1 (ko) 위험 평가 방법 및 시스템
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
WO2017140222A1 (zh) 机器学习模型的建模方法及装置
CN109344906B (zh) 基于机器学习的用户风险分类方法、装置、介质及设备
CN106789844B (zh) 一种恶意用户识别方法及装置
CN106886906B (zh) 一种设备识别方法和装置
CN111476296A (zh) 样本生成方法、分类模型训练方法、识别方法及对应装置
CN107146160B (zh) 投保客户健康状况分析方法及服务器
CN111984544B (zh) 设备性能测试方法、装置、电子设备及存储介质
CN111369136A (zh) 业务数据集质量评估方法及装置及计算机可读介质
CN116629988A (zh) 一种基于区块链的投标数据处理方法及装置
CN113485931A (zh) 测试方法、装置、电子设备及计算机可读存储介质
CN115174250A (zh) 网络资产安全评估方法、装置、电子设备及存储介质
WO2023029065A1 (zh) 数据集质量评估方法、装置、计算机设备及存储介质
CN118195384A (zh) 满意度管理方法、装置及存储介质
CN110413596A (zh) 字段处理方法及装置、存储介质、电子装置
CN107862599B (zh) 银行风险数据处理方法、装置、计算机设备和存储介质
CN113313582A (zh) 拒客回捞模型训练方法、装置及电子设备
CN114139931A (zh) 企业数据评估方法、装置、计算机设备及存储介质
CN117376228A (zh) 一种网络安全测试工具确定方法及装置
CN115423600B (zh) 数据筛选方法、装置、介质及电子设备
CN114546841B (zh) 基于云计算的软件质量评估方法
CN110458707B (zh) 基于分类模型的行为评估方法、装置及终端设备
CN104572791A (zh) 搜索提示系统的评估方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160224

RJ01 Rejection of invention patent application after publication