CN107257365A - 一种数据下载处理方法和装置 - Google Patents

一种数据下载处理方法和装置 Download PDF

Info

Publication number
CN107257365A
CN107257365A CN201710401623.3A CN201710401623A CN107257365A CN 107257365 A CN107257365 A CN 107257365A CN 201710401623 A CN201710401623 A CN 201710401623A CN 107257365 A CN107257365 A CN 107257365A
Authority
CN
China
Prior art keywords
download
crucial
type
history
downloading data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710401623.3A
Other languages
English (en)
Other versions
CN107257365B (zh
Inventor
刘江冬
洪楷
徐士立
吴海洋
张其田
冯小飞
叶威锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710401623.3A priority Critical patent/CN107257365B/zh
Publication of CN107257365A publication Critical patent/CN107257365A/zh
Application granted granted Critical
Publication of CN107257365B publication Critical patent/CN107257365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种数据下载处理方法和装置,所述方法包括:响应客户端发送的应用下载请求;获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。采用本发明,可以在下载业务期间内提升下载业务的业务转换率。

Description

一种数据下载处理方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据下载处理方法和装置。
背景技术
近年来,随着互联网技术的快速发展,各式各样的网络游戏也得以迅速发展。在这些网络游戏中,大多数的网络游戏均可帮助用户锻炼脑力和提升敏捷能力,因此,这些网络游戏日渐受到了越来越多的用户的青睐。在这个虚拟的游戏世界中,由于这些用户渗透在社会中的各个行业以及各个阶层,因此,彼此之间的网速情况和游戏热爱程度等因素也就存在一定的差异,而这些差异的因素也会影响到游戏的下载情况。
比如,对于一些网速较慢的用户或对于一些新进的用户,若整个游戏的下载进度偏慢(例如,普遍在10分钟内仅完成了整个进度的5%),则这些用户就很有可能在该游戏的下载期间取消对该游戏的下载。因此,若存在较多网速较慢的用户和较多新进的用户,则可能会导致过多用户自主取消对游戏的下载,进而严重降低对游戏的业务转换率。
发明内容
本发明实施例提供一种数据下载处理方法和装置,可提升下载业务的业务转换率。
本发明第一方面提供了一种数据下载处理方法,包括:
响应客户端发送的应用下载请求;
获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
可选地,在所述响应客户端发送的应用下载请求之前,还包括:
获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
根据所述各关键历史下载数据训练支持向量机SVM模型。
其中,所述下载状态包括下载取消状态和下载完成状态,所述根据所述各关键历史下载数据训练支持向量机SVM模型,包括:
将所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值;
根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值。
其中,所述基于已训练的SVM模型计算所述目标特征值对应的下载取消概率,包括:
将所述目标特征值作为所述SVM模型的输入向量,并将所述输入向量和所述法向量进行相乘,并将相乘后的值与所述位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离;
基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率。
可选地,所述方法还包括:
若所述客户端处于下载完成状态或下载取消状态,则将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据。
可选地,所述方法还包括:
若模型待更新时长达到预设的周期时长,则获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零。
其中,所述获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型,包括:
获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
其中,所述根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型,包括:
将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并继续对所述新的最优特征类型进行添加处理;
当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
其中,还包括:
将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;
获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;
判断所述第一信息熵增益是否小于所述第二信息熵增益;
若判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;
若判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
本发明第二方面提供了一种数据下载处理装置,包括:
响应模块,用于响应客户端发送的应用下载请求;
特征值获取模块,用于获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
取消概率计算模块,用于基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
数据包发送模块,用于若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
可选地,所述装置还包括:
关键类型筛选模块,用于获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
关键数据确定模块,用于将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
模型训练模块,用于根据所述各关键历史下载数据训练支持向量机SVM模型。
其中,所述关键类型筛选模块包括:
获取提取单元,用于获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
选择确定单元,用于根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
其中,所述选择确定单元包括:
第一确定子单元,用于将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
添加子单元,用于将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
通知子单元,用于当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,通知所述第一确定子单元继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并通知所述添加子单元继续对所述新的待处理特征集合进行添加处理;
第二确定子单元,用于当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
其中,所述选择确定单元还包括:
第三确定子单元,用于将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;
所述第三确定子单元,还用于获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;
判断子单元,用于判断所述第一信息熵增益是否小于所述第二信息熵增益;
所述第三确定子单元,还用于若所述判断子单元判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;
所述第三确定子单元,还用于若所述判断子单元判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
其中,所述下载状态包括下载取消状态和下载完成状态,所述模型训练模块包括:
输入输出确定单元,用于所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值;
参数计算单元,用于根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值。
其中,所述取消概率计算模块包括:
目标距离计算单元,用于将所述目标特征值作为所述SVM模型的输入向量,并将所述输入向量和所述法向量进行相乘,并将相乘后的值与所述位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离;
转换计算单元,用于基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率。
可选地,所述装置还包括:
历史数据更新模块,用于若所述客户端处于下载完成状态或下载取消状态,则将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据。
可选地,所述装置还包括:
模型参数更新模块,用于若模型待更新时长达到预设的周期时长,则获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零。
本发明第三方面提供了一种数据下载处理装置,包括:处理器、网络接口、存储器;
所述处理器分别与网络接口、存储器相连,其中,所述网络接口用于与客户端通信,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行以下操作:
响应客户端发送的应用下载请求;
获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
本发明实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时执行本发明实施例中第一方面中的方法。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种网络架构的结构示意图;
图2是本发明实施例提供的一种数据下载处理方法的流程示意图;
图3是本发明实施例提供的一种下载界面的示意图;
图4是本发明实施例提供的另一种数据下载处理方法的流程示意图;
图5是本发明实施例提供的一种筛选关键下载特征类型的流程示意图;
图6是本发明实施例提供的一种下载数据交互图;
图7是本发明实施例提供的一种数据下载处理装置的结构示意图;
图8是本发明实施例提供的另一种数据下载处理装置的结构示意图;
图9是本发明实施例提供的一种模型训练模块的结构示意图;
图10是本发明实施例提供的一种取消概率计算模块的结构示意图;
图11是本发明实施例提供的一种关键类型筛选模块的结构示意图;
图12是本发明实施例提供的一种选择确定单元的结构示意图;
图13是本发明实施例提供的又一种数据下载处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,是本发明实施例提供的一种网络架构的结构示意图。如图1所示,所述网络架构可以包括服务器2000以及客户端集群;所述客户端集群可以包括多个客户端,如图1所示,具体包括客户端3000a、客户端3000b、…、客户端3000n;
其中,客户端3000a、客户端3000b、…、客户端3000n可以分别与所述服务器2000进行网络连接。
如图1所示,所述客户端集群可为多个历史用户分别持有的终端设备,用于分别向所述服务器上报原始历史下载数据;其中,各客户端分别上报的原始历史下载数据均包括下载状态以及多个下载特征类型分别对应的历史特征值。所述服务器2000可记录各历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型,所述多个下载特征类型可以包括下载速度、下载时长、下载完成比例、玩家在游戏内的等级、玩家是否新进、玩家是否回流等下载特征类型。由于在这些下载特征类型中,存在部分下载特征类型与取消下载原因无关。因此,所述服务器2000为了避免维数灾难,可以先在所述多个下载特征类型中选择出至少一个关键下载特征类型,进而可以根据所述述各原始历史下载数据中的下载状态(下载取消状态或下载完成状态)以及与各关键下载特征类型分别对应的历史特征值,训练SVM(Support Vector Machine,支持向量机)模型。后续若有新的客户端发送应用下载请求,则所述服务器2000可以在新的客户端所处的下载业务期间内基于已训练的SVM模型计算新的客户端对应的下载取消概率,并在所述下载取消概率大于预设概率阈值时向新的客户端推送与新的客户端的用户信息对应的业务数据包。
其中,所述服务器2000筛选关键下载特征类型、训练SVM模型、计算下载取消概率的具体过程可以参见如下图2至图5对应的实施例。
请参见图2,是本发明实施例提供的一种数据下载处理方法的流程示意图。如图2所示,所述方法可以包括:
S101,响应客户端发送的应用下载请求;
S102,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
具体的,服务器在接收到客户端发送的应用下载请求时,可对所述应用下载请求做出响应,此后,所述服务器可获取所述客户端在下载业务期间内主动上报的与至少一个关键下载特征类型分别对应的目标特征值,可选地,也可在下载业务期间内通知所述客户端上报与至少一个关键下载特征类型分别对应的目标特征值。
其中,所述客户端可以包括个人电脑、平板电脑、笔记本电脑等具有网络连接功能的终端设备;
其中,所述服务器可以为上述图1对应实施例中的服务器2000,所述关键下载特征类型可以为所述服务器预先在多个历史用户(多个历史玩家)分别对应的原始历史下载数据所涉及的多个下载特征类型中筛选出来,所述关键特征是指在所述多个下载特征类型中能影响玩家取消下载的主要因素的特征。例如,所述多个下载特征类型包括下载速度、下载时长、下载完成比例、玩家在游戏内的等级、玩家是否新进、玩家是否回流等特征类型,所述服务器从所述多个下载特征类型中筛选出的关键下载特征类型可以包括下载时长、下载速度、下载完成比例。
其中,所述目标特征值可为最近预设时间段内(如一分钟内)所统计到的各关键下载特征类型分别对应的数值,比如,以下载速度为例,所述服务器可统计到所述客户端在一分钟内的下载平均速度为120比特每秒,且在一分钟内的下载完成比例为45%。
其中,所述原始历史下载数据均可以包括下载状态以及所述多个下载特征类型分别对应的历史特征值;所述下载状态可以包括下载完成状态和下载取消状态。
其中,所述服务器获取所述原始历史下载数据的具体过程可以参见上述图1对应实施例中对服务器2000和运营客户端集群的描述,这里不再进行赘述。
步骤S103,基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;
具体的,所述服务器可将所述目标特征值作为已训练的SVM模型的输入向量,并将所述输入向量和分类超平面对应的法向量进行相乘,并将相乘后的值与分类超平面对应的位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离,并基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率。
其中,所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,同样地,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;所述下载状态包括下载完成状态和下载取消状态。
其中,所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量(w)和位移项值(b)。
其中,若下载速度为关键下载特征类型,则每个历史用户对应的关键历史下载数据中的下载速度的历史特征值,为各自的下载速度平均值。若下载时长为关键下载特征类型,则每个历史用户对应的关键历史下载数据中的下载时长的历史特征值,为各自从下载开始到下载结束(包括下载完成和下载取消两种情况)所用总时长。若下载完成比例为关键下载特征类型,则每个历史用户对应的关键历史下载数据中的下载完成比例的历史特征值,为各自下载结束时刻(包括下载完成时刻和下载取消时刻)对应的下载进度。
其中,所述概率转换函数是利用LIBSVM(Library for Support VectorMachines,支持向量机库)中集成的函数来实现SVM模型中距离值和概率值之间的转换。其中,所述LIBSVM是SVM模式识别与回归的软件包。
步骤S104,若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
具体的,所述服务器可获取所述客户端中的用户信息,所述用户信息可为提取到的客户端的用户标识码(例如,手机终端的手机号码,电脑终端的IP地址等),并根据所述用户标识码识别所用户信息是否为新进用户信息,若所述用户信息为新进用户信息,则在所述服务器检测到所述下载取消概率大于预设概率阈值时,立即向所述客户端推送与所述新进用户信息对应的业务数据包;可选地,若所述用户信息为回流用户信息,则获取所述用户信息的用户等级、并在所述服务器检测到所述下载取消概率大于预设概率阈值时,根据所述用户等级向所述客户端推送与所述回流用户信息对应的业务数据包。
进一步地,请一并参见图3,是本发明实施例提供的一种下载界面的示意图。如图3所示,所述下载界面100中包含用于下载某网络游戏的下载按钮,还包含在该网络游戏的下载业务期间,用于显示下载情况的下载进度条。所述服务器可以获取所述客户端(如图3所示的手机A)中的用户信息(例如,该手机A的手机号码),且所述服务器可进一步在数据库中查找是否存在与该用户信息相匹配的历史用户信息;若存在,则可将所述用户信息确定为回流用户信息,并可进一步获取所述用户信息的用户等级。若手机A在如图3所示的当前下载进度时向服务器上报最近一分钟内的平均下载速度(如15kb/s)和该一分钟内的下载完成比例(2%)(其中,平均下载速度和下载完成比例均为关键下载特征类型,15kb/s和2%分别为对应的目标特征值),则所述服务器可以根据已训练的SVM模型计算该目标特征值(即15kb/s和2%)对应的下载取消概率为85%。若预设概率阈值为80%,则所述下载取消概率大于所述预设概率阈值,所述服务器可以进一步向该手机A推送与所述用户信息的用户等级对应的业务数据包,且该业务数据包可以被展示在如图3所示的下载进度条上,当下载进度条从当前下载进度加载到业务数据包所在位置时,用户即可获得该业务数据包中的数据内容,从而可以降低用户取消下载的可能性,进而提升业务转换率。若预设概率阈值为90%,则所述下载取消概率小于所述预设概率阈值,此时,所述服务器不会向手机A推送业务数据包。
可见,通过提取到的所述客户端中的用户标识码,可将玩家智能地进行归类,即可将玩家大致分为新进玩家和回流玩家,于是,所述服务器可为新进玩家和回流玩家分别分配不同的业务数据包,比如,对于回流玩家,可为玩家推送个性化的辅助下载礼包(例如,蓝钻下载礼包),以有效地引导玩家完成下载,从而提升游戏的业务转换率。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率。
进一步地,请参见图4,是本发明实施例提供的另一种数据下载处理方法的流程示意图。如图4所示,所述方法可以包括:
步骤S201,获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;
具体的,所述服务器获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型,并根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;
其中,所述服务器可以为上述图1对应实施例中的服务器2000,且所述服务器获取所述原始历史下载数据的具体过程可以参见上述图1对应实施例中对服务器2000和运营客户端集群的描述,这里不再进行赘述。
其中,每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
其中,所述多个下载特征类型可为上述图1所涉及的下载速度、下载时长、下载完成比例、玩家在游戏内的等级、玩家当前进行的视频播放操作、玩家是否新进、玩家是否回流等特征类型;
其中,所述各待处理特征集合包括至少一个下载特征类型。
进一步地,请参见图5,是本发明实施例提供的一种筛选关键下载特征类型的流程示意图。如图5所示,所述筛选关键下载特征类型的具体过程包括如下步骤S301-步骤S305,且所述步骤S301-步骤S305是所述步骤S201的一个具体实施例;
步骤S301,获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
步骤S302,将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
其中,所述各待处理特征集中仅包含一个下载特征类型;
其中,所述信息熵增益的计算公式如下:
其中,所述信息熵定义如公式(1.2)所示:
其中,对于给定数据集D(数据集D即为多个历史用户分别对应的原始历史下载数据),假定D中第i类样本所占的比例为pi(i=1,2),其中第1类样本是指具有下载完成状态的原始历史下载数据,第2类样本是指具有下载取消状态的原始历史下载数据。对于待处理特征集合F,可以根据F中的下载特征类型对应的历史用户分布情况将D分成了V个子集{D1,D2,…,DV}(例如,若F中的下载特征类型为下载速度,且V为3,则可以将D1确定为下载速度0至20kb/s的子集,将D2确定为下载速度21至100kb/s的子集,D3确定为下载速度大于100kb/s的子集),进而可以计算待处理特征集合F的信息熵增益。
步骤S303,将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;
其中,所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
S304,当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并继续执行步骤S303(即对所述新的最优特征类型进行添加处理);
具体的,所述服务器在得到所述多个新的待处理特征集合后,可以进一步将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;判断所述第一信息熵增益是否小于所述第二信息熵增益;若判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;若判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
其中,步骤S303-S304可以重复执行,即每次确定出新的最优特征类型后,可将新的最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,以生成新的待处理特征集合。比如,以5个下载特征类型(f1,f2,f3,f4,f5)为例,首先可以将5个下载特征类型分别添加到对应的待处理特征集合,得到第一轮中的5个待处理特征集合({f1},{f2},{f3},{f4},{f5}),并计算5个待处理特征集合分别对应的信息熵增益,若待处理特征集合{f1}对应的信息熵增益最大,则第一轮确定的最优特征类型为待处理特征集合{f1}中的下载特征类型f1,则可将所述最优下载特征类型f1分别添加至剩余的下载特征类型分别对应的待处理特征集合,以得到4个新的待处理特征集合{f1,f2},{f1,f3},{f1,f4},{f1,f5}。此时,所述服务器可进一步根据上述步骤S302中的信息熵增益的计算公式(1.1)计算这4个新的待处理特征集合分别对应的信息熵增益,并在获得的4个信息熵增益中选择最大信息熵增益。若在第二轮的4个新的待处理特征集合分别对应的信息熵增益中,新的待处理特征集合{f1,f2}对应的信息熵增益最大,则可以判断所述第二轮得到的新的待处理特征集合{f1,f2}的信息熵增益是否小于第一轮得到的待处理特征集合{f1}的信息熵增益;若所述第二轮得到的新的待处理特征集合{f1,f2}的信息熵增益小于所述第一轮得到的待处理特征集合{f1}的信息熵增益(即说明第二轮的4个新的待处理特征集合均满足预设的最优特征收敛条件),则所述服务器可进一步执行步骤S305,即将已确定为最优特征类型的f1确定为关键下载特征类型;若所述第二轮得到的新的待处理特征集合{f1,f2}的信息熵增益大于或等于所述第一轮得到的待处理特征集合{f1}的信息熵增益(即说明第二轮中存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件),则将第二轮中具有最大信息熵增益的新的待处理特征集合{f1,f2}中的下载特征类型f1和f2确定为最优特征类型,并基于f1和f2重新执行步骤S303,以得到新的待处理集合{f1,f2,f3},{f1,f2,f4},{f1,f2,f5},以此类推,直至多个新的待处理特征集合均满足预设的最优特征收敛条件,即下一轮的新的待处理特征集合中的最大信息熵增益小于上一轮的待处理特征集合中的最大信息熵增益。
步骤S305,当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型;
比如,当影响玩家在游戏下载过程中取消下载的因素比较多时,所述服务器可先将所述多个下载特征类型中的每一个特征类型分别作为一个待处理特征集合,换言之,此时,若所述原始历史下载数据所涉及的多个下载特征类型中有n个下载特征类型,则可形成n个待处理特征集合(例如,{f1},{f2},…,{fn})。此时,所述服务器可进一步计算这n个待处理特征集合分别对应的信息熵增益(所述信息熵增益用于评价各待处理特征集合中的所有下载特征类型是否为最优下载特征类型,即信息熵增益越大,则所述待处理特征集合中包含的有助于分类的信息就越有用)。然后所述服务器可在这n个待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为最优下载特征类型(例如{ft},其中,1≤t≤n);随后,再将所述最优下载特征类型分别添加至剩下的n-1个下载特征类型分别对应的待处理特征集合,得到可以包含两个下载特征类型的新的待处理特征集合(此时,所述新的待处理特征集合(例如,{ft,fm},其中,1≤m≤n)的个数为n-1个),因此,可重复执行上述步骤中对各新的待处理特征集合所对应的信息熵增益的计算以及在这n-1个信息熵增益中选择新的最大熵增益,从而可进一步确定出新的最优特征类型(例如,{ft,fs},其中,1≤s≤n)。
鉴于此,当该最优特征类型的选择执行到第k+1轮时,且第k+1轮所对应的新的待处理特征集合对应的最大信息熵增益小于第k轮的新的待处理特征集合对应的最大信息熵增益时,所述服务器将不再继续生成新的待处理特征集合,即所述服务器在筛选到第k+1轮时,可确定在第k+1轮的所述多个新的待处理特征集合已均满足预设的最优特征收敛条件,因此,可将第k轮的具有最大信息熵增益的新的待处理特征集合中的所有下载特征类型确定为关键下载特征类型。
步骤S202,将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
其中,所述关键历史下载数据中的各关键下载特征类型是确定不变的,比如,一旦确定下载速度和下载时长为关键下载特征类型,则可将各历史用户分别对应的各下载速度和下载时长分别对应的历史特征值以及相应的下载状态确定为关键历史下载数据,以便于后续根据所述各历史特征值和下载状态训练SVM模型;
其中,所述下载状态包括下载取消状态和下载完成状态。
步骤S203,根据所述各关键历史下载数据训练支持向量机SVM模型。
具体的,所述服务器可将所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值,并根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;
其中,所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值。
其中,所述分类超平面的线性方程可以为:
wTx+b=0 (1.3)
其中,w=(w1,w2,w3,...,wd)为法向量,决定了所述分类超平面的方向,b为位移项,决定了所述分类超平面与原点之间的距离,显然,如果确定了ω和b,也就能唯一确定分类超平面,这里用(ω,b)表示这一分类超平面。
其中,获取所述法向量和位移项值的具体过程可以为:假设分类超平面(w,b)能将训练样本正确分类,即对于样本空间中的任意一个历史用户而言,有确定的历史特征值xi(xi具体为关键历史下载数据中的历史特征值),以及确定的下载状态yi(其中,yi=+1表明历史用户为下载完成状态,相对地,yi=-1表明历史用户为下载取消状态),因此有(xi,yi)∈D(D为历史用户样本集),且若yi=+1(正类样本),则有wTxi+b>0;可选地,若yi=-1(负类样本),则有wTxi+b<0。令
在训练过程中,我们保证距离超平面最近的这几个训练样本使式(1.4的等号成立,他们被称为“支持向量”(support vertor),两个异类(正反两类)支持向量到超平面的距离之和为:
其中,公式(1.5)被称为“间隔”。
SVM的核心思想是找到具有“最大间隔”的划分超平面,也就是说要找到能满足公式(1.4)中约束的超平面参数(w,b),使得公式(1.5)达到最大值,即:
显然,最大化等价于最小化||w||,于是公式(1.6)可重写为公式(1.7):
公式(1.7)就是SVM的基本模型。
对公式(1.7)使用拉格朗日乘子法可得到其“对偶问题”(dual problem),具体来说,对公式(1.7)的每条约束添加拉格朗日乘子δi≥0,则该问题的拉格朗日函数可写为:
对公式(1.8)求解,即得到分类超平面(w,b),具体求解过程可以先转换为其对偶问题,然后采用SMO算法求解。
步骤S204,响应客户端发送的应用下载请求;
步骤S205,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
步骤S206,基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;
其中,在所述SVM模型中,所述目标距离r的计算公式为:
r=|wTx+b|/|w||; (1.9)
其中,法向量w=(w1,w2,w3,...,wd),且wT为所述法向量的转置向量,另外,所述目标特征值为所述SVM模型的输入向量,即所述客户端上报的各关键下载特征类型分别对应的目标特征值x可作为所述SVM模型的输入向量,于是,可计算所述客户端的目标特征值到所述分类超平面的目标距离r;随后,在得到所述目标距离后,可根据所述SVM模型中的概率转换函数,将目标距离转换为对应的下载取消概率;
其中,所述概率转换函数,是利用LIBSVM中集成的函数来实现SVM模型中距离值和概率值之间的转换。其中,所述LIBSVM是SVM模式识别与回归的软件包。
步骤S207,若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
其中,所述步骤S204-步骤S207的具体实现方式可参见上述图2所对应实施例中对步骤S101-步骤S104的描述,这里将不再进行赘述。
可选地,在执行完步骤S207之后,所述服务器还可进一步在所述客户端处于下载完成状态或下载取消状态时,将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据。
比如,以关键下载特征类型为下载速度为例,当用户A通过客户端B在3分钟内完成对某网络游戏的下载时,可将该客户端B对应的用户A确定为历史用户,并将该客户端B在整个下载业务期间内的下载速度平均值作为历史特征值,随后,所述服务器可进一步将客户端B对应的下载完成状态和下载速度平均值确定为该历史用户的关键历史下载数据。
可选地,所述服务器还可在模型待更新时长达到预设的周期时长时,获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零。
例如,所述SVM模型的可以每间隔1天更新一次(即所述周期时长为1天),且所述服务器统计到所述周期时长内(如今天内)新增了的3个历史用户(例如,用户B、用户C和用户D)所对应的关键历史下载数据,所述服务器可进一步将所述周期时长之前所记录的各历史用户(例如,100个历史用户)分别对应的关键历史下载数据和今天新增的3个关键历史下载数据添加到SVM模型的样本计算空间中,即有103个历史用户所对应的下载状态作为所述SVM的训练输出值,且对应的有103个历史用户所对应的历史特征值作为所述SVM模型的训练输入值,从而可对所述SVM模型的超平面参数进行更新,并在更新完成后即可开始重新统计所述模型待更新时长。
进一步地,请参见图6,是本发明实施例提供的一种下载数据交互图。如图6所示,所述下载数据的交互过程主要发生在如图6所示的下载器(所述下载器可以位于用户终端侧)和服务器之间,其中,所述服务器可以包括数据采集器200,预测模型300,数据存储库500和礼包下发器400。其中,如图6所示,所述下载器可用于实时上报用户的下载信息数据(所述下载信息数据为与所述至少一个关键下载特征类型分别对应的目标特征值)给所述数据采集器200;所述数据采集器200可用于接收至少一个下载器分别上传的下载信息数据,并将这些下载信息数据发送给预测模型300,随后,所述预测模型300可以基于SVM模型计算所述下载信息数据对应的下载取消概率,并在所述下载取消概率大于预设概率阈值时,触发所述礼包下发器400向所述下载器推送礼包。与此同时,所述数据采集器200还可同时将处于下载完成状态或者下载取消状态的用户的下载信息数据确定为关键历史下载数据,并将所确定的关键历史下载数据存储到数据存储库500,以便于在检测到模型待更新时长达到所述预设的周期时长时,根据所述数据存储库500中的所有关键历史下载数据,更新所述预测模型300中的SVM模型。
比如,当所述服务器接收到新的客户端的下载器所发送的应用下载请求时,可对所述应用下载请求做出响应,此后,所述数据采集器200可获取所述下载器在下载业务期间内上报的与至少一个关键下载特征类型(例如,下载速度和下载时长)分别对应的目标特征值(例如,最近一分钟内的平均下载速度为8kb/s,其中,1分钟和8kb/s分别为对应的目标特征值),因此,所述数据采集器200可将最近一分钟内下载速度为8kb/s的目标特征值作为所述预测模型300中的SVM模型的输入值,从而使得所述预测模型300基于已训练的SVM模型进一步计算该目标特征值(即1分钟和8kb/s)对应的下载取消概率(例如,90%),此时,所述预测模型300可进一步在所述下载取消概率大于所述预设概率阈值(80%)时,通知所述礼包下发器400向所述下载器推送与所述用户信息对应的业务数据包。此外,若在所述下载业务期间内,所述下载器接收到用户对下载界面执行的下载取消操作时,所述下载器则可根据所述下载取消操作关闭当前下载界面,并将当前下载状态调整为下载取消状态,并将所述下载取消状态上报给所述数据采集器200,此时,所述数据采集器200可将整个下载业务期间内的各关键下载特征类型分别对应的目标特征值确定为历史特征值(例如,总共下载了5分钟,且5分钟内的平均下载速度为6kb/s;其中,5分钟和6kb/s分别为对应的历史特征值),并将所述下载器对应的下载取消状态和历史特征值作为关键历史下载数据存储至所述存储数据库500,以便于在检测到模型待更新时长达到所述预设的周期时长时,根据所述数据存储库500中的所有关键历史下载数据,更新所述预测模型300中的SVM模型。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率。此外,为避免SVM模型的维数灾难,在计算下载取消概率的过程中,仅需对该下载业务期间内的各关键下载特征类型所对应的目标特征值进行计算,以最大化的简化计算量,从而可提高对下载取消概率的计算效率。
进一步地,请参见图7,是本发明实施例提供的一种数据下载处理装置的结构示意图。如图7所示,所述数据下载处理装置1可应用于上述图1所对应实施例中的服务器2000,所述数据下载处理装置1可以包括:响应模块90,特征值获取模块10,取消概率计算模块20和数据包发送模块30;
所述响应模块90,用于响应客户端发送的应用下载请求;
所述特征值获取模块10,用于若获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
所述取消概率计算模块20,用于基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
所述数据包发送模块30,用于若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
其中,所述响应模块90,特征值获取模块10,取消概率计算模块20和数据包发送模块30的具体实现方式可参见上述图2所对应实施例中对步骤S101-步骤S104的描述,这里将不再进行赘述。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率。
进一步地,请参见图8,是本发明实施例提供的另一种数据下载处理装置的结构示意图。如图8所示,所述数据下载处理装置1可应用于上述图1所对应实施例中的服务器2000,所述数据下载处理装置1可以包括上述图7所对应实施例中的所述响应模块90,特征值获取模块10,取消概率计算模块20和数据包发送模块30,进一步地,所述数据下载处理装置1还可以包括;关键类型筛选模块40,关键数据确定模块50,模型训练模块60,历史数据更新模块70和模型参数更新模块80;
所述关键类型筛选模块40,用于获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
所述关键数据确定模块50,用于将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
所述模型训练模块60,用于根据所述各关键历史下载数据训练支持向量机SVM模型;
其中,所述关键类型筛选模块40,关键数据确定模块50,模型训练模块60的具体实现方式可参见上述图4所对应实施例中对步骤S201-步骤S203的描述,这里将不再继续进行赘述。
所述历史数据更新模块70,用于若所述客户端处于下载完成状态或下载取消状态,则将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据;
其中,所述历史数据更新模块70的具体实现方式可参见上述图4所对应实施例中对所述客户端对应的用户信息的描述,这里将不再继续进行赘述。
所述模型参数更新模块80,用于若模型待更新时长达到预设的周期时长,则获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零;
其中,所述模型参数更新模块80的具体实现方式可参见上述图4所对应实施例中对所述新增的关键历史下载数据描述,这里将不再继续进行赘述。
进一步地,请参见图9,是本发明实施例提供的一种模型训练模块的结构示意图。其中,所述下载状态包括下载取消状态和下载完成状态。如图9所示,所述模型训练模块60包括:输入输出确定单元601和参数计算单元602;
所述输入输出确定单元601,用于所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值;
所述参数计算单元602,用于根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值;
其中,所述输入输出确定单元601和参数计算单元602的具体实现方式可参见上述图4所对应实施例中对步骤S203的描述,这里将不再进行赘述。
进一步地,请参见图10,是本发明实施例提供的一种取消概率计算模块的结构示意图。如图10所示,所述取消概率计算模块20包括:目标距离计算单元201和转换计算单元202;
所述目标距离计算单元201,用于将所述目标特征值作为所述SVM模型的输入向量,并将所述输入向量和所述法向量进行相乘,并将相乘后的值与所述位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离;
所述转换计算单元202,用于基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率;
其中,所述目标距离计算单元201和转换计算单元202的具体实现方式可参见上述图2所对应实施例中对步骤S103的描述,这里将不再继续进行赘述。
进一步地,请参见图11,是本发明实施例提供的一种关键类型筛选模块的结构示意图。如图11所示,所述关键类型筛选模块40包括:获取提取单元401和选择确定单元402;
所述获取提取单元401,用于获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
所述选择确定单元402,用于根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
其中,所述获取提取单元401和选择确定单元402的具体实现方式可参见上述图4所对应实施例中对步骤S201的描述,这里将不再进行赘述。
进一步地,请参见图12,是本发明实施例提供的一种选择确定单元的结构示意图。如图12所示,所述选择确定单元402包括:第一确定子单元4021、添加子单元4022、第三确定子单元4023、判断子单元4024、通知子单元4025、第二确定子单元4026;
所述第一确定子单元4021,用于将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
所述添加子单元4022,用于将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
所述第三确定子单元4023,用于将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;
所述第三确定子单元4023,还用于获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;
所述判断子单元4024,用于判断所述第一信息熵增益是否小于所述第二信息熵增益;
所述第三确定子单元4023,还用于若所述判断子单元4024判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;
所述第三确定子单元4023,还用于若所述判断子单元4024判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
所述通知子单元4025,用于当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,通知所述第一确定子单元4021继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并通知所述添加子单元4022继续对所述新的待处理特征集合进行添加处理;
所述第二确定子单元4026,用于当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
其中,所述第一确定子单元4021、所述添加子单元4022、所述第三确定子单元4023、所述判断子单元4024、所述通知子单元4025、所述第二确定子单元4026的具体实现方式可参见上述图5所对应实施例中对步骤S302-步骤S305的描述,这里将不再继续进行赘述。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率。此外,为避免SVM模型的维数灾难,在计算下载取消概率的过程中,仅需对该下载业务期间内的各关键下载特征类型所对应的目标特征值进行计算,以最大化的简化计算量,从而可提高对下载取消概率的计算效率。
进一步地,请参见图13,是本发明实施例提供的又一种数据下载处理装置的结构示意图。如图13所示,所述数据下载处理装置1000可以应用于上述图1对应实施例中的服务器2000,所述数据下载处理装置1000可以包括:处理器1001,网络接口1004和存储器1004,此外,所述数据下载处理装置1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1004可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图13所示的数据下载处理装置1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1004中存储的设备控制应用程序,以实现:
响应客户端发送的应用下载请求;
获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
在一个实施例中,所述处理器1001在执行所述响应客户端发送的应用下载请求之前,还执行以下步骤:
获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
根据所述各关键历史下载数据训练支持向量机SVM模型。
在一个实施例中,所述下载状态包括下载取消状态和下载完成状态,所述处理器1001在执行所述根据所述各关键历史下载数据训练支持向量机SVM模型时,具体执行以下步骤:
将所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值;
根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值。
在一个实施例中,所述处理器1001在执行所述基于已训练的SVM模型计算所述目标特征值对应的下载取消概率时,具体执行以下步骤:
将所述目标特征值作为所述SVM模型的输入向量,并将所述输入向量和所述法向量进行相乘,并将相乘后的值与所述位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离;
基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率。
在一个实施例中,所述处理器1001,还执行以下步骤:
若所述客户端处于下载完成状态或下载取消状态,则将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据。
在一个实施例中,所述处理器1001,还执行以下步骤:
若模型待更新时长达到预设的周期时长,则获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零。
在一个实施例中,所述处理器1001在执行所述获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型时,具体执行以下步骤:
获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
在一个实施例中,所述处理器1001在执行所述根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型时,具体执行以下步骤:
将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并继续对所述新的最优特征类型进行添加处理;
当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
在一个实施例中,所述处理器1001还可以执行以下步骤:
将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;
获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;
判断所述第一信息熵增益是否小于所述第二信息熵增益;
若判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;
若判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
本发明实施例通过在响应客户端发送的应用下载请求时,获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。由此可见,本发明通过已训练的SVM模型对下载业务期间内的各关键下载特征类型分别对应的目标特征值进行计算,可得到所述客户端的下载取消概率,从而可进一步对该下载业务期间内的下载情况进行干预,以提升业务转换率,与此同时,在下载取消概率的计算过程中,仅需对该下载业务期间内的各关键下载特征类型进行计算,可最大化的简化计算量,从而可提高对下载取消概率的计算效率。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的数据下载处理装置1所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2或图4所对应实施例中对所述数据下载处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种数据下载处理方法,其特征在于,包括:
响应客户端发送的应用下载请求;
获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
2.根据权利要求1所述的方法,其特征在于,在所述响应客户端发送的应用下载请求之前,还包括:
获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
根据所述各关键历史下载数据训练支持向量机SVM模型。
3.根据权利要求2所述的方法,其特征在于,所述下载状态包括下载取消状态和下载完成状态;
所述根据所述各关键历史下载数据训练支持向量机SVM模型,包括:
将所述各关键历史下载数据中的与各关键下载特征类型分别对应的历史特征值确定为所述SVM模型的训练输入值,并将所述各关键历史下载数据中的下载状态确定为所述SVM模型的训练输出值;
根据所述训练输入值和所述训练输出值,计算所述SVM模型中的分类超平面对应的超平面参数;所述分类超平面是用于对具有所述下载完成状态的关键历史下载数据和具有所述下载取消状态的关键历史下载数据进行分类;所述超平面参数包括:法向量和位移项值。
4.根据权利要求3所述的方法,其特征在于,所述基于已训练的SVM模型计算所述目标特征值对应的下载取消概率,包括:
将所述目标特征值作为所述SVM模型的输入向量,并将所述输入向量和所述法向量进行相乘,并将相乘后的值与所述位移项值进行相加,并将相加后的值与所述法向量的模值进行相除,得到所述输入向量到所述分类超平面之间的目标距离;
基于所述SVM模型中的概率转换函数,计算所述目标距离对应的下载取消概率。
5.根据权利要求1所述的方法,其特征在于,还包括:
若所述客户端处于下载完成状态或下载取消状态,则将所述客户端对应的用户信息确定为历史用户,并将所述目标特征值与所述客户端对应的下载状态确定为关键历史下载数据。
6.根据权利要求5所述的方法,其特征在于,还包括:
若模型待更新时长达到预设的周期时长,则获取所述周期时长内所记录的新增的关键历史下载数据,并根据在所述周期时长之前所记录的关键历史下载数据和所述新增的关键历史下载数据,更新所述SVM模型的超平面参数,并将所述模型待更新时长清零。
7.根据权利要求2所述的方法,其特征在于,所述获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型,包括:
获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型,包括:
将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并继续对所述新的最优特征类型进行添加处理;
当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
9.根据权利要求8所述的方法,其特征在于,还包括:
将所述多个新的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第一信息熵增益;
获取所述多个新的待处理特征集合对应的多个更新前的待处理特征集合,并将所述多个更新前的待处理特征集合分别对应的信息熵增益中的最大信息熵增益,确定为第二信息熵增益;
判断所述第一信息熵增益是否小于所述第二信息熵增益;
若判断为是,则确定所述多个新的待处理特征集合均满足预设的最优特征收敛条件;
若判断为否,则确定存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件。
10.一种数据下载处理装置,其特征在于,包括:
响应模块,用于响应客户端发送的应用下载请求;
特征值获取模块,用于获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
取消概率计算模块,用于基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
数据包发送模块,用于若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
11.根据权利要求10所述的装置,其特征在于,还包括:
关键类型筛选模块,用于获取多个历史用户分别对应的原始历史下载数据,并在各原始历史下载数据所涉及的多个下载特征类型中筛选至少一个关键下载特征类型;每个原始历史下载数据均包括下载状态以及所述多个下载特征类型分别对应的历史特征值;
关键数据确定模块,用于将所述各原始历史下载数据中的下载状态以及与各关键下载特征类型分别对应的历史特征值,确定为各历史用户分别对应的关键历史下载数据;
模型训练模块,用于根据所述各关键历史下载数据训练支持向量机SVM模型。
12.根据权利要求11所述的装置,其特征在于,所述关键类型筛选模块,包括:
获取提取单元,用于获取多个历史用户分别对应的原始历史下载数据,并提取各原始历史下载数据所涉及的多个下载特征类型;
选择确定单元,用于根据所述多个下载特征类型生成多个待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的下载特征类型确定为关键下载特征类型;所述各待处理特征集合包括至少一个下载特征类型。
13.根据权利要求12所述的装置,其特征在于,所述选择确定单元,包括:
第一确定子单元,用于将各下载特征类型分别添加到对应的待处理特征集合,并计算各待处理特征集合分别对应的信息熵增益,并在所述各待处理特征集合分别对应的信息熵增益中选择最大信息熵增益,并将具有所述最大信息熵增益的待处理特征集合中的所有下载特征类型确定为最优特征类型;
添加子单元,用于将所述最优特征类型分别添加至剩余的下载特征类型分别对应的待处理特征集合,得到多个新的待处理特征集合;所述剩余的下载特征类型是指所述多个下载特征类型中除了所述最优特征类型以外的下载特征类型;
通知子单元,用于当存在至少一个新的待处理特征集合不满足预设的最优特征收敛条件时,通知所述第一确定子单元继续在所述多个新的待处理特征集合中确定出新的最优特征类型,并通知所述添加子单元继续对所述新的待处理特征集合进行添加处理;
第二确定子单元,用于当所述多个新的待处理特征集合均满足预设的最优特征收敛条件时,将已确定出的所述最优特征类型确定为关键下载特征类型。
14.一种数据下载处理装置,其特征在于,包括:处理器、网络接口、存储器;
所述处理器分别与网络接口、存储器相连,其中,所述网络接口用于与客户端通信,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行以下操作:
响应客户端发送的应用下载请求;
获取所述客户端在下载业务期间内的与至少一个关键下载特征类型分别对应的目标特征值;
基于已训练的SVM模型计算所述目标特征值对应的下载取消概率;所述SVM模型是根据多个历史用户分别对应的关键历史下载数据训练得到,各关键历史下载数据均包括下载状态以及各关键下载特征类型分别对应的历史特征值;
若所述下载取消概率大于预设概率阈值,则向所述客户端推送与所述客户端的用户信息对应的业务数据包。
15.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,当所述处理器执行所述程序指令时执行如权利要求1-9任一项所述的方法。
CN201710401623.3A 2017-05-31 2017-05-31 一种数据下载处理方法和装置 Active CN107257365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710401623.3A CN107257365B (zh) 2017-05-31 2017-05-31 一种数据下载处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710401623.3A CN107257365B (zh) 2017-05-31 2017-05-31 一种数据下载处理方法和装置

Publications (2)

Publication Number Publication Date
CN107257365A true CN107257365A (zh) 2017-10-17
CN107257365B CN107257365B (zh) 2018-08-07

Family

ID=60027756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710401623.3A Active CN107257365B (zh) 2017-05-31 2017-05-31 一种数据下载处理方法和装置

Country Status (1)

Country Link
CN (1) CN107257365B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965005A (zh) * 2018-07-18 2018-12-07 烽火通信科技股份有限公司 网络设备的自适应限速方法及其系统
CN110188940A (zh) * 2019-05-24 2019-08-30 深圳市腾讯计算机系统有限公司 业务处理方法及装置
CN110300034A (zh) * 2019-05-07 2019-10-01 清华大学 基于Web的网速测量方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101674527A (zh) * 2009-08-25 2010-03-17 中广卫星移动广播有限公司 移动多媒体广播推送数据的系统及方法
US20110105090A1 (en) * 2009-11-02 2011-05-05 Research In Motion Limited Integration of mobile devices with data communication systems
US20150317150A1 (en) * 2014-05-02 2015-11-05 Canon Kabushiki Kaisha Information processing apparatus capable of updating firmware, control method therefor, and storage medium storing control program therefor
CN105160009A (zh) * 2015-09-22 2015-12-16 小米科技有限责任公司 资源下载方法和装置
US20160029096A1 (en) * 2001-08-19 2016-01-28 The Directv Group, Inc. Network Video Unit
CN105610768A (zh) * 2014-11-25 2016-05-25 阿里巴巴集团控股有限公司 网络操作处理方法及装置
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160029096A1 (en) * 2001-08-19 2016-01-28 The Directv Group, Inc. Network Video Unit
CN101674527A (zh) * 2009-08-25 2010-03-17 中广卫星移动广播有限公司 移动多媒体广播推送数据的系统及方法
US20110105090A1 (en) * 2009-11-02 2011-05-05 Research In Motion Limited Integration of mobile devices with data communication systems
US20150317150A1 (en) * 2014-05-02 2015-11-05 Canon Kabushiki Kaisha Information processing apparatus capable of updating firmware, control method therefor, and storage medium storing control program therefor
CN105610768A (zh) * 2014-11-25 2016-05-25 阿里巴巴集团控股有限公司 网络操作处理方法及装置
CN105160009A (zh) * 2015-09-22 2015-12-16 小米科技有限责任公司 资源下载方法和装置
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965005A (zh) * 2018-07-18 2018-12-07 烽火通信科技股份有限公司 网络设备的自适应限速方法及其系统
CN108965005B (zh) * 2018-07-18 2021-05-14 烽火通信科技股份有限公司 网络设备的自适应限速方法及其系统
CN110300034A (zh) * 2019-05-07 2019-10-01 清华大学 基于Web的网速测量方法及装置
CN110300034B (zh) * 2019-05-07 2021-01-29 清华大学 基于Web的网速测量方法及装置
CN110188940A (zh) * 2019-05-24 2019-08-30 深圳市腾讯计算机系统有限公司 业务处理方法及装置
CN110188940B (zh) * 2019-05-24 2023-09-05 深圳市腾讯计算机系统有限公司 业务处理方法及装置

Also Published As

Publication number Publication date
CN107257365B (zh) 2018-08-07

Similar Documents

Publication Publication Date Title
EP3373543B1 (en) Service processing method and apparatus
CN108295476B (zh) 确定异常交互账户的方法和装置
CN110958135B (zh) 一种特征自适应强化学习DDoS攻击消除方法及系统
CN107423883B (zh) 待处理业务的风险识别方法及装置、电子设备
CN107678800B (zh) 后台应用清理方法、装置、存储介质及电子设备
WO2019184640A1 (zh) 一种指标确定方法及其相关设备
WO2010067605A1 (ja) ペアリングシステム、ペアリング装置、ペアリング装置の処理方法及びプログラム
CN110417607B (zh) 一种流量预测方法、装置及设备
CN107257365A (zh) 一种数据下载处理方法和装置
CN110225104A (zh) 数据获取方法、装置及终端设备
CN107767055A (zh) 一种基于串谋检测的众包结果汇聚方法及装置
CN107807852A (zh) 应用程序性能控制方法及设备
CN107729765A (zh) 多媒体数据的管理方法、装置、存储介质及电子设备
CN108985048A (zh) 模拟器识别方法及相关装置
CN110347566A (zh) 用于对注册风控模型进行效能评估的方法及装置
CN106549827A (zh) 网络状态的探测方法及装置
CN107784411A (zh) 模型中关键变量的探测方法及装置
CN112988275A (zh) 一种基于任务感知的移动边缘计算多用户计算卸载方法
CN105610698B (zh) 事件结果的处理方法和装置
CN106971296A (zh) 一种处理信息对象的方法、电子设备和存储介质
KR20210071227A (ko) 매칭 결정 방법을 제공하기 위한 컴퓨터 프로그램
CN110781410A (zh) 一种社群检测方法及装置
CN107222319A (zh) 一种通信操作分析方法及装置
CN109873836A (zh) 一种数据的风险评估方法及装置
CN107679871A (zh) 名单管理方法、装置、系统以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant