CN106685674B - 网络事件预测以及建立网络事件预测模型的方法和装置 - Google Patents

网络事件预测以及建立网络事件预测模型的方法和装置 Download PDF

Info

Publication number
CN106685674B
CN106685674B CN201510745659.4A CN201510745659A CN106685674B CN 106685674 B CN106685674 B CN 106685674B CN 201510745659 A CN201510745659 A CN 201510745659A CN 106685674 B CN106685674 B CN 106685674B
Authority
CN
China
Prior art keywords
signaling
user
network event
data
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510745659.4A
Other languages
English (en)
Other versions
CN106685674A (zh
Inventor
张建锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510745659.4A priority Critical patent/CN106685674B/zh
Priority to EP19192084.2A priority patent/EP3654585B1/en
Priority to PCT/CN2016/101852 priority patent/WO2017076154A1/zh
Priority to EP16861422.0A priority patent/EP3361674B1/en
Publication of CN106685674A publication Critical patent/CN106685674A/zh
Priority to US15/972,512 priority patent/US11196638B2/en
Application granted granted Critical
Publication of CN106685674B publication Critical patent/CN106685674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Abstract

本发明公开了一种网络事件预测以及建立网络事件预测模型的方法和装置,该方法包括:根据用户的信令面数据,确定该用户的信令序列数据,该用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型;根据该用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值,该用户的专家特征数据表示该用户的至少一个预设特征的值;根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率,提高了预测的准确率,并且减少了网络运行维护的成本。

Description

网络事件预测以及建立网络事件预测模型的方法和装置
技术领域
本发明涉及网络质量运行维护领域,并且更具体地,涉及通信领域中网络事件预测以及建立网络事件预测模型的方法和装置。
背景技术
随着人们需求和通信技术的不断提升,现代通信网络包含了越来越多的网元设备,通信网络的性能可能受到多方面因素的影响,如自然环境条件、周边信号干扰、市政工程及用户分布等。因此,现代的网络运行维护面临了诸多的挑战,当网络监控指标出现大异常时,网络问题可能已经出现,并且给用户的体验带来了影响。因此,网络性能的异常事件的预测与网络故障的预警对网络的运行维护有重要的意义。
当前网络的运行维护大量依赖专家经验,由于网络异常事件往往较多,人工的方式通常是将异常事件划分等级,优先处理优先级高的异常事件。即使是这种方式也需要大量的人力投入,一些自动化的工具被引入日常运行维护工作以辅助提升专家的工作效率,这些基于经验规则的工具无法覆盖所有的问题,且在各个网络局点需要投入大量人力对工具进行针对性优化。因此,这种依赖专家经验处理异常事件的方法运行维护成本较大、并且预测的准确度较低。
发明内容
本发明实施例提供了网络事件预测以及建立网络事件预测模型的方法和装置,提高了预测的准确率,并且减少了网络运行维护的成本。
第一方面,提供了一种网络事件预测的方法,该方法包括:根据用户的信令面数据,确定该用户的信令序列数据,该用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,其中,N为大于或等于1的正整数;根据该用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值,该第一监督预测模型表示该用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值,该用户的专家特征数据表示该用户的至少一个预设特征的值,该第二监督预测模型表示该用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系;根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率。
本发明实施例的一种网络事件预测的方法,通过用户的信令面数据,确定该用户的信令序列数据;根据该用户的信令面数据和第一监督预测模型,确定该用户发生事件的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该用户发生该事件的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率。
结合第一方面,在第一方面的第一种可能的实现方式中,该根据用户的信令面数据,确定该用户的信令序列数据,包括:根据该用户的N个信令数据,确定与该N个信令数据一一对应的N个信令;根据M个目标信令组和该N个信令,确定该用户的信令序列数据,该用户的信令序列数据表示该N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,在该根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率之前,该方法还包括:根据该用户的信令序列数据和第一非监督预测模型,确定该用户所属的第一分簇,该第一非监督预测模型表示该用户的信令序列数据与用户分簇之间的映射关系,其中,该第一分簇属于该用户分簇;该根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率,包括:根据该第一概率值、该第二概率值和该第一分簇,确定该第一网络事件的预测发生概率。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,在该根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率之前,该方法还包括:根据该用户的专家特征数据和第二非监督预测模型,确定该用户所属的第二分簇,该第二非监督预测模型表示该用户的专家特征数据与用户分簇之间的映射关系,其中,该第二分簇属于该用户分簇;该根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率,包括:根据该第一概率值、该第二概率值和该第二分簇,确定该第一网络事件的预测发生概率。
结合第一方面或第一方面的第一种至第三种可能的实现方式中的任一种可能的实现方式,在第一方面的第四种可能的实现方式中,该方法还包括:根据该第一网络事件的预测发生概率,确定该第一网络事件的预测结果,该第一网络事件的预测结果表示该第一网络事件是否发生;获取该第一网络事件的实际发生结果,该第一网络事件的实际发生结果表示该第一网络事件实际是否发生;根据该第一网络事件的预测结果与该第一网络事件的实际发生结果,确定该第一网络事件的预测准确率;当该第一网络事件的预测准确率低于阈值时,更新该第一监督预测模型和该第二监督预测模型中的至少一项。
结合第一方面或第一方面的第一种至第四种可能的实现方式中的任一种可能的实现方式,在第一方面的第五种可能的实现方式中,在该根据该用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值之前,该方法还包括:根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,该每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数;根据该每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,该根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,包括:根据该多个第一样本用户中每个第一样本用户的信令面数据,确定与该每个第一样本用户的N个信令数据一一对应的N个信令;根据每个第一样本用户的N个信令和该每个第一样本用户的第一标签信息,确定M个目标信令组,该M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且该按时间顺序排列的m个目标信令与该第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数;根据该M个目标信令组和该每个第一样本用户的N个信令,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令序列数据表示该每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
结合第一方面或第一方面的第一种至第六种可能的实现方式中的任一种可能的实现方式,在第一方面的第七种可能的实现方式中,在该根据该用户的专家特征数据和第二监督预测模型,确定该用户发生该事件的第二概率值之前,所述方法还包括:根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,该每个第二样本用户的专家特征数据表示该每个第二样本用户的至少一个预设特征的值,该第二监督预测模型表示该每个第二样本用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示该每个第二样本用户的该第一网络事件实际是否发生。
结合第一方面的第二种至第七种可能的实现方式中的任一种可能的实现方式,在第一方面的第八种可能的实现方式中,在该根据该用户的信令序列数据和第一非监督预测模型,确定该用户所属的第一分簇之前,该方法还包括:根据该多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系
结合第一方面的第三种至第七种可能的实现方式中的任一种可能的实现方式,在第一方面的第九种可能的实现方式中,在该根据该用户的专家特征数据和第二非监督预测模型,确定该用户所属的第二分簇之前,该方法还包括:根据该多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户分簇之间的映射关系。
本发明实施例的一种网络事件预测的方法,通过用户的信令面数据,确定该用户的信令序列数据;根据该用户的信令面数据和第一监督预测模型,确定该用户发生事件的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该用户发生该事件的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率,并且减少了网络运行维护的成本。
第二方面,提供了一种建立网络事件预测模型的方法,该方法包括:根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,该每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数;根据该每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系;根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,该每个第二样本用户的专家特征数据表示该每个第二样本用户的至少一个预设特征的值,该第二监督预测模型表示该每个第二样本用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示该每个第二样本用户的该第一网络事件实际是否发生;根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型用于确定该第一网络事件的预测发生概率。
本发明实施例的一种建立网络事件预测模型的方法,通过多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;通过多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定事件发生的预测结果,并且预测结果具有较高的准确率。
结合第二方面,在第二方面的第一种可能的实现方式中,该根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,包括:根据该多个第一样本用户中每个第一样本用户的信令面数据,确定与该每个第一样本用户的N个信令数据一一对应的N个信令;根据每个第一样本用户的N个信令和该每个第一样本用户的第一标签信息,确定M个目标信令组,该M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且该按时间顺序排列的m个目标信令与该第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数;根据该M个目标信令组和该每个第一样本用户的N个信令,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令序列数据表示该每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
结合第二方面或第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,在该根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型之前,该方法还包括:根据该多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系;该根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,包括:根据该第一监督预测模型、该第二监督预测模型和该第一非监督预测模型,确定该第一网络事件预测模型。
结合第二方面或第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,在该根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型之前,该方法还包括:根据该多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户分簇之间的映射关系;该根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,包括:根据该第一监督预测模型、该第二监督预测模型和该第二非监督预测模型,确定该第一网络事件预测模型。
本发明实施例的一种建立网络事件预测模型的方法,通过多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;通过多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定事件发生的预测结果,并且预测结果具有较高的准确率,并且使用该事件预测模型能够减少网络运行维护的成本。
第三方面,提供了一种网络事件预测的装置,该装置包括存储器和与该存储器连接的处理器,该存储器用于存储指令,该处理器用于执行该存储器存储的指令,当该处理器执行该存储器中存储的指令时,该处理器具体用于执行第一方面中的方法。
第四方面,提供了一种建立网络事件预测模型的装置,该装置包括存储器和与该存储器连接的处理器,该存储器用于存储指令,该处理器用于执行该存储器存储的指令,当该处理器执行该存储器中存储的指令时,该处理器具体用于执行第二方面中的方法。
第五方面,提供了一种网络事件预测的装置,该装置包括执行第一方面中的方法的各模块。
第六方面,提供了一种建立网络事件预测模型的装置,该装置包括执行第二方面中的方法的各模块。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的建立网络事件预测模型的系统的示意图。
图2是根据本发明实施例的建立网络事件预测模型的方法的示意性流程图。
图3是根据本发明实施例的网络事件预测的系统的示意图。
图4是根据本发明实施例的网络事件预测的方法的示意性流程图。
图5是根据本发明实施例的网络事件预测的方法的示意图。
图6是根据本发明实施例的建立网络事件预测模型的方法的示意性流程图。
图7是根据本发明实施例的网络事件预测模型的方法的示意性流程图。
图8是根据本发明实施例的建立网络事件预测模型的装置的示意性框图。
图9是根据本发明实施例的建立网络事件预测模型的装置的另一示意性框图。
图10是根据本发明实施例的网络事件预测的装置的示意性框图。
图11是根据本发明实施例的网络事件预测的装置的另一示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明实施例的建立网络事件预测模型的系统的示意图。如图1所示,该系统100包括:信令生成模块101、标签信息生成模块102、目标信令组生成模块103、信令序列数据生成模块104、专家特征数据生成模块105、监督预测模型106和非监督预测模型107,组合预测模型108。
信令生成模块101,用于对多个第一样本用户中的每个样本用户与网络通信的信令数据进行多次采样,得到能够表示该每个第一样本用户一段时间内的网络行为的信令面数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,通过对该每个第一样本用户的N个信令数据进行编码处理生成与该N个信令数据一一对应的N个信令。
标签信息生成模块102,用于生成表示该每个第一样本用户的第一网络事件实际是否发生的结果的标签信息。由于标签信息通常延期到达,标签信息通常是以周的形式批量地达到。由于信令面数据的目标信令组构造模块需要有标签信息,因此系统把一周内多个第一样本用户中每个第一样本用户的信令面数据和用户面数据进行压缩保存。
目标信令组生成模块103,用于在该每个第一样本用户的第一标签信息到达后,利用自动序列特征构造算法根据每个第一样本用户的信令面数据和第一标签信息,生成至少一个目标信令组。这里的自动序列特征构造算法是一种可以自动地从信令序列中提取出目标信令序组的算法,该目标信令组在不同的第一标签信息类型下包括的第一样本用户的信令面数据中出现的频率/频次有明显的差异,即该目标信令组中的目标信令与第一网络事件的发生密切相关,具有能够判断事件发生概率或者是否发生该事件的效力。
信令序列数据生成模块104,用于根据M个目标信令组和信令生成模块生成的该待测用户的N个信令,确定该待测用户的信令序列数据,该待测用户的信令序列数据表示该待测用户的N个信令中是否包括按时间顺序排列的mi个预设信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,1≤i≤M,mi≥1。
专家特征数据生成模块105,用于通过专家特征工程算子根据多个第二样本用户中每个第二样本用户的用户面数据,生成每个第二样本用户的专家特征数据,该每个第二样本用户的专家特征数据表示该每个第二样本用户的至少一个预设特征的值。
应理解,这里的预设特征是指基于对业务的理解,人工构造的一系列特征,用于刻画用户的行为,根据不同的业务需求会设定不同的预设特征,本发明实施例对此不作限定。
监督预测模型106,用于根据该多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,通过监督学习算法,训练出第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系;或者可以根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,通过监督学习算法,训练出第二监督预测模型,该第二监督预测模型表示该每个第二样本用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系。
可选地,该第一监督预测模型和该第二监督预测模型可以基于一种或者多种监督学习算法训练,例如可以为决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
非监督预测模型107,用于根据多个第一样本用户中每个第一样本用户的信令序列数据,通过聚类算法,训练出第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系;或者根据多个第二样本用户中每个第二样本用户的专家特征数据,通过聚类算法,训练出第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户分簇之间的映射关系。
可选地,该第一非监督预测模型和该第二非监督预测模型可以基于一种或多种聚类算法训练,例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
组合预测模型108,用于根据第一监督预测模型、第二监督预测模型、第一非监督预测模型和第二非监督预测模型的输出结果确定第一网络事件的预测发生概率。
应理解,该组合预测模型可以确定第一网络事件发生的概率值,并且可以根据该概率值确定该第一网络事件是否发生,或者可以确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
图2示出了本发明实施例的建立网络事件预测模型的方法的示意性流程图。如图2所示,该方法200可以由图1的建立网络事件预测模型的系统执行,该网络事件预测模型包括第一监督预测模型、第二监督预测模型、第一非监督预测模型和第二非监督预测模型和组合预测模型,该网络事件的预测结果可以根据该网络事件预测模型确定。
下面将详细描述该网络事件预测模型中的该第一监督预测模型、该第二监督预测模型、该第一非监督预测模型和该第二非监督预测模型的建立过程。
S201,根据第一数据库中存储的数据和信令生成模块,生成多个第一样本用户中的每个第一样本用户的N个信令。
应理解,该第一数据库可以包括该多个第一样本用户中每个第一样本用户与网络通信的信令数据。
具体而言,在至少一个按照时间顺序排列的时间戳中的每个时间戳对多个第一样本用户中的每个第一样本用户与网络通信的信令数据进行采样,得到该每个第一样本用户的信令面数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该每个信令数据包括至少一个与信令相关的数据,通过信令序列构造算子对该每个信令数据进行特殊编码处理之后得到与每个该信令数据对应的信令。
可选地,时间戳可以是从某一时刻起开始计时所经过的时间,例如可以为由1970-01-01 00:00:00开始计时所经过的秒数,但本发明实施例不限于此。该时间戳可以具体为信令传输的开始时间、结束时间或通过对开始时间和结束时间进行处理而获得的时间,例如该时间戳为开始时间和结束时间的算术平均值,等等。在表一中,该时间戳具体为信令传输的开始时间,并且该信令面数据示例性地还包括信令传输的结束时间,但本发明实施例不限于此。
可选地,该信令数据可以包括信令类型,该信令类型可以用数值表示,每个数值对应一种信令类型,但也可以采用其他形式表示。作为另一个可选实施例,如表一所示,该信令数据还可以包括接入网类型和附着成功标记,其中,接入网类型可以是2G、3G或者4G,具体可以用数值表示,例如可以用1表示2G网、2表示3G网、3表示4G网,但本发明实施例不限于此。附着成功标记可以用于表示信令成功地被接收端接收,表一中用0表示接收失败、1表示接收成功,但也可以采用其他方式表示,本发明实施例对此不作限定。
应理解,本发明实施例以信令数据包括信令类型、接入网类型和附着成功标记为例进行描述。在本发明实施例中,该信令数据也可以包括其它数据,具体可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
表一
Figure GDA0002155781170000111
作为一个可选实施例,可以通过将每个信令数据中与信令相关的数据粘贴在一起,得到与该信令数据对应的信令,本发明实施例对此不作限定。
可选地,可以以表二的方式对表一中的各个时间戳对应的信令数据进行组合编码,以生成表三中的结果。例如,如果某一个第一样本用户的信令数据的信令类型为1,接入网类型为2,并且附着成功标记为1,则可以将该信令数据编码为121,即121用于表示一个信令。可选地,还可以采用其他方式对信令数据进行编码,以获得一个信令,本发明实施例对此不做限定。
表二
时间戳 1443431409 1443431523 1443431608 1443431716
信令类型 2 1 2 3
接入网类型 2 2 3 3
附着成功标记 1 1 0 1
信令 221 121 230 331
S202,从该第一数据库获取该多个第一样本用户中每个第一样本用户的第一标签信息,其中,每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生的结果。
这样,可以得到如表三所示的结果。例如,在需要预测用户是否会投诉运营商时,某个第一样本用户的第一标签信息可以表示该第一样本用户是否进行了投诉,此时,该第一标签信息可以包括1或0,其中,1表示进行了投诉,0表示未进行投诉,或者该第一标签信息可以包括用于表示第一网络事件发生结果的其它表示参数,本发明实施例对此不做限定。
表三
S203,根据该多个第一样本用户中每个第一样本用户的N个信令、该每个第一样本用户的第一标签信息和目标信令组生成模块,生成M个目标信令组,该M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且按时间顺序排列的m个目标信令与该第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数。
应理解,该按时间顺序排列的m个目标信令可以为该每个第一样本用户的N个信令中的部分信令或者所有信令。
作为一个实施例,假设按照时间顺序排列的信令121、信令331在标签为0的A个第一样本用户中出现的概率为90%,而在标签为1的B个第一样本用户中出现的概率为5%,即在A个第一样本用户和B个第二样本用户中出现的频率/频次具有明显的差异,则可以认为信令121和信令331为目标信令,并且目标信令组121、331与第一网络事件的发生密切相关,具有预测第一网络事件是否发生的效力,其中A和B均为大于或等于一的整数。
可选地,该目标信令还可以为特征信令或者特征序列,该目标信令组还可以为特征信令组或者特征序列组,本发明实施例对此不作限定。
作为一个实施例,如表四中所示,目标信令230、131、331是按照时间戳顺序排列的,并且具有能够判断事件发生概率或者是否发生事件的效力,则可以称230、131、331为一个目标信令序列组,本发明实施例对此不作限定。
表四
Figure GDA0002155781170000131
S204,根据该多个第一样本用户中每个第一样本用户的N个信令、该M个目标信令组和信令序列数据生成模块,生成该多个第一样本用户中每个第一样本用户的信令序列数据。
具体而言,该每个第一样本用户的信令序列数据表示该每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
可选地,如表五所示,在该每个第一样本用户的信令序列数据中可以用数值1表示该每个第一样本用户的所有信令中包括某一个目标信令组中的目标信令,即该每个第一样本用户的所有信令中包括该目标信令组中按时间顺序排列的所有目标信令,用数值0表示该每个第一样本用户的所有信令中不包括某一个目标信令组中的目标信令,即该每个第一样本用户的所有信令中不包括该目标信令组中的每个目标信令,或者虽然包括该目标信令组中的每个目标信令,但是该目标信令组中的每个目标信令没有按时间顺序排列,本发明实施例对此不作限定。
作为一个实施例,表五中示出了每个第一样本用户的信令序列数据,第一样本用户1的所有信令中包括目标信令组1和目标信令组3中的目标信令,不包括目标信令组2中的目标信令;第一样本用户2的所有信令中包括目标信令组2和目标信令组3中的目标信令,不包括目标信令组1中的目标信令;第一样本用户3的所有信令中不包括目标信令组1、目标信令组2或者目标信令组3中的目标信令。其中,该目标信令组1包括目标信令230、131、331,目标信令组2包括目标信令121、121,目标信令组3包括目标信令120、130,但本发明实施例不限于此。
表五
S205,根据该多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与第一网络事件发生的概率值之间的映射关系。
具体而言,该第一监督预测模型通过该多个第一样本用户中每个第一样本用户的信令序列数据及与该每个第一样本用户的信令序列数据对应的第一标签信息,通过监督学习算法训练一个最优模型,这个模型属于某个函数的集合,最优表示在某个评价的准则下可以根据输入得到最接近实际结果的输出,使得可以通过该第一监督预测模型将待测用户输入的信令序列数据映射为相应输出的第一网络事件发生的概率值,对输出进行简单的判断从而得到第一网络事件是否发生的预测结果。
如表六所示,例如,在需要预测用户是否会投诉运营商时,该第一标签信息中1表示进行了投诉,0表示未进行投诉,该第一监督预测模型根据第一样本用户1的信令序列数据可以得到该第一样本用户1最终进行了投诉,根据第一样本用户2的信令序列数据得到该第一样本用户最终进行了投诉,根据第一样本用户3的信令序列数据得到该第一样本用户最终未进行投诉,以及多个第一样本用户中每个样本用户的信令序列数据和第一标签信息之间的关系,可以训练该第一监督预测模型,得到一个关于输入和输出之间的映射关系,使得该第一监督预测模型可以根据待测用户的信令序列数据,确定该待测用户的投诉事件的预测结果。
可选地,该第一监督预测模型可以基于一种或者多种监督学习算法。例如可以为决策树算法、逻辑回归算法、支持向量机算法或组合算法等,本发明实施例不限于此。
表六
Figure GDA0002155781170000151
S206,根据该多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系。
具体而言,该第一非监督预测模型通过聚类算法,计算多个第一样本用户中每个第一样本用户的信令序列数据之间的相似度,将该多个第一样本用户分成若干个第一样本用户子集,每个子集内部具有相似性,不同子集之间不相似,这样的子集称为簇。该第一非监督预测模型可以用来确定该每个第一样本用户所属的唯一分簇。
具体而言,该第一非监督预测模型通过聚类算法,计算多个第一样本用户中每个第一样本用户的信令序列数据之间内部的相似度,例如,该第一非监督预测模型可以通过计算该多个第一样本用户之间的欧氏距离,将该多个第一样本用户分成若干个第一样本用户子集,每个子集内部具有相似性,不同子集之间不相似,这样的子集称为簇。该第一非监督预测模型可以用来需要确定该每个第一样本用户所属的唯一分簇。
如表五所示,例如在需要预测用户是否会投诉运营商时,该第一非监督预测模型可以通过计算第一样本用户1、第一样本用户2和第一样本用户3之间信令序列数据的欧氏距离,训练该第一非监督预测模型,作为一个可选实施例,该第一非监督预测模型可以根据该第一样本用户1、第一样本用户2和第一样本用户3等多个第一样本用户中每个第一样本用户的信令序列数据,确定该多个第一样本用户的分簇,使得该第一非监督预测模型可以根据待测用户的信令序列数据,确定该待测用户所属的分簇。
应理解,该第一非监督预测模型的用户分簇的个数与该第一标签信息的类型的个数相同,那么该第一非监督预测模型被训练后能够将不同的输入映射为两类输出结果的非监督预测模型,但本发明实施例不限于此。
可选地,该第一非监督预测模型可以根据一种或多种非监督学习算法对模型进行训练。例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
S207,从第二数据库存储的数据中确定多个第二样本用户中每个第二样本用户的用户面数据。
应理解,该第二数据库包括该多个第二样本用户中每个第二样本用户与网络通信的通信数据,该通信数据包括该每个第二样本用户与网络进行交互的所有操作记录。
可选地,该每个第二样本用户的用户面数据可以包括该每个第二样本用户TCP连接请求次数、TCP连接成功次数,作为一个可选实施例,如表七所示,该每个第二样本用户的用户面数据还可以包括该每个第二样本用户获取(get)事务请求次数和get事务成功次数,在本发明实施例中,该每个第二样本用户的用户面数据也可以包括其他数据,具体可以根据实际需要预测的事件确定,本发明实施例不限于此。
表七
Figure GDA0002155781170000161
S208,根据多个第二样本用户中每个样本用户的用户面数据和专家特征数据生成模块,生成该多个第二样本用户中每个第二样本用户的专家特征数据。
应理解,该多个第一样本用户与该多个第二样本用户可以为相同的样本用户,可以为不同的样本用户,也可以为部分相同的样本用户。专家特征是指基于对不同业务的理解,人工构造出来的具体业务需要的预设特征,本发明对此不作限定。
具体而言,该每个第二样本用户的专家特征数据可以为在该每个第二样本用户的用户面数据中确定的预设特征的值,例如,假设根据实际需要预测的网络事件,确定预设特征为TCP连接成功率,则该每个第一样本用户的专家特征数据可以为该第一样本用户的TCP连接成功率的数值,还可以根据实际需要预测的网络事件确定需要的专家特征,但本发明实施例不限于此。
作为一个可选实施例,如表八中所示,该每个第二样本用户的专家特征数据可以为TCP连接成功率和get事务请求成功率,该TCP连接成功率和get事务请求成功率可以用小数表示,也可以用百分数表示,但也可以采用其他形式表示,本发明对此不作限定。该TCP连接成功率为TCP连接成功次数与TCP连接请求次数的比值,该get事务请求成功率为get事务成功次数与get事务请求次数的比值,例如,样本用户1的TCP连接成功率为0.34,get事务请求成功率为0.4,本发明实施例不限于此。
可选地,该每个第二样本用户的专家特征数据具体还可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
表八
Figure GDA0002155781170000171
S209,根据该多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,该第二监督预测模型表示该每个第二样本用户的专家特征数据与网络事件发生概率值之间的映射关系。
具体而言,该第二监督预测模型通过该多个第二样本用户中每个第二样本用户的专家特征数据及与给每个第二样本用户的专家特征数据对应的第二标签信息,通过监督学习算法训练一个最优模型,这个模型属于某个函数的集合,最优表示在某个评价的准则下可以根据输入得到最接近实际结果的输出,使得可以通过该第二监督预测模型将待测用户输入的专家特征数据映射为相应输出的第一网络事件发生的概率值,对输出进行简单的判断从而得到第一网络事件是否发生的预测结果。
如表九所示,例如,在需要预测用户是否会投诉运营商时,该第一标签信息中“1”表示进行了投诉,“0”表示未进行投诉,该第二监督预测模型可以根据第二样本用户1的专家特征数据得到用户最终进行了投诉;根据第二样本用户2的专家特征数据得到用户最终进行了投诉;根据第二样本用户3的专家特征数据得到用户最终未进行投诉,以及多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息之间的关系,可以训练该第二监督预测模型,得到一个关于输入和输出之间的映射关系,使得该第二监督预测模型可以根据待测用户的专家特征数据,确定该待测用户投诉事件的预测结果。
可选地,该多个第二样本用户中每个第二样本用户的专家特征数据可以为根据实际需要预测的事件确定的其他专家特征的数值,本发明实施例不限于此。
可选地,该第二监督预测模型可以基于一种或者多种监督学习算法。例如可以为决策树算法、逻辑回归算法、支持向量机算法或组合算法等,本发明实施例不限于此。
表九
TCP连接成功率 get事务请求成功率 第二标签信息
样本用户1 0.34 0.4 1
样本用户2 0.48 0.43 1
样本用户3 0.5 0.88 0
S210,根据该多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户的分簇之间的映射关系。
具体而言,该第二非监督预测模型通过聚类算法,计算多个第二样本用户中每个第二样本用户的专家特征数据之间内部的相似度,例如,该第二非监督预测模型可以通过计算该多个第二样本用户之间专家特征数据的欧氏距离,将该多个第二样本用户分成若干个第二样本用户子集,每个子集内部具有相似性,不同子集之间不相似,这样的子集称为分簇。该第二非监督预测模型可以用来确定该每个第二样本用户所属的唯一分簇。
如表八所示,例如,在需要预测用户是否会投诉运营商时,该第一非监督预测模型可以通过计算第二样本用户1、第二样本用户2和第二样本用户3之间专家特征数据的欧氏距离,训练该第二非监督预测模型,作为一个可选实施例,该第二非监督预测模型可以根据第二样本用户1的TCP连接成功率为0.34、get事务请求成功率为0.4,第二样本用户2的TCP连接成功率为0.48、get事务请求成功率为0.43,第二样本用户3的TCP连接成功率为0.5、get事务请求成功率为0.88,等多个第二样本用户中每个第二样本用户的专家特征数据,通过聚类算法,训练该第二非监督预测模型,使得该第二非监督预测模型可以根据待测用户专家特征数据,确定该待测用户所属的分簇。
应理解,如表五所示,本发明实施例仅以3个第一样本用户的信令序列数据为例说明该第一非监督预测模型的建模过程,在具体的建模过程中还可以根据该多个第一样本用户的信令序列数据训练该第二非监督预测模型,其中,通过多个第一样本用户的信令序列数据训练第二非监督预测模型时的目标信令组相当于通过专家特征数据训练第二非监督预测模型时的预设特征,具体的训练过程与专家特征数据的训练过程相类似,但本发明实施例不限于此。
可选地,该第二非监督预测模型可以根据一种或多种非监督学习算法对模型进行训练。例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
应理解,S201至S206为根据多个第一样本用户中每个第一样本用户的信令序列数据建立第一监督预测模型和第一非监督预测模型的方法;S207至S210为根据多个第二样本用户中每个第二样本用户的专家特征数据建立第二监督预测模型和第二非监督预测模型的方法,两个方法为并列的方法,因此,两个方法之间的执行顺序可以互换,本发明对此不作限定。
本发明实施例可以根据该第一监督预测模型、该第二监督预测模型和组合预测模块,确定该事件预测模型。该组合预测模型表示监督预测模型输出的概率值与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第一非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第二非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第一非监督预测模型、该第二非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。但本发明实施例不限于此。
具体而言,对于多个待测用户,可以根据该第一监督预测模型和该第二监督预测模型基于多种监督学习算法,确定该多个待测用户中每个待测用户的至少一个第一概率值和至少一个第二概率值,以及该第一非监督预测模型和该第二非监督预测模型基于多种聚类算法,确定的该多个待测用户中每个待测用户的至少一个第一分簇和至少一个第二分簇,确定函数f,对该函数f进行编码之后作为该组合预测模型的输入,通过优化该组合预测模型函数,使得该组合预测模型函数的最小,确定该多个待测用户中每个待测用户的第一网络事件发生的概率值,其中,若某种监督预测模型或者非监督预测模型不存在时,则在该函数f中不计入该模型的相应输出,本发明实施例不限于此。
作为一个实施例,本发明实施例可以根据网络事件预测模型确定第一网络事件发生的概率值,或者确定该第一网络事件是否发生。
作为另一个实施例,本发明实施例还可以根据该网络事件预测模型确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
本发明实施例的建立网络事件预测模型的方法,通过根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;根据多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定网络事件发生的预测结果,该预测结果具有较高的准确率,并且使用该第一网络事件预测模型能够减少网络运行维护的成本。
图3示出了本发明实施例的网络事件预测的系统的示意图。如图3所示,该系统300包括:信令生成模块301、信令序列数据生成模块302、专家特征数据生成模块303、监督预测模型304、非监督训练模型305、对齐/缺失值处理模块306和组合预测模型307。
信令生成模块301,用于对待测用户与网络通信的信令数据进行多次采样,得到能够表示该待测用户一段时间内的网络行为的信令面数据,该待测用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,通过对该待测用户的N个信令数据进行编码处理生成与该N个信令数据一一对应的N个信令。
信令序列数据生成模块302,用于根据M个预设信令组和信令生成模块生成的该待测用户的N个信令,确定该待测用户的信令序列数据,该待测用户的信令序列数据表示该待测用户的N个信令中是否包括按时间顺序排列的mi个预设信令,其中,该M个预设信令组中的第i个预设信令组包括该按时间顺序排列的mi个预设信令,1≤i≤M,mi≥1。
专家特征数据生成模块303,用于通过专家特征工程算子根据该待测用户的用户面数据,生成该待测用户的专家特征数据,该待测用户的专家特征数据表示该待测用户的至少一个预设特征的值。
应理解,这里的预设特征是指基于对业务的理解,人工构造的一系列特征,用于刻画用户的行为,根据不同的业务需求会设定不同的预设特征,本发明实施例对此不作限定。
监督预测模型304,用于根据该待测用户的信令序列数据预测该待测用户的第一网络事件发生的第一概率值;或者根据该待测用户的专家特征数据预测该待测用户第一网络事件发生的第二概率值。
可选地,该第一监督预测模型和该第二监督预测模型可以根据一种或者多种监督学习算法确定该待测用户发生该第一网络事件的概率,例如可以为决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
非监督预测模型305,用于根据该待测用户的信令序列数据预测该待测用户所属的第一分簇;或者根据该待测用户的专家特征预测该待测用户所属的第二分簇。
可选地,该第一非监督预测模型和该第二非监督预测模型可以根据一种或多种聚类算法,确定该待测用户所属的分簇,例如可以根据层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
对齐/缺失值处理模块306,用于判断缺失,并对缺失值进行补齐处理。监督预测模型和非监督预测模型在预测事件的结果时,由于数据来源不同,这些数据到达本系统的时间可能并不一致。当属于同一时间点的信令面数据和用户面数据预测的输出时间间隔超过一个阈值时,把超过时间窗的输出定义为缺失。由于数据异构性、数据/模型的同步性问题,或者数据隐私问题,经常导致监督预测模型和非监督预测模型输出缺失,本发明通过缺失值推断的方法把缺失值补齐。
组合预测模型307,用于根据该监督预测模型输出的概率值和该非监督预测模型输出的分簇,确定该待测用户发生该事件的预测结果。
可选地,该组合预测模型可以根据第一监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第一概率值和第二监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第二概率值确定该第一网络事件的预测发生概率。
可选地,该组合模型还可以根据第一监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第一概率值、第二监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第二概率值和第一非监督预测模型预测的该待测用户所属的至少一个第一分簇,确定该第一网络事件的预测发生概率。
可选地,该组合模型还可以根据第一监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第一概率值、第二监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第二概率值和第二非监督预测模型预测的该待测用户所属的至少一个第二分簇,确定该第一网络事件的预测发生概率。
可选地,该组合模型还可以根据第一监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第一概率值、第二监督预测模型预测的该待测用户的该第一网络事件发生的至少一个第二概率值、第一非监督预测模型预测的该待测用户所属的至少一个第一分簇和第二非监督预测模型预测的该待测用户所属的至少一个第二分簇,确定该第一网络事件的预测发生概率。
应理解,该组合预测模型可以确定第一网络事件发生的概率值,并且可以根据该概率值确定该第一网络事件是否发生,或者可以确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
图4示出了本发明实施例的网络事件预测的方法的示意性流程图。如图4所示,该方法400可以由图3中的网络事件预测的系统执行。
S401,根据用户数据库中存储的待测用户的数据和信令生成模块,生成该待测用户的N个信令,该用户数据库中包括该待测用户与网络的信令数据。
具体而言,在至少一个按照时间顺序排列的时间戳中的每个时间戳对该待测用户与网络通信的信令数据进行采样,得到该待测用户的信令面数据,该待测用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该每个信令数据包括至少一个与信令相关的数据,通过信令序列构造算子对该每个信令数据进行特殊编码处理之后得到与每个该信令数据对应的信令。
可选地,时间戳可以是从某一时刻起开始计时所经过的时间,例如可以为由1970-01-01 00:00:00开始计时所经过的秒数,但本发明实施例不限于此。该时间戳可以具体为信令传输的开始时间、结束时间或通过对开始时间和结束时间进行处理而获得的时间,例如该时间戳为开始时间和结束时间的算术平均值,等等。在表十中,该时间戳具体为信令传输的开始时间,并且该信令面数据示例性地还包括信令传输的结束时间,但本发明实施例不限于此。
可选地,该信令数据可以包括信令类型,该信令类型可以用数值表示,每个数值对应一种信令类型,但也可以采用其他形式表示。作为另一个可选实施例,如表一所示,该信令数据还可以包括接入网类型和附着成功标记,其中,接入网类型可以是2G、3G或者4G,具体可以用数值表示,例如可以用1表示2G网、2表示3G网、3表示4G网,但本发明实施例不限于此。附着成功标记可以用于表示信令成功地被接收端接收,表一中用0表示接收失败、1表示接收成功,但也可以采用其他方式表示,本发明实施例对此不作限定。
应理解,本发明实施例以信令数据包括信令类型、接入网类型和附着成功标记为例进行描述。在本发明实施例中,该信令数据也可以包括其它数据,具体可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
表十
Figure GDA0002155781170000231
Figure GDA0002155781170000241
作为一个可选实施例,可以通过将每个信令数据中与信令相关的数据粘贴在一起,得到与该信令数据对应的信令,本发明实施例对此不作限定。
具体地,可以以表十一的方式对表十中的各个时间戳对应的信令数据进行组合编码,以生成表十二中的结果。例如,如果某一个待测用户的信令类型为1,接入网类型为2,并且附着成功标记为1,则可以将该信令数据编码为121,即121用于表示一个信令。可选地,还可以采用其他方式对信令数据进行编码,以获得一个信令,本发明实施例对此不做限定。
表十一
时间戳 1443431409 1443431523 1443431608 1443431716
信令类型 2 1 2 3
接入网类型 2 2 3 3
附着成功标记 1 1 0 1
信令 221 121 230 331
表十二
S402,根据该待测用户的N个信令、至少一个预设信令组和信令序列数据生成模块,生成该待测用户的信令序列数据。
具体而言,该待测用户的信令序列数据表示该待测用户的N个信令中是否包括按时间顺序排列的mi个预设信令,其中,该M个预设信令组中的第i个预设信令组包括该按时间顺序排列的mi个预设信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
作为一个实施例,假设待测用户对应的所有信令为S1、S2、…、SN,则与该待测用户的所有信令中的每个信令对应的时间戳为T1、T2、…、TN,信令序列数据生成模块中包括按照时间顺序排列的目标信令
Figure GDA0002155781170000243
其中,1≤i1<i2<…<iM≤N,p≥1。假设目标信令序列组的数量为p,则该待测用户的信令序列数据可以由向量表示。
可选地,如表十三所示,在待测用户的信令序列数据中可以用数值1表示该待测用户的所有信令中包括某一个预设信令组中的预设信令,即该每个第一样本用户的所有信令中包括该预设信令组中按时间顺序排列的所有预设信令,用数值0表示该预设用户的所有信令中不包括某一个预设信令组中的预设信令,即该待测用户的所有信令中不包括预设信令组中的每个预设信令,或者虽然包括该预设信令组中的每个预设信令,但是该预设信令组中的每个预设信令没有按时间顺序排列,本发明实施例对此不作限定。
表十三示出了该待测用户的信令序列数据,其中,该待测用户的所有信令包括预设信令组1和预设信令组3中的预设信令,但不包括预设信令组2中的预设信令,但本发明实施例不限于此。
表十三
预设信令组1 预设信令组2 预设信令组3
待测用户 1 0 1
S403,根据该待测用户的信令序列数据和第一监督预测模型,确定该待测用户的第一网络事件发生的第一概率值,该第一监督预测模型表示该待测用户的信令序列数据与第一网络事件发生的概率值之间的映射关系。
可选地,在S403之前,可以根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练该第一监督预测模型。
可选地,该第一监督预测模型可以根据一种或者多种监督学习算法确定该待测用户的该第一网络事件发生的概率值,例如可以根据决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
S404,根据该待测用户的信令序列数据和第一非监督预测模型,确定该待测用户所属的第一分簇,该第一非监督预测模型表示该待测用户的信令序列数据与用户分簇之间的映射关系。
可选地,在S404之前,可以根据多个第一样本用户中每个第一样本用户的信令序列数据,训练该第一非监督预测模型。
可选地,该第一非监督预测模型可以根据一种或多种非监督学习算法确定该待测用户发生该事件的分簇,例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
S405,从用户数据库存储的数据中确定该待测用户的用户面数据,该用户数据库包括了该待测用户与网络通信的通信数据,该通信数据包括该待测用户与网络进行交互的所有操作记录。
可选地,该待测用户的用户面数据可以包括该待测用户TCP连接次数、TCP成功次数,作为一个可选实施例,如表十四所示,该待测用户的用户面数据还可以包括该待测用户get事务请求次数和get事务成功次数,在本发明实施例中,该待测用户的用户面数据也可以为包括其他数据,具体可以根据实际需要预测的事件确定,本发明实施例不限于此。
表十四
S406,根据该待测用户的用户面数据和专家特征数据生成模块,生成该待测用户的专家特征数据。
应理解,该多个第一样本用户与该多个第二样本用户可以为相同的样本用户,可以为不同的样本用户,也可以为部分相同的样本用户。专家特征是指基于对不同业务的理解,人工构造出来的具体业务需要的预设特征,本发明对此不作限定。
具体而言,该待测用户的专家特征数据可以为在该待测用户的用户面数据中确定的预设特征的值,例如,假设根据实际需要预测的事件,确定预设特征为TCP连接成功率,则该待测用户的专家特征数据可以为该待测用户的TCP连接成功率的数值,还可以根据实际需要预测的事件确定需要的专家特征,但本发明实施例不限于此。
作为一个可选实施例,如表十五中所示,该待测用户的专家特征数据可以为TCP连接成功率和get事务请求成功率,该TCP连接成功率和get事务请求成功率可以用小数表示,也可以用百分数表示,但也可以采用其他形式表示,本发明对此不作限定。该TCP连接成功率为TCP连接成功次数与TCP连接请求次数的比值,该get事务请求成功率为get事务成功次数与get事务请求次数的比值,例如,该待测用户的TCP连接成功率为0.34,get事务请求成功率为0.4,本发明实施例不限于此。
可选地,该待测用户的专家特征数据具体还可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
作为一个实施例,假设专家特征的数量为q,则该用户的专家特征数据可以由向量表示,其中,q≥1。
表十五
TCP连接成功率 get事务请求成功率
待测用户 0.34 0.4
S407,根据该待测用户的专家特征数据和第二监督预测模型,确定该待测用户发生事件的第二概率值,该第二监督预测模型表示该待测用户的专家特征数据与网络事件发生概率值之间的映射关系。
可选地,S407之前,可以根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练该第二监督预测模型。
可选地,该第二监督预测模型可以根据一种或者多种监督学习算法确定该待测用户发生该事件的概率值,例如可以根据决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
S408,根据该待测用户的专家特征数据和第二非监督预测模型,确定该待测用户所属的第二分簇,该第二非监督预测模型表示该待测用户的专家特征数据与用户分簇之间的映射关系。
可选地,在S408之前,可以根据多个第二样本用户中每个第二样本用户的专家特征数据,训练该第二非监督预测模型。
可选地,该第二非监督预测模型可以根据一种或多种非监督学习算法确定该待测用户发生该事件的分簇,例如可以根据层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
如图5中所示,作为一个实施例,对于该待测用户,假设第一监督预测模型具有k个监督预测算法,则第一监督预测模型的概率输出为
Figure GDA0002155781170000271
假设第二监督预测模型具有l个监督预测算法,则第二监督预测模型的输出为
Figure GDA0002155781170000272
其中,k、l≥1,且k与l的值可以相等,也可以不等。
假设第一非监督预测模型有m个聚类算法,则第一非监督预测模型的输出为假设第二非监督预测模型有r个聚类算法,则第二非监督预测模型的输出为
Figure GDA0002155781170000274
其中m、r≥1,且m与r的值可以相等,也可以不等。
应理解,S401至S404为根据待测用户的信令序列数据预测第一网络事件发生的概率值和该待测用户所属的第一分簇的方法;S405至S408为根据待测用户的专家特征数据预测该第一网络事件发生的概率值和该待测用户所属的第二分簇的方法,两个方法为并列的方法,因此,两个方法之间的执行顺序可以互换,本发明对此不作限定。
S409,当获得该第一概率值的时间与获得该第二概率值的时间之间的间隔超过阈值时,对该第一概率值和该第二概率值中较晚获得的概率值进行时间对齐处理;对经过该时间对齐处理的该较晚获得的概率值进行缺失值补齐处理。
具体而言,假设第一监督预测模型确定的参考用户1、参考用户2、参考用户3和待测用户的第一概率值分别为M1、M2和M4,其中,M1、M2和M4可以为该第一监督预测模型通过不同的监督学习算法确定的第一概率值;第二监督预测模型确定的参考用户1、参考用户2、参考用户3和待测用户的第二概率值为M3,如表十六所示,由于第一监督预测模型获得该待测用户的第一概率值的时间与获得该待测用户的第二概率值的时间之间的间隔超过阈值,并且获得该待测用户的第一概率值的时间早于获得该待测用户的第二概率值的时间,这种情况下,可以对该待测用户的第二概率值M3进行时间对齐处理,并根据其他用户的第一概率值和第二概率值对M3进行缺失值补齐。
应理解,由于数据异构性、数据/模型的同步性问题,或者数据隐私等问题,也会导致监督预测模型输出的第一概率值和第二概率值缺失,本发明实施例对此不作限定。
还应理解,此处参考用户1、参考用户2和参考用户3可以为与该待测用户不同的其他待测的用户,并且参考用户1、参考用户2和参考用户3没有概率值的缺失,本发明实施例对此不作限定。
作为一个可选实施例,如表十六所示,该待测用户的M3值可以根据参考用户1的M1、M2和M4的值生成的向量1、参考用户2M1、M2和M4的值生成的向量2、参考用户3的M1、M2和M4的值生成的向量3以及该待测用户的M1、M2和M4的值生成的向量x,确定向量1、向量2、向量3和向量x之间的欧氏距离,根据各向量间的欧氏距离的值,确定该待测用户与参考用户1、参考用户2或者参考用户3中的某一个参考用户相近,假设参考用户1与该待测用户相近,则将该参考用户1的M3值确定为该待测用户缺失的M3值,但本发明实施例对此不作限定。
可选地,非监督预测模型的输出同样可能产生用户分簇的缺失,该对齐/缺失值处理模块同样可以对非监督预测模型输出的每个参考用户的参考类型进行编码之后,缺失的分簇进行推断,本发明实施例对此不作限定。
表十六
M1 M2 M3 M4
参考用户1 0.3 0.5 0.4 0.1
参考用户2 0.7 0.5 0.8 0.6
参考用户3 0.7 0.8 0.8 0.7
待测用户 0.1 0.2 0.2
S410,根据对齐/缺失值处理后的该第一概率值、该第二概率值和组合预测模型,确定该待测用户的该第一网络事件的预测发生概率。
可选地,作为一个可选实施例,该组合预测模型可以仅根据该第一概率值和该第二概率值的加权、平均或者其他计算规则,确定该待测用户的该第一网络事件的预测发生概率。
可选地,作为另一个可选实施例,该组合预测模型还可以根据该第一概率值和该第二概率值的加权、平均或者其他计算规则,以及该待测用户所属的第一分簇,联合确定该待测用户的该第一网络事件的预测发生概率。
可选地,作为另一个可选实施例,该组合预测模型还可以根据该第一概率值和该第二概率值的加权、平均或者其他计算规则,结合该待测用户所属的第二分簇,确定该待测用户的该第一网络事件的预测发生概率。
可选地,作为另一个可选实施例,该组合预测模型还可以根据该第一概率值和该第二概率值的加权、平均或者其他计算规则,结合该待测用户所属的第一分簇和第二分簇,确定该待测用户的该第一网络事件的预测发生概率,本发明实施例对此不作限定。
具体而言,对于多个待测用户,可以根据该第一监督预测模型和该第二监督预测模型基于多种监督学习算法,确定该多个待测用户中每个待测用户的至少一个第一概率值和至少一个第二概率值,以及该第一非监督预测模型和该第二非监督预测模型基于多种聚类算法,确定的该多个待测用户中每个待测用户的至少一个第一分簇和至少一个第二分簇,确定函数f,对该函数f进行编码之后作为该组合预测模型的输入,通过优化该组合预测模型函数,使得该组合预测模型函数的最小,确定该多个待测用户中每个待测用户的第一网络事件发生的概率值,其中,若某种监督预测模型或者非监督预测模型不存在时,则在该函数f中不计入该模型的相应输出,本发明实施例不限于此。
作为一个实施例,本发明实施例可以根据网络事件预测模型确定第一网络事件发生的概率值,或者确定该第一网络事件是否发生。
作为另一个实施例,本发明实施例还可以根据该网络事件预测模型确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
作为一个可选实施例,如图5中所示,在预测用户投诉的概率的实施例中,假设用户的第一监督预测模型、第二监督预测模型、第一非监督预测模型和第二非监督预测模型的输出结果为:
Figure GDA0002155781170000301
Figure GDA0002155781170000302
对f进行如下编码:对f向量的每个值,用两个值进行编码,对于监督预测模型的输出结果,用(p,1-p)编码原来的p;对于非监督预测模型的输出结果,用(1,0)和(0,1)对簇的类型进行编码。记编码后的f向量为f=(a1,a2,…,av),其中v=2*(k+l+m+r),k、l、m、r均为大于等于一的整数。
当待预测的用户数量为n个时,n>1,记矩阵A为所有用户的f向量,每一行表示一个用户,并且由下式表示:
Figure GDA0002155781170000303
记矩阵Y为模型输出的类别与实际类别的对应关系,并且由下式表示:
Figure GDA0002155781170000304
其中,(1,0),(0,1)表示该模型为监督预测模型,(0,0)表示该模型为非监督预测模型,在本实施例中,(1,0)为该监督预测模型的预测类别为投诉类,(0,1)表示该监督预测模型的预测类别为非投诉类。
应理解,该Y矩阵的列数是预测类别的数量,在本实施例中,预测类别数量为2类(即投诉和非投诉);Y的行数是v的值,表示的是每个模型的输出结果。
应理解,实际模型输出的结果数量为k+l+m+r个,但是f向量进行了一系列编码,编码后的总输出结果为v=2*(k+l+m+r)个。
记矩阵Q为表示理论上模型输出的类别对应实际类别的概率关系,该矩阵中所有元素的值未知:Q=[qij]。
记矩阵U为每位用户属于每个类别的概率矩阵,每位用户一行,该矩阵中所有元素的值未知,是本发明最终的预测结果:U=[uij],其中,uij表示第i个用户的第j类的预测结果,在本实施例中,j为投诉或不投诉两类,矩阵U表示某一个用户的投诉类预测结果或者未投诉类结果,所述投诉类结果和所述非投诉类结果的和为1。
通过优化下式使得该式取得最小值时,确定矩阵U的值,即为n个用户的最终预测结果,通过预测结果与预测域值之间的比较,确定n个用户中的投诉用户和不投诉用户,
Figure GDA0002155781170000311
其中,α为可调节参数,
Figure GDA0002155781170000312
可选地,当预测该第n个用户的预测结果时,可根据该第n个待测用户定义:
Figure GDA0002155781170000313
即对角元为的对角矩阵,
Figure GDA0002155781170000315
即对角元为
Figure GDA0002155781170000316
的对角矩阵,
Kv=diag{kj}v×v,即对角元为kj的对角矩阵,其中
Figure GDA0002155781170000317
这里yjz是矩阵Y中的元素,c表示Y的列数,其中c表示预测类别的数量,在本实施例中为2,
Dλ=(Dv+αKv)-1Dv
D1-λ=(Dv+αKv)-1(αKv)
S=Dv -1A′Dn -1A
Q=(I-DλS)-1D1-λY
则对第n+1个待测用户可以通过下式确定预测结果:
Figure GDA0002155781170000318
其中,h表示模型的数量,即k+l+m+r,un+1,.是一个长度为c的向量,表示预测类别的概率。
可选地,在通过事件预测模型确定了多个用户中每个用户发生事件的预测结果之后,可以获取该多个用户中每个发生所述事件的实际结果,并根据该每个用户发生该事件的预测结果与该每个用户发生该事件的实际结果,确定预测准确率,当该预测准确率低于阈值时,更新该第一监督预测模型和该第二监督预测模型中的至少一项。
可选地,该阈值可以为得到该多个用户发生事件的预测结果之后设置实际需要的阈值,也可以是提前配置在组合预测模型之中的阈值,本发明实施例对此不作限制。
本发明实施例的网络事件预测的方法,通过根据用户的信令面数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率,并且减少了网络运行维护的成本。
图6示出了本发明实施例的建立网络事件预测模型的方法的示意性流程图。
S610,根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,该每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数。
S620,根据该每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系。
S630,根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,该每个第二样本用户的专家特征数据表示该每个第二样本用户的至少一个预设特征的值,该第二监督预测模型表示该每个第二样本用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示该每个第二样本用户的该第一网络事件实际是否发生。
具体而言,该多个第二样本用户中每个第二样本用户的用户面数据可以包括该每个第二样本用户与网络通信的用户数据。
应理解,该多个第一样本用户与该多个第二样本用户可以为相同的样本用户,可以为不同的样本用户,也可以为部分相同的样本用户,本发明对此不作限定。
S640,根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型用于确定该第一网络事件的预测发生概率。
具体而言,可以根据该第一监督预测模型、该第二监督预测模型和组合预测模型,确定该事件预测模型,其中,该组合预测模型表示该第一监督预测模型确定的事件发生的第一概率值和该第二监督预测模型确定的事件发生的第二概率值与事件发生的预测结果之间的映射关系。
本发明实施例的建立网络事件预测模型的方法,通过根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;根据多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定该第一网络事件的预测结果,该预测结果具有较高的准确率。
具体而言,在S610中,在至少一个按照时间顺序排列的时间戳中的每个时间戳对多个第一样本用户中的每个第一样本用户与网络通信的信令数据进行采样,得到该每个第一样本用户的信令面数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该每个信令数据包括至少一个与信令相关的数据,通过信令序列构造算子对该每个信令数据进行特殊编码处理之后得到与每个该信令数据对应的信令。从该第一数据库获取该多个第一样本用户中每个第一样本用户的第一标签信息,其中,每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生的结果。
可选地,可以根据该多个第一样本用户中每个第一样本用户的N个信令和该每个第一样本用户的第一标签信息,生成M个目标信令组,该M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且按时间顺序排列的m个目标信令与该第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数。
应理解,该按时间顺序排列的m个目标信令可以为该每个第一样本用户的N个信令中的部分信令或者所有信令。
作为一个实施例,假设按照时间顺序排列的信令121、信令331在标签为0的A个第一样本用户中出现的概率为90%,而在标签为1的B个第一样本用户中出现的概率为5%,即在A个第一样本用户和B个第二样本用户中出现的频率/频次具有明显的差异,则可以认为信令121和信令331为目标信令,并且目标信令组121、331与第一网络事件的发生密切相关,具有预测第一网络事件是否发生的效力,其中A和B均为大于或等于一的整数。
可选地,该目标信令还可以为特征信令或者特征序列,该目标信令组还可以为特征信令组或者特征序列组,本发明实施例对此不作限定。
作为一个实施例,如表四中所示,目标信令230、131、331是按照时间戳顺序排列的,并且具有能够判断事件发生概率或者是否发生事件的效力,则可以称230、131、331为一个目标信令序列组,本发明实施例对此不作限定。
在确定M个目标信令组和该每个第一样本用户的N个信令之后,可以根据该每个第一样本用户的N个信令和该M个目标信令组,生成该多个第一样本用户中每个第一样本用户的信令序列数据。该每个第一样本用户的信令序列数据表示该每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
可选地,在每个第一样本用户的信令序列数据中可以用数值1表示该每个第一样本用户的所有信令中包括某一个目标信令组中的目标信令,即该每个第一样本用户的所有信令中包括该目标信令组中按时间顺序排列的所有目标信令,用数值0表示该每个第一样本用户的所有信令中不包括某一个目标信令组中的目标信令,即该每个第一样本用户的所有信令中不包括该目标信令组中的每个目标信令,或者虽然包括该目标信令组中的每个目标信令,但是该目标信令组中的每个目标信令没有按时间顺序排列,本发明实施例对此不作限定。
具体而言,在S620中,该第一监督预测模型通过该多个第一样本用户中每个第一样本用户的信令序列数据及与该每个第一样本用户的信令序列数据对应的第一标签信息,通过监督学习算法训练一个最优模型,这个模型属于某个函数的集合,最优表示在某个评价的准则下可以根据输入得到最接近实际结果的输出,使得可以通过该第一监督预测模型将待测用户输入的信令序列数据映射为相应输出的第一网络事件发生的概率值,对输出进行简单的判断从而得到第一网络事件是否发生的预测结果。
可选地,该第一监督预测模型可以基于一种或者多种监督学习算法。例如可以为基于决策树算法、逻辑回归算法、支持向量机算法或组合算法等,本发明实施例不限于此。
可选地,还可以根据该多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系。
可选地,该第一非监督预测模型可以通过聚类算法,计算多个第一样本用户中每个第一样本用户的信令序列数据之间内部的相似度,例如,该第一非监督预测模型可以通过计算该多个第一样本用户之间的欧氏距离,将该多个第一样本用户分成若干个第一样本用户子集,每个子集内部具有相似性,不同子集之间不相似,这样的子集称为簇。该第一非监督预测模型可以用来需要确定该每个第一样本用户所属的唯一分簇。
可选地,该第一非监督预测模型可以根据一种或多种非监督学习算法对模型进行训练。例如可以根据层次聚类算法、K均值算法或基于图的聚类算法等,本发明实施例不限于此。
具体而言,在S630中,从第二数据库存储的数据中确定多个第二样本用户中每个第二样本用户的用户面数据,并根据该多个第二样本用户中每个样本用户的用户面数据,确定该每个第二样本用户的专家特征数据,该专家特征数据具体可以为该用户的专家特征的数值,该第二数据库包括该多个第二样本用户中每个第二样本用户与网络通信的通信数据,该通信数据包括该每个第二样本用户与网络进行交互的所有操作记录。
应理解,该每个第二样本用户的第二标签信息用于表示该每个第二样本用户的事件发生结果。例如,在需要预测用户是否会投诉运营商时,某个第二样本用户的第二标签信息可以表示该第二样本用户是否进行了投诉,此时,该第二标签信息可以包括1或0,其中,1表示进行了投诉,0表示未进行投诉,或者该第二标签信息可以包括用于表示事件发生结果的其它表示参数,本发明实施例对此不做限定。
还应理解,该多个第一样本用户与该多个第二样本用户可以为相同的样本用户,可以为不同的样本用户,也可以为部分相同的样本用户。专家特征是指基于对不同业务的理解,人工构造出来的具体业务需要的预设特征,本发明对此不作限定。
可选地,该每个第二样本用户的用户面数据可以包括该每个第二样本用户TCP连接请求次数、TCP连接成功次数,作为一个可选实施例,如表七所示,该每个第二样本用户的用户面数据还可以包括该每个第二样本用户获取事务请求次数和get事务成功次数,在本发明实施例中,该每个第二样本用户的用户面数据也可以包括其他数据,具体可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
作为一个实施例,假设根据实际需要预测的网络事件,确定专家特征为TCP连接成功率,则该用户的专家特征数据可以为该用户的TCP连接成功率的数值,该TCP连接成功率具体可以为TCP连接成功次数与TCP连接请求次数的比值,但本发明实施例不限于此。
具体而言,在确定每个第二样本用户的专家特征数据和第二标签信息之后,该第二监督预测模型根据该多个第二样本用户中每个第二样本用户的专家特征数据及与给每个第二样本用户的专家特征数据对应的第二标签信息,通过监督学习算法训练一个最优模型,这个模型属于某个函数的集合,最优表示在某个评价的准则下可以根据输入得到最接近实际结果的输出,使得可以通过该第二监督预测模型将待测用户输入的专家特征数据映射为相应输出的第一网络事件发生的概率值,对输出进行简单的判断从而得到第一网络事件是否发生的预测结果。
可选地,该多个第二样本用户中每个第二样本用户的专家特征数据可以为根据实际需要预测的事件确定的其他专家特征的数值,本发明实施例不限于此。
可选地,该第二监督预测模型可以基于一种或者多种监督学习算法。例如可以为决策树算法、逻辑回归算法、支持向量机算法或组合算法等,本发明实施例不限于此。
可选地,还可以根据该多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户的分簇之间的映射关系。
具体而言,该第二非监督预测模型通过聚类算法,计算多个第二样本用户中每个第二样本用户的专家特征数据之间内部的相似度,例如,该第二非监督预测模型可以通过计算该多个第二样本用户之间专家特征数据的欧氏距离,将该多个第二样本用户分成若干个第二样本用户子集,每个子集内部具有相似性,不同子集之间不相似,这样的子集称为簇。该第二非监督预测模型可以用来需要确定该每个第二样本用户所属的唯一分簇。
可选地,该第二非监督预测模型可以根据一种或多种非监督学习算法对模型进行训练。例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
可选地,在该第二监督预测模型具体的建模过程中还可以根据该多个第一样本用户的信令序列数据训练该第二非监督预测模型,其中,通过多个第一样本用户的信令序列数据训练第二非监督预测模型时的目标信令组相当于通过专家特征数据训练第二非监督预测模型时的预设特征,具体的训练过程与专家特征数据的训练过程相类似,本发明实施例不限于此。
具体而言,在S640中,具体而言,对于多个待测用户,可以根据该第一监督预测模型和该第二监督预测模型基于多种监督学习算法,确定该多个待测用户中每个待测用户的至少一个第一概率值和至少一个第二概率值,以及该第一非监督预测模型和该第二非监督预测模型基于多种聚类算法,确定的该多个待测用户中每个待测用户的至少一个第一分簇和至少一个第二分簇,确定函数f,对该函数f进行编码之后作为该组合预测模型的输入,通过优化该组合预测模型函数,使得该组合预测模型函数的最小,确定该多个待测用户中每个待测用户的第一网络事件发生的概率值,其中,若某种监督预测模型或者非监督预测模型不存在时,则在该函数f中不计入该组合预测模型的相应输出,本发明实施例不限于此。
本发明实施例可以根据该第一监督预测模型、该第二监督预测模型和组合预测模块,确定该事件预测模型。该组合预测模型表示监督预测模型输出的概率值与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第一非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第二非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。
可选地,本发明实施例还可以根据该第一监督预测模型、该第二监督预测模型、该第一非监督预测模型、该第二非监督预测模型和组合预测模型,确定该事件预测模型,该组合预测模型表示监督预测模型输出的概率值和非监督预测模型输出的分簇与预测结果之间的映射。但本发明实施例不限于此。
作为一个实施例,本发明实施例可以根据网络事件预测模型确定第一网络事件发生的概率值,或者确定该第一网络事件是否发生。
作为另一个实施例,本发明实施例还可以根据该网络事件预测模型确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
本发明实施例的建立网络事件预测模型的方法,通过根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;根据多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定第一网络事件发生的预测结果,该预测结果具有较高的准确率,并且使用该第一网络事件预测模型能够减少网络运行维护的成本。
图7示出了本发明实施例的网络事件预测的方法的示意性流程图。
S710,根据用户的信令面数据,确定该用户的信令序列数据,该用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,其中,N为大于或等于1的正整数。
应理解,此处的用户可以为待测用户,或者其他参考用户等,本发明实施例对此不作限定。
S720,根据该用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值,该第一监督预测模型表示该用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系。
S730,根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值,该用户的专家特征数据表示该用户的至少一个预设特征的值,该第二监督预测模型表示该用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系。
S740,根据该第一概率值和该第二概率值,确定该第一网络事件的预测发生概率。
本发明实施例的网络事件预测的方法,通过根据用户的信令面数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率,并且减少了网络运行维护的成本。
具体而言,在S710中,在至少一个按照时间顺序排列的时间戳中的每个时间戳对该待测用户与网络通信的信令数据进行采样,得到该待测用户的信令面数据,该待测用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该每个信令数据包括至少一个与信令相关的数据,通过信令序列构造算子对该每个信令数据进行特殊编码处理之后得到与每个该信令数据对应的信令。
应理解,本发明实施例的信令数据还可以包括接入网类型和附着成功标记,或者还可以包括其它数据,具体可以根据实际需要预测的事件确定,本发明实施例不限于此。
可选地,该信令数据可以包括信令类型,该信令类型可以用数值表示,每个数值对应一种信令类型,但也可以采用其他形式表示。作为另一个可选实施例,如表一所示,该信令数据还可以包括接入网类型和附着成功标记,其中,接入网类型可以是2G、3G或者4G,具体可以用数值表示,例如可以用1表示2G网、2表示3G网、3表示4G网,但本发明实施例不限于此。附着成功标记可以用于表示信令成功地被接收端接收,表一中用0表示接收失败、1表示接收成功,但也可以采用其他方式表示,本发明实施例对此不作限定。
应理解,本发明实施例以信令数据包括信令类型、接入网类型和附着成功标记为例进行描述。在本发明实施例中,该信令数据也可以包括其它数据,具体可以根据实际需要预测的网络事件确定,本发明实施例不限于此。
可选地,可以通过将每个信令数据中与信令相关的数据粘贴在一起,得到与该信令数据对应的信令,本发明实施例对此不作限定。
具体而言,在确定该待测用户的N个信令之后,可以根据该待测用户的N个信令以及至少一个预设信令组,确定该待测用户的信令序列数据。该待测用户的信令序列数据表示该待测用户的N个信令中是否包括按时间顺序排列的mi个预设信令,其中,该M个预设信令组中的第i个预设信令组包括该按时间顺序排列的mi个预设信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
作为一个实施例,假设待测用户对应的所有信令为S1、S2、…、SN,则与该待测用户的所有信令中的每个信令对应的时间戳为T1、T2、…、TN,信令序列数据生成模块中包括按照时间顺序排列的目标信令
Figure GDA0002155781170000401
其中,1≤i1<i2<…<iM≤N,p≥1。假设目标信令序列组的数量为p,则该待测用户的信令序列数据可以由向量
Figure GDA0002155781170000402
表示。
可选地,如表十三所示,在待测用户的信令序列数据中可以用数值1表示该待测用户的所有信令中包括某一个预设信令组中的预设信令,即该每个第一样本用户的所有信令中包括该预设信令组中按时间顺序排列的所有预设信令,用数值0表示该预设用户的所有信令中不包括某一个预设信令组中的预设信令,即该待测用户的所有信令中不包括预设信令组中的每个预设信令,或者虽然包括该预设信令组中的每个预设信令,但是该预设信令组中的每个预设信令没有按时间顺序排列,本发明实施例对此不作限定。
具体而言,在S720中,根据该待测用户的信令序列数据和第一监督预测模型,确定该待测用户的第一网络事件发生的第一概率值,该第一监督预测模型表示该待测用户的信令序列数据与第一网络事件发生的概率值之间的映射关系。
可选地,在S720之前,可以根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练该第一监督预测模型。
可选地,该第一监督预测模型可以根据一种或者多种监督学习算法确定该待测用户的该第一网络事件发生的概率值,例如可以根据决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
可选地,可以根据该待测用户的信令序列数据和第一非监督预测模型,确定该待测用户所属的第一分簇,该第一非监督预测模型表示该待测用户的信令序列数据与用户分簇之间的映射关系。
可选地,在S720之前,可以根据多个第一样本用户中每个第一样本用户的信令序列数据,训练该第一非监督预测模型。
可选地,该第一非监督预测模型可以根据一种或多种非监督学习算法确定该待测用户发生该事件的分簇,例如可以为层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
具体而言,在S730中,从用户数据库存储的数据中确定该待测用户的用户面数据,根据该待测用户的用户面数据确定该待测用户的专家特征数据,并根据该待测用户的专家特征数据和第二监督预测模型,确定该待测用户发生事件的第二概率值,该第二监督预测模型表示该待测用户的专家特征数据与网络事件发生概率值之间的映射关系。
应理解,该用户数据库包括了该待测用户与网络通信的通信数据,该通信数据包括该待测用户与网络进行交互的所有操作记录。
还应理解,该多个第一样本用户与该多个第二样本用户可以为相同的样本用户,可以为不同的样本用户,也可以为部分相同的样本用户。专家特征是指基于对不同业务的理解,人工构造出来的具体业务需要的预设特征,本发明对此不作限定。
具体而言,该待测用户的专家特征数据可以为在该待测用户的用户面数据中确定的预设特征的值,例如,假设根据实际需要预测的事件,确定预设特征为TCP连接成功率,则该待测用户的专家特征数据可以为该待测用户的TCP连接成功率的数值,还可以根据实际需要预测的事件确定需要的专家特征,但本发明实施例不限于此。
作为一个实施例,假设专家特征的数量为q,则该用户的专家特征数据可以由向量
Figure GDA0002155781170000411
表示,其中,q≥1。
可选地,S730之前,可以根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练该第二监督预测模型。
可选地,该第二监督预测模型可以根据一种或者多种监督学习算法确定该待测用户发生该事件的概率值,例如可以根据决策树算法、逻辑回归算法、支持向量机算法和组合算法等,本发明实施例不限于此。
可选地,可以根据该待测用户的专家特征数据和第二非监督预测模型,确定该待测用户所属的第二分簇,该第二非监督预测模型表示该待测用户的专家特征数据与用户分簇之间的映射关系。
可选地,在S730之前,可以根据多个第二样本用户中每个第二样本用户的专家特征数据,训练该第二非监督预测模型。
可选地,该第二非监督预测模型可以根据一种或多种非监督学习算法确定该待测用户发生该事件的分簇,例如可以根据层次聚类算法、K均值算法和基于图的聚类算法等,本发明实施例不限于此。
可选地,在S740之前,当获得该第一概率值的时间与获得该第二概率值的时间之间的间隔超过阈值时,对该第一概率值和该第二概率值中较晚获得的概率值进行时间对齐处理;对经过该时间对齐处理的该较晚获得的概率值进行缺失值补齐处理。
具体而言,假设第一监督预测模型确定的参考用户1、参考用户2、参考用户3和待测用户的第一概率值分别为M1、M2和M4,其中,M1、M2和M4可以为该第一监督预测模型通过不同的监督学习算法确定的第一概率值;第二监督预测模型确定的参考用户1、参考用户2、参考用户3和待测用户的第二概率值为M3,如表十六所示,由于第一监督预测模型获得该待测用户的第一概率值的时间与获得该待测用户的第二概率值的时间之间的间隔超过阈值,并且获得该待测用户的第一概率值的时间早于获得该待测用户的第二概率值的时间,这种情况下,可以对该待测用户的第二概率值M3进行时间对齐处理,并根据其他用户的第一概率值和第二概率值对M3进行缺失值补齐。
应理解,由于数据异构性、数据/模型的同步性问题,或者数据隐私等问题,也会导致监督预测模型输出的第一概率值和第二概率值缺失,本发明实施例对此不作限定。
还应理解,此处参考用户1、参考用户2和参考用户3可以为与该待测用户不同的其他待测的用户,并且参考用户1、参考用户2和参考用户3没有概率值的缺失,本发明实施例对此不作限定。作为一个可选实施例,如表十六所示,该待测用户的M3值可以根据参考用户1的M1、M2和M4的值生成的向量1、参考用户2M1、M2和M4的值生成的向量2、参考用户3的M1、M2和M4的值生成的向量3以及该待测用户的M1、M2和M4的值生成的向量x,确定向量1、向量2、向量3和向量x之间的欧氏距离,根据各向量间的欧氏距离的值,确定该待测用户与参考用户1、参考用户2或者参考用户3中的某一个参考用户相近,假设参考用户1与该待测用户相近,则将该参考用户1的M3值确定为该待测用户缺失的M3值,但本发明实施例对此不作限定。
可选地,非监督预测模型的输出同样可能产生用户分簇的缺失,该对齐/缺失值处理模块同样可以对非监督预测模型输出的每个参考用户的参考类型进行编码之后,缺失的分簇进行推断,本发明实施例对此不作限定。
具体而言,在S740中,对于多个用户,可以根据该第一监督预测模型和该第二监督预测模型基于多种监督学习算法,确定该多个用户中每个用户的至少一个第一概率值和至少一个第二概率值,以及该第一非监督预测模型和该第二非监督预测模型基于多种聚类算法,确定的该多个用户中每个用户的至少一个第一分簇和至少一个第二分簇,确定函数f,对该函数f进行编码之后作为该组合预测模型的输入,通过优化该组合预测模型函数,使得该组合预测模型函数的最小,确定该多个用户中每个用户发生该事件的预测结果,其中,若某种监督预测模型或者非监督预测模型不存在时,则在该函数f中不计入该模型的相应输出,本发明实施例不限于此。
可选地,该组合预测模型可以仅根据该第一概率值、该第二概率值和组合预测模型,确定该待测用户发生该事件的预测结果;还可以根据该第一概率值、该第二概率值、该第一分簇和组合预测模型,确定该待测用户发生该事件的预测结果;还可以根据该第一概率值、该第二概率值、该第二分簇和组合预测模型,确定该待测用户发生该事件的预测结果;还可以根据该第一概率值、该第二概率值、该第一分簇、该第二分簇和组合预测模型,确定该待测用户发生该事件的预测结果,本发明实施例对此不作限定。
可选地,该组合预测模型可以仅根据该第一概率值和该第二概率值的加权、平均或者其他计算规则,确定该待测用户的该第一网络事件的预测发生概率。
可选地,该组合预测模型还可以根据该第一概率值、该第二概率值以及该待测用户所属的第一分簇,确定该待测用户的该第一网络事件的预测发生概率。
可选地,该组合预测模型还可以根据该第一概率值、该第二概率值以及该待测用户所属的第二分簇,确定该待测用户的该第一网络事件的预测发生概率。
可选地,该组合预测模型还可以根据该第一概率值、该第二概率值以及该待测用户所属的第一分簇和第二分簇,确定该待测用户的该第一网络事件的预测发生概率,本发明实施例对此不作限定。
应理解,该组合预测模型可以确定第一网络事件发生的概率值,并且可以根据该概率值确定该第一网络事件是否发生,或者可以确定该第一网络事件发生的预测结果属于该第一网络事件的多个可能发生的结果中的一种,但本发明实施例不限于此。
可选地,当存在多个待测用户时,在通过网络事件预测模型确定了多个待测用户中每个待测用户的该第一网络事件的预测发生概率,并根据该每个待测用户的该第一网络事件的预测发生概率确定该第一网络事件是否发生的之后,可以获取该每个待测用户发生所述事件的实际结果,并根据该每个用户发生该事件的预测发生结果与该每个用户发生该事件的实际结果,确定预测准确率,当该预测准确率低于阈值时,更新该第一监督预测模型和该第二监督预测模型中的至少一项。
本发明实施例的网络事件预测的方法,通过根据用户的信令面数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率,并且减少了网络运行维护的成本。
上面结合了图6和图7对本发明实施例的建立网络事件预测模型的方法和网络事件预测的方法进行了描述,下面将结合图8至图11描述本发明实施例的建立网络事件预测模型的装置和网络事件预测的装置,应注意,这些例子仅仅是为了帮助本领域技术人员理解和实现本发明的实施例,而非限制本发明实施例的范围。本领域技术人员可以根据这里给出的例子进行等价变换或修改,这样的变换或修改仍应落入本发明实施例的范围内。
图8是本发明实施例的建立事件预测模型的装置的示意性框图。如图8所示,该装置800包括:第一确定模块801、第一训练模块802、第二训练模块803和第二确定模块804。
第一确定模块801,用于根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,该每个第一样本用户的第一标签信息用于表示该每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数。
第一训练模块802,用于根据该第一确定模块801确定的该每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,该第一监督预测模型表示该每个第一样本用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系。
第二训练模块803,用于根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,该每个第二样本用户的专家特征数据表示该每个第二样本用户的至少一个预设特征的值,该第二监督预测模型表示该每个第二样本用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示该每个第二样本用户的该第一网络事件实际是否发生。
第二确定模块804,用于根据该第一训练模块802训练的该第一监督预测模型和该第二训练模块803训练的该第二监督预测模型,确定该第一网络事件预测模型,该第一网络事件预测模型用于确定该第一网络事件的预测发生概率。
本发明实施例的建立网络事件预测模型的方法,通过根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;根据多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定第一网络事件发生的预测结果,该预测结果具有较高的准确率。
可选地,作为一个实施例,该第一确定模块801具体用于:根据该多个第一样本用户中每个第一样本用户的信令面数据,确定与该每个第一样本用户的N个信令数据一一对应的N个信令;根据每个第一样本用户的N个信令和该每个第一样本用户的第一标签信息,确定M个目标信令组,该M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且该按时间顺序排列的m个目标信令与该第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数;根据该M个目标信令组和该每个第一样本用户的N个信令,确定该每个第一样本用户的信令序列数据,该每个第一样本用户的信令序列数据表示该每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,该M个目标信令组中的第i个目标信令组包括该按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
可选地,作为另一个实施例,该第一训练模块802还用于根据该多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,该第一非监督预测模型表示该每个第一样本用户的信令序列数据与用户分簇之间的映射关系;该第二确定模块804具体用于根据该第一监督预测模型、该第二监督预测模型和该第一非监督预测模型,确定该第一网络事件预测模型。
可选地,作为另一个实施例,该第二训练模块803还用于根据该多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,该第二非监督预测模型表示该每个第二样本用户的专家特征数据与用户分簇之间的映射关系;该第二确定模块804具体用于根据该第一监督预测模型、该第二监督预测模型和该第二非监督预测模型,确定该第一网络事件预测模型。
本发明实施例的建立网络事件预测模型的方法,通过根据多个第一样本用户中每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型;根据多个第二样本用户中每个第二样本用户的用户面数据和第二标签信息,训练第二监督预测模型;并根据该第一监督预测模型和该第二监督预测模型,确定第一网络事件预测模型,该第一网络事件预测模型能够确定第一网络事件发生的预测结果,该预测结果具有较高的准确率,并且使用该第一网络事件预测模型能够减少网络运行维护的成本。
应注意,本发明实施例中,第一确定模块801、第一训练模块802、第二训练模块803和第二确定模块804可以由处理器实现。如图9所示,该建立网络事件预测模型的装置900可以包括处理器901、存储器902,其中,存储器902可以用于存储处理器901执行的代码等。
该装置900中的各个组件通过总线系统903耦合在一起,其中总线系统903除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
应理解,图8和图9中描述的本发明实施例的建立网络事件预测模型的装置能够实现图6中的方法的各个步骤,为避免重复,此处不再详述。
图10是本发明实施例的网络事件预测的装置的示意性框图。如图10所示,该装置1000包括:第一确定模块1001、第二确定模块1002和第三确定模块1003。
第一确定模块1001,用于根据用户的信令面数据,确定该用户的信令序列数据,该用户的信令面数据包括N个信令数据和该N个信令数据中每个信令数据的时间戳,该N个信令数据中每个信令数据包括信令类型,其中,N为大于或等于1的正整数。
该第一确定模块1001还用于根据该用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值,该第一监督预测模型表示该用户的信令序列数据与该第一网络事件发生的概率值之间的映射关系。
第二确定模块1002,用于根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值,该用户的专家特征数据表示该用户的至少一个预设特征的值,该第二监督预测模型表示该用户的专家特征数据与该第一网络事件发生的概率值之间的映射关系。
第三确定模块1003,用于根据该第一确定模块确定的该第一概率值和该第二确定模块确定的该第二概率值,确定该第一网络事件的预测发生概率。
本发明实施例的网络事件预测的方法,通过根据用户的信令面数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率。
可选地,作为一个实施例,该第一确定模块1001具体用于:根据该用户的N个信令数据,确定与该N个信令数据一一对应的N个信令;根据M个预设信令组和该N个信令,确定该用户的信令序列数据,该用户的信令序列数据表示该N个信令中是否包括按时间顺序排列的mi个预设信令,其中,该M个预设信令组中的第i个预设信令组包括该按时间顺序排列的mi个预设信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
可选地,作为另一个实施例,该第一确定模块1001还用于根据该用户的信令序列数据和第一非监督预测模型,确定该用户所属的第一分簇,该第一非监督预测模型表示该用户的信令序列数据与用户分簇之间的映射关系,其中,该第一分簇属于该用户分簇;该第三确定模块1003具体用于根据该第一概率值、该第二概率值和该第一分簇,确定该第一网络事件的预测发生概率。
可选地,作为另一个实施例,该第二确定模块1002还用于根据该用户的专家特征数据和第二非监督预测模型,确定该用户所属的第二分簇,该第二非监督预测模型表示该用户的专家特征数据与用户分簇之间的映射关系,其中,该第二分簇属于该用户分簇;该第三确定模块1003具体用于根据该第一概率值、该第二概率值和该第二分簇,确定该第一网络事件的预测发生概率。
可选地,作为另一个实施例,该事件预测的装置还包括获取模块和更新模块,该第三确定模块1003还用于根据该第一网络事件的预测发生概率,确定该第一网络事件的预测结果,该第一网络事件的预测结果表示该第一网络事件是否发生;该获取模块用于获取该用户发生该事件的实际结果该获取模块用于获取该第一网络事件的实际发生结果,该第一网络事件的实际发生结果表示该第一网络事件实际是否发生;该第三确定模块1003还用于根据该第一网络事件的预测结果与该第一网络事件的实际发生结果,确定该第一网络事件的预测准确率;该更新模块用于当该第一网络事件的预测准确率低于阈值时,更新该第一监督预测模型和该第二监督预测模型中的至少一项。
本发明实施例的网络事件预测的方法,通过根据用户的信令面数据和第一监督预测模型,确定第一网络事件发生的第一概率值;根据该用户的专家特征数据和第二监督预测模型,确定该第一网络事件发生的第二概率值;并根据该第一概率值和该第二概率值,确定该用户发生该事件的预测结果,通过不同类型的数据对网络事件进行预测,提高了网络事件预测的准确率,并且减少了网络运行维护的成本。
应注意,本发明实施例中,第一确定模块1001、第二确定模块1002和第三确定模块1003可以由处理器实现。如图11所示,该网络事件预测的装置1100可以包括处理器1101、存储器1102,其中,存储器1102可以用于存储处理器1101执行的代码等。
该装置1100中的各个组件通过总线系统1103耦合在一起,其中总线系统1103除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
应理解,图10和图11中描述的本发明实施例的网络事件预测的装置能够实现图7中的方法的各个步骤,为避免重复,此处不再详述。
应注意,本发明上述方法实施例可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本发明实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种网络事件预测的方法,其特征在于,包括:
根据用户的信令面数据,确定所述用户的信令序列数据,所述用户的信令面数据包括N个信令数据和所述N个信令数据中每个信令数据的时间戳,所述N个信令数据中每个信令数据包括信令类型,其中,N为大于或等于1的正整数;
根据所述用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值,所述第一监督预测模型表示所述用户的信令序列数据与所述第一网络事件发生的概率值之间的映射关系;
根据所述用户的专家特征数据和第二监督预测模型,确定所述第一网络事件发生的第二概率值,所述用户的专家特征数据表示所述用户的至少一个预设特征的值,所述第二监督预测模型表示所述用户的专家特征数据与所述第一网络事件发生的概率值之间的映射关系;
根据所述第一概率值和所述第二概率值,确定所述第一网络事件的预测发生概率;
其中,所述根据用户的信令面数据,确定所述用户的信令序列数据,包括:
根据所述用户的N个信令数据,确定与所述N个信令数据一一对应的N个信令;
根据M个预设信令组和所述N个信令,确定所述用户的信令序列数据,所述用户的信令序列数据表示所述N个信令中是否包括按时间顺序排列的mi个预设信令,其中,所述M个预设信令组中的第i个预设信令组包括所述按时间顺序排列的mi个预设信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述第一概率值和所述第二概率值,确定所述第一网络事件的预测发生概率之前,所述方法还包括:
根据所述用户的信令序列数据和第一非监督预测模型,确定所述用户所属的第一分簇,所述第一非监督预测模型表示所述用户的信令序列数据与用户分簇之间的映射关系,其中,所述第一分簇属于所述用户分簇;
所述根据所述第一概率值和所述第二概率值,确定所述第一网络事件的预测发生概率,包括:
根据所述第一概率值、所述第二概率值和所述第一分簇,确定所述第一网络事件的预测发生概率。
3.根据权利要求1或2所述的方法,其特征在于,在所述根据所述第一概率值和所述第二概率值,确定所述第一网络事件的预测发生概率之前,所述方法还包括:
根据所述用户的专家特征数据和第二非监督预测模型,确定所述用户所属的第二分簇,所述第二非监督预测模型表示所述用户的专家特征数据与用户分簇之间的映射关系,其中,所述第二分簇属于所述用户分簇;
所述根据所述第一概率值和所述第二概率值,确定所述第一网络事件的预测发生概率,包括:
根据所述第一概率值、所述第二概率值和所述第二分簇,确定所述第一网络事件的预测发生概率。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述第一网络事件的预测发生概率,确定所述第一网络事件的预测结果,所述第一网络事件的预测结果表示所述第一网络事件是否发生;
获取所述第一网络事件的实际发生结果,所述第一网络事件的实际发生结果表示所述第一网络事件实际是否发生;
根据所述第一网络事件的预测结果与所述第一网络事件的实际发生结果,确定所述第一网络事件的预测准确率;
当所述第一网络事件的预测准确率低于阈值时,更新所述第一监督预测模型和所述第二监督预测模型中的至少一项。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述第一网络事件的预测发生概率,确定所述第一网络事件的预测结果,所述第一网络事件的预测结果表示所述第一网络事件是否发生;
获取所述第一网络事件的实际发生结果,所述第一网络事件的实际发生结果表示所述第一网络事件实际是否发生;
根据所述第一网络事件的预测结果与所述第一网络事件的实际发生结果,确定所述第一网络事件的预测准确率;
当所述第一网络事件的预测准确率低于阈值时,更新所述第一监督预测模型和所述第二监督预测模型中的至少一项。
6.一种建立网络事件预测模型的方法,其特征在于,包括:
根据多个第一样本用户中每个第一样本用户的信令面数据和所述每个第一样本用户的第一标签信息,确定所述每个第一样本用户的信令序列数据,所述每个第一样本用户的信令面数据包括N个信令数据和所述N个信令数据中每个信令数据的时间戳,所述N个信令数据中每个信令数据包括信令类型,所述每个第一样本用户的第一标签信息用于表示所述每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数;
根据所述每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,所述第一监督预测模型表示所述每个第一样本用户的信令序列数据与所述第一网络事件发生的概率值之间的映射关系;
根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,所述每个第二样本用户的专家特征数据表示所述每个第二样本用户的至少一个预设特征的值,所述第二监督预测模型表示所述每个第二样本用户的专家特征数据与所述第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示所述每个第二样本用户的所述第一网络事件实际是否发生;
根据所述第一监督预测模型和所述第二监督预测模型,确定第一网络事件预测模型,所述第一网络事件预测模型用于确定所述第一网络事件的预测发生概率;
其中,所述根据多个第一样本用户中每个第一样本用户的信令面数据和第一标签信息,确定所述每个第一样本用户的信令序列数据,包括:
根据所述多个第一样本用户中每个第一样本用户的信令面数据,确定与所述每个第一样本用户的N个信令数据一一对应的N个信令;
根据每个第一样本用户的N个信令和所述每个第一样本用户的第一标签信息,确定M个目标信令组,所述M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且所述按时间顺序排列的m个目标信令与所述第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数;
根据所述M个目标信令组和所述每个第一样本用户的N个信令,确定所述每个第一样本用户的信令序列数据,所述每个第一样本用户的信令序列数据表示所述每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,所述M个目标信令组中的第i个目标信令组包括所述按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
7.根据权利要求6所述的方法,其特征在于,在所述根据所述第一监督预测模型和所述第二监督预测模型,确定第一网络事件预测模型之前,所述方法还包括:
根据所述多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,所述第一非监督预测模型表示所述每个第一样本用户的信令序列数据与用户分簇之间的映射关系;
所述根据所述第一监督预测模型和所述第二监督预测模型,确定第一网络事件预测模型,包括:
根据所述第一监督预测模型、所述第二监督预测模型和所述第一非监督预测模型,确定所述第一网络事件预测模型。
8.根据权利要求6或7所述的方法,其特征在于,在所述根据所述第一监督预测模型和所述第二监督预测模型,确定第一网络事件预测模型之前,所述方法还包括:
根据所述多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,所述第二非监督预测模型表示所述每个第二样本用户的专家特征数据与用户分簇之间的映射关系;
所述根据所述第一监督预测模型和所述第二监督预测模型,确定第一网络事件预测模型,包括:
根据所述第一监督预测模型、所述第二监督预测模型和所述第二非监督预测模型,确定所述第一网络事件预测模型。
9.一种网络事件预测的装置,其特征在于,包括:
第一确定模块,用于根据用户的信令面数据,确定所述用户的信令序列数据,所述用户的信令面数据包括N个信令数据和所述N个信令数据中每个信令数据的时间戳,所述N个信令数据中每个信令数据包括信令类型,其中,N为大于或等于1的正整数;
所述第一确定模块还用于根据所述用户的信令序列数据和第一监督预测模型,确定第一网络事件发生的第一概率值,所述第一监督预测模型表示所述用户的信令序列数据与所述第一网络事件发生的概率值之间的映射关系;
第二确定模块,用于根据所述用户的专家特征数据和第二监督预测模型,确定所述第一网络事件发生的第二概率值,所述用户的专家特征数据表示所述用户的至少一个预设特征的值,所述第二监督预测模型表示所述用户的专家特征数据与所述第一网络事件发生的概率值之间的映射关系;
第三确定模块,用于根据所述第一确定模块确定的所述第一概率值和所述第二确定模块确定的所述第二概率值,确定所述第一网络事件的预测发生概率;
其中,所述第一确定模块具体用于:
根据所述用户的N个信令数据,确定与所述N个信令数据一一对应的N个信令;
根据M个预设信令组和所述N个信令,确定所述用户的信令序列数据,所述用户的信令序列数据表示所述N个信令中是否包括按时间顺序排列的mi个预设信令,其中,所述M个预设信令组中的第i个预设信令组包括所述按时间顺序排列的mi个预设信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
10.根据权利要求9所述的装置,其特征在于,所述第一确定模块还用于根据所述用户的信令序列数据和第一非监督预测模型,确定所述用户所属的第一分簇,所述第一非监督预测模型表示所述用户的信令序列数据与用户分簇之间的映射关系,其中,所述第一分簇属于所述用户分簇;
所述第三确定模块具体用于根据所述第一概率值、所述第二概率值和所述第一分簇,确定所述第一网络事件的预测发生概率。
11.根据权利要求9或10所述的装置,其特征在于,所述第二确定模块还用于根据所述用户的专家特征数据和第二非监督预测模型,确定所述用户所属的第二分簇,所述第二非监督预测模型表示所述用户的专家特征数据与用户分簇之间的映射关系,其中,所述第二分簇属于所述用户分簇;
所述第三确定模块具体用于根据所述第一概率值、所述第二概率值和所述第二分簇,确定所述第一网络事件的预测发生概率。
12.根据权利要求9或10所述的装置,其特征在于,所述装置还包括获取模块和更新模块,
所述第三确定模块还用于根据所述第一网络事件的预测发生概率,确定所述第一网络事件的预测结果,所述第一网络事件的预测结果表示所述第一网络事件是否发生;
所述获取模块用于获取所述第一网络事件的实际发生结果,所述第一网络事件的实际发生结果表示所述第一网络事件实际是否发生;
所述第三确定模块还用于根据所述第一网络事件的预测结果与所述第一网络事件的实际发生结果,确定所述第一网络事件的预测准确率;
所述更新模块用于当所述第一网络事件的预测准确率低于阈值时,更新所述第一监督预测模型和所述第二监督预测模型中的至少一项。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括获取模块和更新模块,
所述第三确定模块还用于根据所述第一网络事件的预测发生概率,确定所述第一网络事件的预测结果,所述第一网络事件的预测结果表示所述第一网络事件是否发生;
所述获取模块用于获取所述第一网络事件的实际发生结果,所述第一网络事件的实际发生结果表示所述第一网络事件实际是否发生;
所述第三确定模块还用于根据所述第一网络事件的预测结果与所述第一网络事件的实际发生结果,确定所述第一网络事件的预测准确率;
所述更新模块用于当所述第一网络事件的预测准确率低于阈值时,更新所述第一监督预测模型和所述第二监督预测模型中的至少一项。
14.一种建立网络事件预测模型的装置,其特征在于,包括:
第一确定模块,用于根据多个第一样本用户中每个第一样本用户的信令面数据和所述每个第一样本用户的第一标签信息,确定所述每个第一样本用户的信令序列数据,所述每个第一样本用户的信令面数据包括N个信令数据和所述N个信令数据中每个信令数据的时间戳,所述N个信令数据中每个信令数据包括信令类型,所述每个第一样本用户的第一标签信息用于表示所述每个第一样本用户的第一网络事件实际是否发生,其中,N为大于或等于1的正整数;
第一训练模块,用于根据所述每个第一样本用户的信令序列数据和第一标签信息,训练第一监督预测模型,所述第一监督预测模型表示所述每个第一样本用户的信令序列数据与所述第一网络事件发生的概率值之间的映射关系;
第二训练模块,用于根据多个第二样本用户中每个第二样本用户的专家特征数据和第二标签信息,训练第二监督预测模型,所述每个第二样本用户的专家特征数据表示所述每个第二样本用户的至少一个预设特征的值,所述第二监督预测模型表示所述每个第二样本用户的专家特征数据与所述第一网络事件发生的概率值之间的映射关系,每个第二样本用户的第二标签信息用于表示所述每个第二样本用户的所述第一网络事件实际是否发生;
第二确定模块,用于根据所述第一训练模块训练的所述第一监督预测模型和所述第二训练模块训练的所述第二监督预测模型,确定第一网络事件预测模型,所述第一网络事件预测模型用于确定所述第一网络事件的预测发生概率;
其中,所述第一确定模块具体用于:
根据所述多个第一样本用户中每个第一样本用户的信令面数据,确定与所述每个第一样本用户的N个信令数据一一对应的N个信令;
根据每个第一样本用户的N个信令和所述每个第一样本用户的第一标签信息,确定M个目标信令组,所述M个目标信令组中的每个目标信令组包括按时间顺序排列的m个目标信令,并且所述按时间顺序排列的m个目标信令与所述第一标签信息之间存在映射关系,其中,M和m均为大于或等于1的正整数;
根据所述M个目标信令组和所述每个第一样本用户的N个信令,确定所述每个第一样本用户的信令序列数据,所述每个第一样本用户的信令序列数据表示所述每个第一样本用户的N个信令中是否包括按时间顺序排列的mi个目标信令,其中,所述M个目标信令组中的第i个目标信令组包括所述按时间顺序排列的mi个目标信令,i为小于或等于M,且大于或等于1的正整数,mi为大于或等于1的正整数。
15.根据权利要求14所述的装置,其特征在于,所述第一训练模块还用于根据所述多个第一样本用户中每个第一样本用户的信令序列数据,训练第一非监督预测模型,所述第一非监督预测模型表示所述每个第一样本用户的信令序列数据与用户分簇之间的映射关系;
所述第二确定模块具体用于根据所述第一监督预测模型、所述第二监督预测模型和所述第一非监督预测模型,确定所述第一网络事件预测模型。
16.根据权利要求14或15所述的装置,其特征在于,所述第二训练模块还用于根据所述多个第二样本用户中每个第二样本用户的专家特征数据,训练第二非监督预测模型,所述第二非监督预测模型表示所述每个第二样本用户的专家特征数据与用户分簇之间的映射关系;
所述第二确定模块具体用于根据所述第一监督预测模型、所述第二监督预测模型和所述第二非监督预测模型,确定所述第一网络事件预测模型。
CN201510745659.4A 2015-11-05 2015-11-05 网络事件预测以及建立网络事件预测模型的方法和装置 Active CN106685674B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201510745659.4A CN106685674B (zh) 2015-11-05 2015-11-05 网络事件预测以及建立网络事件预测模型的方法和装置
EP19192084.2A EP3654585B1 (en) 2015-11-05 2016-10-12 Network event prediction method and apparatus and method and apparatus for establishing network-event prediction model
PCT/CN2016/101852 WO2017076154A1 (zh) 2015-11-05 2016-10-12 网络事件预测以及建立网络事件预测模型的方法和装置
EP16861422.0A EP3361674B1 (en) 2015-11-05 2016-10-12 Method and apparatus for predicting network event and establishing network event prediction model
US15/972,512 US11196638B2 (en) 2015-11-05 2018-05-07 Network event prediction method and apparatus and method and apparatus for establishing network-event prediction model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510745659.4A CN106685674B (zh) 2015-11-05 2015-11-05 网络事件预测以及建立网络事件预测模型的方法和装置

Publications (2)

Publication Number Publication Date
CN106685674A CN106685674A (zh) 2017-05-17
CN106685674B true CN106685674B (zh) 2020-01-10

Family

ID=58661558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510745659.4A Active CN106685674B (zh) 2015-11-05 2015-11-05 网络事件预测以及建立网络事件预测模型的方法和装置

Country Status (4)

Country Link
US (1) US11196638B2 (zh)
EP (2) EP3361674B1 (zh)
CN (1) CN106685674B (zh)
WO (1) WO2017076154A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316083B (zh) * 2017-07-04 2021-05-25 北京百度网讯科技有限公司 用于更新深度学习模型的方法和装置
US11423325B2 (en) * 2017-10-25 2022-08-23 International Business Machines Corporation Regression for metric dataset
CN109961248B (zh) * 2017-12-25 2023-07-04 顺丰科技有限公司 运单投诉预测方法、装置、设备及其存储介质
CN110889526B (zh) * 2018-09-07 2022-06-28 中国移动通信集团有限公司 一种用户升级投诉行为预测方法及系统
CN111245631B (zh) * 2018-11-28 2022-08-23 中国移动通信集团浙江有限公司 网元操作结果审查方法及系统
AU2019275633B2 (en) * 2018-12-06 2022-08-04 Infosys Limited System and method of automated fault correction in a network environment
US11580475B2 (en) * 2018-12-20 2023-02-14 Accenture Global Solutions Limited Utilizing artificial intelligence to predict risk and compliance actionable insights, predict remediation incidents, and accelerate a remediation process
US11403555B2 (en) 2019-03-08 2022-08-02 Accenture Global Solutions Limited Sequence, frequency, and time interval based journey recommendation
CN110288273B (zh) * 2019-04-19 2024-03-22 平安科技(深圳)有限公司 一种信息提示方法、装置、电子设备及存储介质
US11740603B2 (en) * 2019-05-29 2023-08-29 Siemens Aktiengesellschaft Power load prediction method and apparatus, and storage medium
CN112101692B (zh) * 2019-06-18 2023-11-24 中国移动通信集团浙江有限公司 移动互联网质差用户的识别方法及装置
CN112838943B (zh) * 2019-11-25 2022-06-10 华为技术有限公司 信令分析方法和相关装置
EP3902314B1 (en) * 2020-04-21 2022-10-12 Rohde & Schwarz GmbH & Co. KG Method of training a test system for mobile network testing, test system as well as method of mobile testing
CN112699099A (zh) * 2020-12-30 2021-04-23 广州杰赛科技股份有限公司 用户投诉数据库扩充方法、装置及存储介质
CN112381338B (zh) * 2021-01-14 2021-07-27 北京新唐思创教育科技有限公司 事件概率预测模型训练、事件概率预测方法及相关装置
CN113645439B (zh) * 2021-06-22 2022-07-29 宿迁硅基智能科技有限公司 事件检测方法及系统、存储介质及电子装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1770699A (zh) * 2004-11-01 2006-05-10 中兴通讯股份有限公司 一种网络安全预警方法
US8595176B2 (en) * 2009-12-16 2013-11-26 The Boeing Company System and method for network security event modeling and prediction
CN103985055A (zh) * 2014-05-30 2014-08-13 西安交通大学 一种基于网络分析和多模型融合的股市投资决策方法
CN104113869A (zh) * 2014-06-20 2014-10-22 北京拓明科技有限公司 一种基于信令数据的潜在投诉用户预测方法及系统
WO2015077917A1 (en) * 2013-11-26 2015-06-04 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for anomaly detection in a network
CN104836781A (zh) * 2014-02-20 2015-08-12 腾讯科技(北京)有限公司 区分访问用户身份的方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970560B1 (en) * 1999-11-11 2005-11-29 Tokyo Electron Limited Method and apparatus for impairment diagnosis in communication systems
US20020152185A1 (en) * 2001-01-03 2002-10-17 Sasken Communication Technologies Limited Method of network modeling and predictive event-correlation in a communication system by the use of contextual fuzzy cognitive maps
US7346471B2 (en) * 2005-09-02 2008-03-18 Microsoft Corporation Web data outlier detection and mitigation
US7916657B2 (en) * 2008-01-22 2011-03-29 At&T Intellectual Property Ii, L.P. Network performance and reliability evaluation taking into account abstract components
US20100015926A1 (en) * 2008-07-18 2010-01-21 Luff Robert A System and methods to monitor and analyze events on wireless devices to predict wireless network resource usage
CN101442762B (zh) * 2008-12-29 2010-09-22 中国移动通信集团北京有限公司 网络性能分析以及网络故障定位方法和装置
CN101651568B (zh) * 2009-07-01 2011-12-07 青岛农业大学 一种网络流量预测和异常检测方法
EP2469757A1 (en) * 2010-12-24 2012-06-27 British Telecommunications Public Limited Company Communications network management
CN103731854B (zh) * 2012-10-10 2017-10-17 华为技术有限公司 基于自组网son的网络状态划分方法、装置和网络系统
CN104052612B (zh) 2013-03-13 2017-08-25 中国移动通信集团广东有限公司 一种电信业务的故障识别与定位的方法及系统
US9727882B1 (en) * 2013-06-21 2017-08-08 Amazon Technologies, Inc. Predicting and classifying network activity events
US9973392B2 (en) * 2013-10-18 2018-05-15 Microsoft Technology Licensing, Llc Hierarchical network analysis service
US9774522B2 (en) * 2014-01-06 2017-09-26 Cisco Technology, Inc. Triggering reroutes using early learning machine-based prediction of failures
CN104811331B (zh) * 2014-01-29 2018-07-03 华为技术有限公司 一种可视化网络运维方法和装置
US9628340B2 (en) * 2014-05-05 2017-04-18 Ciena Corporation Proactive operations, administration, and maintenance systems and methods in networks using data analytics
JP6419967B2 (ja) * 2014-07-30 2018-11-07 フォワード・ネットワークス・インコーポレテッド ネットワーク管理のためのシステムおよび方法
US9444714B2 (en) * 2014-08-07 2016-09-13 Microsoft Technology Licensing, Llc Estimating bandwidth in a network
US10163420B2 (en) * 2014-10-10 2018-12-25 DimensionalMechanics, Inc. System, apparatus and methods for adaptive data transport and optimization of application execution
US9870534B1 (en) * 2014-11-06 2018-01-16 Nominum, Inc. Predicting network activities associated with a given site
GB2543017A (en) * 2014-11-28 2017-04-12 Aria Networks Ltd Telecommunications network planning
US10050868B2 (en) * 2015-01-16 2018-08-14 Sri International Multimodal help agent for network administrator
AU2016203497B2 (en) * 2015-06-22 2017-05-11 Accenture Global Services Limited Wi-fi access point performance management
US9806955B2 (en) * 2015-08-20 2017-10-31 Accenture Global Services Limited Network service incident prediction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1770699A (zh) * 2004-11-01 2006-05-10 中兴通讯股份有限公司 一种网络安全预警方法
US8595176B2 (en) * 2009-12-16 2013-11-26 The Boeing Company System and method for network security event modeling and prediction
WO2015077917A1 (en) * 2013-11-26 2015-06-04 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for anomaly detection in a network
CN104836781A (zh) * 2014-02-20 2015-08-12 腾讯科技(北京)有限公司 区分访问用户身份的方法及装置
CN103985055A (zh) * 2014-05-30 2014-08-13 西安交通大学 一种基于网络分析和多模型融合的股市投资决策方法
CN104113869A (zh) * 2014-06-20 2014-10-22 北京拓明科技有限公司 一种基于信令数据的潜在投诉用户预测方法及系统

Also Published As

Publication number Publication date
EP3361674A1 (en) 2018-08-15
EP3654585A1 (en) 2020-05-20
EP3361674B1 (en) 2019-10-09
CN106685674A (zh) 2017-05-17
US11196638B2 (en) 2021-12-07
EP3654585B1 (en) 2022-09-28
WO2017076154A1 (zh) 2017-05-11
US20180255470A1 (en) 2018-09-06
EP3361674A4 (en) 2018-08-15

Similar Documents

Publication Publication Date Title
CN106685674B (zh) 网络事件预测以及建立网络事件预测模型的方法和装置
CN109495318B (zh) 一种移动通信网络流量预测方法、装置及可读存储介质
CN114285728B (zh) 一种预测模型训练方法、流量预测方法、装置及存储介质
CN111738520A (zh) 一种融合孤立森林与长短期记忆网络的系统负载预测方法
CN111861023A (zh) 基于统计学的混合风电功率预测方法、装置
JP7422272B2 (ja) 産業オートメーション制御システムまたは電力システムからのデータの保存を促進するための方法および装置
CN112785067A (zh) 数据预测方法及装置、设备、存储介质
CN109583086A (zh) 配电变压器重过载预测方法及终端设备
CN113205223A (zh) 一种电量预测系统及其预测方法
CN114037140A (zh) 预测模型训练、数据预测方法、装置、设备及存储介质
US20180196900A1 (en) System and Method for Forecasting Values of a Time Series
CN111800807A (zh) 一种基站用户数量告警的方法及装置
CN116756522B (zh) 概率预报方法、装置、存储介质及电子设备
KR102391607B1 (ko) 폭염 중기예보 시스템 및 그 방법
CN116306030A (zh) 考虑预测误差和波动分布的新能源预测动态场景生成方法
CN110764975B (zh) 设备性能的预警方法、装置及监控设备
CN111489003A (zh) 生命周期的预测方法及装置
CN115409115A (zh) 基于用户日志的时序聚类异常终端识别方法
CN114980304A (zh) 基于测量报告的定位方法、设备、装置及存储介质
Kalinov et al. Control System for Assessing Reliability Functioning of the Complex Radio Electronic Equipment Using Machine Learning Methods
CN111095868A (zh) 软件定义网络中的数据流量管理
de los Ángeles Carrión-Herrera et al. Peak Hour Performance Prediction based on Machine Learning for LTE Mobile Cellular Network
CN117691565A (zh) 风电场站的发电量预测方法、装置、设备及介质
CN116109013A (zh) 电力设备的设备产量分析方法及装置
CN116347466A (zh) 基站退服告警预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant