CN113205231A - 一种离网预测方法及装置 - Google Patents
一种离网预测方法及装置 Download PDFInfo
- Publication number
- CN113205231A CN113205231A CN202110602440.4A CN202110602440A CN113205231A CN 113205231 A CN113205231 A CN 113205231A CN 202110602440 A CN202110602440 A CN 202110602440A CN 113205231 A CN113205231 A CN 113205231A
- Authority
- CN
- China
- Prior art keywords
- time period
- terminal
- grid
- data
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012549 training Methods 0.000 claims description 37
- 230000006399 behavior Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种离网预测方法及装置,涉及计算机技术领域,解决了对现有的离网预测方法准确度较低的问题。该离网预测方法包括:获取终端在当前时间段内的样本数据;样本数据用于表示终端对应的用户在当前时间段内的行为画像信息;将样本数据输入到预先训练好的离网预测模型中,以得到输出值;输出值用于确定终端在未来时间段是否离网。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种离网预测方法及装置。
背景技术
随着运营商数据网网络的快速发展,用户黏度指标对于衡量运营商运营发展的变化起到重要作用。用户黏度越高,说明用户离网的概率较低。相应的,用户黏度越低,说明用户离网的概率较高。
现有的离网预测方法通常是根据一段时间内的日活跃用户(DAU,dailyactivated users)和月活跃用户(MAU,monthly activated users)的指标,预测一段时间内的每个用户在未来时间段是否离网。
现有的离网预测方法的数据较为单一,从而导致离网预测方法的准确度较低。
发明内容
本申请实施例提供一种用户离网预测方法及装置,解决了对现有的离网预测方法准确度较低的问题。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,提供一种离网预测方法,包括:获取终端在当前时间段内的样本数据;样本数据用于表示终端对应的用户在当前时间段内的行为画像信息;将样本数据输入到预先训练好的离网预测模型中,以得到输出值;输出值用于确定终端在未来时间段是否离网。
离网预测装置在获取终端在当前时间段内的样本数据后,可以将样本数据输入到预先训练好的离网预测模型中,以得到用于确定终端在未来时间段是否离网的输出值。由于样本数据用于表示终端对应的用户在当前时间段内的行为画像信息,行为画像信息包括的数据量较多,因此,离网预测装置可以准确的确定终端在未来时间段是否离网。
其次,由于离网预测模型为提前确定好的模型,因此,离网预测装置在确定终端在未来时间段是否离网,只需将样本数据输入到提前确定好的离网预测模型中,便可以快速、准确的确定终端在未来时间段是否离网,提高了离网预测的效率。
第二方面,提供一种离网预测装置,该离网预测装置包括:获取单元和处理单元;
获取单元,用于获取终端在当前时间段内的样本数据;样本数据用于表示终端对应的用户在当前时间段内的行为画像信息;处理单元,用于将样本数据输入到预先训练好的离网预测模型中,以得到输出值;输出值用于确定终端在未来时间段是否离网。
第三方面,提供一种离网预测装置,包括存储器和处理器。存储器用于存储计算机执行指令,处理器与存储器通过总线连接。当离网预测装置运行时,处理器执行存储器存储的计算机执行指令,以使离网预测装置执行第一方面所述的离网预测方法。
该离网预测装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,接收、确定、分流上述离网预测方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得该计算机执行第一方面所述的离网预测方法。
第五方面,提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如第一方面及其任一种可能的设计方式所述的离网预测方法。
需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机存储介质上。其中,第一计算机存储介质可以与离网预测装置的处理器封装在一起的,也可以与离网预测装置的处理器单独封装,本申请实施例对此不作限定。
本发明中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面以及第五方面的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本申请实施例中,上述离网预测装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本发明类似,属于本发明权利要求及其等同技术的范围之内。
本发明的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的一种离网预测装置的硬件结构示意图;
图2为本申请实施例提供的又一种离网预测装置的硬件结构示意图;
图3为本申请实施例提供的一种离网预测模型训练流程示意图;
图4为本申请实施例提供的一种离网预测模型的内部流程示意图;
图5为本申请实施例提供的又一种离网预测模型训练流程示意图;
图6为本申请实施例提供的一种离网预测装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于清楚描述本申请实施例的技术方案,在本申请实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
如背景技术所描述,现有的离网预测方法的数据较为单一,从而导致离网预测方法的准确度较低。
针对上述问题,本申请实施例提供了一种离网预测方法,包括:获取终端在当前时间段内的样本数据;样本数据用于表示终端对应的用户在当前时间段内的行为画像信息;将样本数据输入到预先训练好的离网预测模型中,以得到输出值;输出值用于确定终端在未来时间段是否离网。
离网预测装置在获取终端在当前时间段内的样本数据后,可以将样本数据输入到预先训练好的离网预测模型中,以得到用于确定终端在未来时间段是否离网的输出值。由于样本数据用于表示终端对应的用户在当前时间段内的行为画像信息,行为画像信息包括的数据量较多,因此,离网预测装置可以准确的确定终端在未来时间段是否离网。
其次,由于离网预测模型为提前确定好的模型,因此,离网预测装置在确定终端在未来时间段是否离网,只需将样本数据输入到提前确定好的离网预测模型中,便可以快速、准确的确定终端在未来时间段是否离网,提高了离网预测的效率。
上述离网预测装置可以为用于预测用户是否变更套餐的设备,也可以为该设备中的芯片,还可以为该设备中的片上系统。
可选的,该设备可以是物理机,例如:台式电脑,又称台式机或桌面机(desktopcomputer)、手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备。
可选的,上述离网预测装置也可以通过部署在物理机上的虚拟机(virtualmachine,VM),实现上述离网预测装置所要实现的功能。
为了便于理解,下面对本申请实施例中的离网预测装置的结构进行描述。
图1示出了本申请实施例提供的离网预测装置的一种硬件结构示意图。如图1所示,该离网预测装置包括处理器11,存储器12、通信接口13、总线14。处理器11,存储器12以及通信接口13之间可以通过总线14连接。
处理器11是离网预测装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器11可以是一个通用中央处理单元(central process ing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器11可以包括一个或多个CPU,例如图1中所示的CPU 0和CPU 1。
存储器12可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electr icallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器12可以独立于处理器11存在,存储器12可以通过总线14与处理器11相连接,用于存储指令或者程序代码。处理器11调用并执行存储器12中存储的指令或程序代码时,能够实现本发明实施例提供的离网预测方法。
另一种可能的实现方式中,存储器12也可以和处理器11集成在一起。
通信接口13,用于与其他设备通过通信网络连接。所述通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口13可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
总线14,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图1示出的结构并不构成对该离网预测装置的限定。除图1所示部件之外,该离网预测装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
图2示出了本申请实施例中离网预测装置的另一种硬件结构。如图2所示,通信装置可以包括处理器21以及通信接口22。处理器21与通信接口22耦合。
处理器21的功能可以参考上述处理器11的描述。此外,处理器21还具备存储功能,可以参考上述存储器12的功能。
通信接口22用于为处理器21提供数据。该通信接口22可以是通信装置的内部接口,也可以是离网预测装置对外的接口(相当于通信接口13)。
需要指出的是,图1(或图2)中示出的结构并不构成对离网预测装置的限定,除图1(或图2)所示部件之外,该离网预测装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合附图对本申请实施例提供的离网预测方法进行详细介绍。
本申请实施例提供的离网预测方法包括:离网预测装置根据终端历史时间段内的训练数据、卷积算法和神经网络算法,训练得到离网预测模型的流程(简称为“离网预测模型训练流程”)和离网预测装置根据终端在当前时间段内的样本数据和预先训练好的离网预测模型,预测终端在未来时间段是否离网的流程(简称为“离网预测流程”)。
下面先对“离网预测模型训练流程”进行描述。
如图3所示,“离网预测模型训练流程”包括:S301-S303。
S301、离网预测装置获取历史时间段内的训练数据。
其中,训练数据包括:终端对应的用户在历史时间段内的行为画像信息和终端对应的用户在历史时间段内的离网信息。
可选的,离网预测装置获取历史时间段内的训练数据时,可以从运营商的深度报文检测(Deep Packet Inspection,DPI)设备中获取。
可选的,离网预测装置在获取终端对应的用户在历史时间段内的行为画像信息时,可以先获取终端对应的用户在历史时间段内的原始数据,然后将原始数据归一化,以得到终端在历史时间段内的行为画像信息。
相应的,离网预测装置在获取终端对应的用户在历史时间段内的离网信息时,可以先获取终端对应的用户在历史时间段内的原始离网数据,然后将原始离网数据归一化,以得到用户在历史时间段内的离网信息。
可选的,终端对应的用户在历史时间段内的原始数据包括用户上网时长、用户上网质量、用户偏好、本网特征、关联移动网流量特征、固网移动网上网时间分布等六大方面的原始数据。
其中,历史时间段可以是任意时间段。例如:2021年3月1日-2021年4月4日。即5周时长,也就是35天的时长。
可选的,连续35天数据中第一天可以为周一。
示例性的,当终端为固网终端时,原始数据的具体信息如表1所示。
表1
其中,访问量是指用户产生的业务流条数,固网移动上网时间分布是以小时为单位进行的统计,因此一组时间分布会包含24个数值,每个数值为该小时内用户产生的访问量。
在获取终端对应的用户在历史时间段内的原始数据后,将原始数据归一化,以得到用户在历史时间段内的行为画像信息。
示例性的,离网预测装置首先确定原始数据为以一个用户为统计单位的数据样本,即一个用户为一个样本。其中每个用户样本的行为画像信息为一个数值取值范围在0-1之间的35x71的数值矩阵。其中行数为35是因为原始数据为连续35天的数据,列数为71是因为共23个单一数值指标和2个各24个数值的指标。
接着,离网预测装置将原始数据分为两种类型:需归一化的原始数据和毋需归一化的原始数据。其中毋需归一化的原始数据的数值本身就在0-1范围区间内,因此不需要做归一化。
示例性的,需归一化的原始数据包括:用户固网单日流量大小、用户固网单日访问量、用户固网单日累计使用时长、用户固网单日访问应用数量、用户固网单日大流量应用数量、用户固网单日大流量应用流量统计、用户固网单日小流量应用数量、用户固网单日小流量应用流量统计、用户固网单日话单内存在本网手机号数量、用户固网单日话单内存在异网手机号数量、用户固网单日话单内终端支持双卡数量、用户固网单日话单内终端制式支持多元数量、用户关联移动网单日流量大小、用户关联移动网单日访问量、用户关联移动网单日累计使用时长、用户关联移动网单日访问应用数量、用户固网单日使用时间分布、用户关联移动网单日使用时间分布中的至少一项。。
毋需归一化的原始数据包括:用户固网日均视频质量、用户固网日均浏览质量、用户固网日均游戏质量、用户固网日均网络质量、用户关联移动网日均视频业务质量、用户关联移动网日均网页浏览业务质量、用户关联移动网日均游戏业务质量中的至少一项。
由于需归一化的原始数据分布范围均不一样,却有相同的评估重要性,因此需要对各原始数据进行去量纲操作,即归一化。本申请实施例可以采用Min-Max Normalization进行归一化操作,即,
由于固网环境复杂,存在不同用户的原始数据分化较大的情况,因此不采用将全量用户的原始数据统一归一化,而是对单个用户30天内的原始数据进行独立归一化,即上述公式中,X′ ijn为i用户在第j天的n原始数据归一化后的数值,Xijn为i用户在第j天的n指标数值,X_minijn为i用户在第j天的n指标出现的最小值,X_minijn为i用户在第j天的n指标出现的最大值。
后续,将归一化好的数值与毋需归一化的指标数值进行合并,以得到终端在历史时间段内的行为画像信息。
离网预测装置在获取终端对应的用户在历史时间段内的离网信息时,可以从运营商的客户关系管理(CRM,Customer Relationship Management)系统中获取离网数据,并将离网数据标签化,以得到离网信息。
示例性的,离网预测装置从运营商CRM系统确认各个原始数据指向的用户未来30天的离网情况。将用户离网情况转换为用户黏度值,作为标签值。转换方式如下表2所示:
表2
未来1-5天内离网 | 0 |
未来6-10天内离网 | 0.1 |
未来11-15天内离网 | 0.2 |
未来16-20天内离网 | 0.3 |
未来21-25天内离网 | 0.4 |
未来26-30天内离网 | 0.5 |
未离网 | 1 |
S302、离网预测装置根据卷积算法和神经网络算法,创建初始模型。
其中,初始模型的数据输入尺寸与训练数据的数据量对应。
在获取到历史时间段内的训练数据后,离网预测装置根据卷积算法和神经网络算法,创建初始模型。
其中,初始模型为卷积神经网络模型。卷积神经网络是一种前馈神经网络,通常包含数据输入层、卷积计算层、激活层、池化层、全连接层,是由卷积运算来代替传统矩阵乘法运算的神经网络。
S303、离网预测装置基于训练数据,对初始模型执行预设次数的训练操作,以得到离网预测模型。
示例性的,图4示出了本申请实施例提供的一种离网预测模型的内部流程示意图。
其中,初始模型包括步骤input、步骤A、步骤B、步骤C1、步骤C2、步骤C3、步骤D和步骤output。
步骤input:将数据样本按照7:3的比例分割为训练样本和测试样本。训练时,根据样本数量,样本质量,设备性能等情况设定Batch-Size等参数,将训练样本输入模型,进行运算。若Batch-Size为128,则输入数据的尺寸为(128,35,71)。
步骤A:该网络层为时序卷积层,也就是1维卷积层。该层创建了一个卷积核,该卷积核以单个空间(或时间)维上的层输入进行卷积,以生成输出张量。如果use_bias为True,则会创建一个偏置向量并将其添加到输出中。最后,如果activation不是None,它也会应用于输出。本申请实施例中设定use_bias为True,无activation不是None。卷积层的滤波器数量为40,卷积核窗口长度为7,步长也为7。已知本申请实施例中的数据样本中包含用户71种维度的特征,其中部分特征具有关联性,因此设定40种滤波器,对用户特性进行关注;而数据样本中又包含5周的数据,具有时间特性,用户用网周期往往以周为单位进行波动,比如一般来说工作日固网使用量较小,休息日固网使用率较大,将一周(7天)的用户用网特性进行中和计算将有利于模型的训练,因此卷积核窗口长度为7。经过该层计算之后,输出数据的尺寸为(128,5,40)。
步骤B:该层为Flatten层,目的是将输入展平,不影响批量大小。用以输入全连接层计算。经过该层计算之后,输出数据的尺寸为(128,200)。
步骤C1、C2、C3:该三层为均为全连接层。全连接Dense层实现以下操作:
output=activation(dot(input,kernel)+bias)
其中activation是按逐个元素计算的激活函数,本申请实施例采用的为relu激活函数,该函数的计算公式为:
kernel是由网络层创建的权值矩阵,bias是其创建的偏置向量。该三层的输出尺寸逐渐减小,各层计算之后,输出数据的尺寸分别为(128,50),(128,10),(128,1)。
步骤output:最终输出数据均为0到1之间的数值,即为输出值。
步骤D:定义了模型的损失函数和优化器。损失函数定义了拟合结果和真实结果之间的差异,作为优化的目标直接关系模型训练的好坏,优化器则定义了模型的优化算法。本申请实施例中采用了mean_squared_error作为损失函数,随机梯度下降法(sgd)作为优化器,两种技术均为通用技术,在此不作详述。
在确定初始模型的内部流程后,网预测装置基于训练数据,对初始模型执行预设次数的训练操作,以得到离网预测模型。
接下来对“离网预测流程”进行描述。
采用上述方法训练好离网预测模型之后,可以根据离网预测模型,预测目标终端在目标时刻是否更换套餐。如图5所示,包括:S501-S502。
S501、离网预测装置获取终端在当前时间段内的样本数据。
其中,样本数据用于表示终端对应的用户在当前时间段内的行为画像信息。
可选的,离网预测装置获取终端在当前时间段内的样本数据时,可以先获取终端在当前时间段内的原始数据;然后根据预设算法,对原始数据进行归一化处理,以得到样本数据。
其中,预设算法可以为Min-Max Normalization算法,即,
由于固网环境复杂,存在不同用户的原始数据分化较大的情况,因此不采用将全量用户的原始数据统一归一化,而是对单个用户30天内的原始数据进行独立归一化,即上述公式中,Xi ′ jn为i用户在第j天的n原始数据归一化后的数值,Xijn为i用户在第j天的n指标数值,X_minijn为i用户在第j天的n指标出现的最小值,X_minijn为i用户在第j天的n指标出现的最大值。
原始数据包括:终端对应的用户在当前时间段内的流量、业务流条数、上网时长、下行速率、上行速率、访问应用数、访问应用的流量、网内语音通话时长、异网通话时长、是否支持双卡、是否支持多种网络制式、网络业务时间分布中的至少一种。
离网预测装置获取终端在当前时间段内的样本数据的具体内容可以参考S301中,离网预测装置获取历史时间段内的训练数据的具体描述,在此不再赘述。
S502、离网预测装置将样本数据输入到预先训练好的离网预测模型中,以得到输出值。
其中,输出值用于确定终端在未来时间段是否离网。
示例性的,预设输出值大于0.6时,确定终端在未来时间段未离网。离网预测装置将样本数据输入到预先训练好的离网预测模型中,得到0.8的输出值。在这种情况下,离网预测装置确定终端在未来时间段未离网。
本申请实施例中,离网预测装置在获取终端在当前时间段内的样本数据后,可以将样本数据输入到预先训练好的离网预测模型中,以得到用于确定终端在未来时间段是否离网的输出值。由于样本数据用于表示终端对应的用户在当前时间段内的行为画像信息,行为画像信息包括的数据量较多,因此,离网预测装置可以准确的确定终端在未来时间段是否离网。
其次,由于离网预测模型为提前确定好的模型,因此,离网预测装置在确定终端在未来时间段是否离网,只需将样本数据输入到提前确定好的离网预测模型中,便可以快速、准确的确定终端在未来时间段是否离网,提高了离网预测的效率。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对离网预测装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图6所示,为本申请实施例提供的一种离网预测装置的结构示意图。该离网预测装置用于解决对现有的离网预测方法准确度较低的问题。离网预测装置包括:获取单元601和处理单元602;
获取单元601,用于获取终端在当前时间段内的样本数据;样本数据用于表示终端对应的用户在当前时间段内的行为画像信息。例如,结合图5,获取单元601用于执行S501。
处理单元602,用于将样本数据输入到预先训练好的离网预测模型中,以得到输出值;输出值用于确定终端在未来时间段是否离网。例如,结合图5,处理单元602用于执行S502。
可选地,获取单元601,还用于获取历史时间段内的训练数据;训练数据包括:终端对应的用户在历史时间段内的行为画像信息和终端对应的用户在历史时间段内的离网信息。例如,结合图3,获取单元601用于执行S301。
处理单元602,还用于根据卷积算法和神经网络算法,创建初始模型;初始模型的数据输入尺寸与训练数据的数据量对应。例如,结合图3,处理单元602用于执行S302。
处理单元602,还用于基于训练数据,对初始模型执行预设次数的训练操作,以得到离网预测模型。例如,结合图3,处理单元602用于执行S303。
可选地,获取单元601,具体用于:
获取终端在当前时间段内的原始数据;
根据预设算法,对原始数据进行归一化处理,以得到样本数据。
可选地,原始数据包括:终端对应的用户在当前时间段内的流量、业务流条数、上网时长、下行速率、上行速率、访问应用数、访问应用的流量、网内语音通话时长、异网通话时长、是否支持双卡、是否支持多种网络制式、网络业务时间分布中的至少一种。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令。当计算机执行指令在计算机上运行时,使得计算机执行如上述实施例提供的离网预测方法中,离网预测装置执行的各个步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品可直接加载到存储器中,并含有软件代码,该计算机程序产品经由计算机载入并执行后能够实现上述实施例提供的离网预测方法中,离网预测装置执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种离网预测方法,其特征在于,包括:
获取终端在当前时间段内的样本数据;所述样本数据用于表示所述终端对应的用户在所述当前时间段内的行为画像信息;
将所述样本数据输入到预先训练好的离网预测模型中,以得到输出值;所述输出值用于确定所述终端在未来时间段是否离网。
2.根据权利要求1所述的离网预测方法,其特征在于,还包括:
获取历史时间段内的训练数据;所述训练数据包括:所述终端对应的用户在所述历史时间段内的行为画像信息和所述终端对应的用户在所述历史时间段内的离网信息;
根据卷积算法和神经网络算法,创建初始模型;所述初始模型的数据输入尺寸与所述训练数据的数据量对应;
基于所述训练数据,对所述初始模型执行预设次数的训练操作,以得到所述离网预测模型。
3.根据权利要求1所述的离网预测方法,其特征在于,所述获取终端在当前时间段内的样本数据,包括:
获取所述终端在所述当前时间段内的原始数据;
根据预设算法,对所述原始数据进行归一化处理,以得到所述样本数据。
4.根据权利要求3所述的离网预测方法,其特征在于,所述原始数据包括:所述终端对应的用户在所述当前时间段内的流量、业务流条数、上网时长、下行速率、上行速率、访问应用数、访问应用的流量、网内语音通话时长、异网通话时长、是否支持双卡、是否支持多种网络制式、网络业务时间分布中的至少一种。
5.一种离网预测装置,其特征在于,包括:获取单元和处理单元;
所述获取单元,用于获取终端在当前时间段内的样本数据;所述样本数据用于表示所述终端对应的用户在所述当前时间段内的行为画像信息;
所述处理单元,用于将所述样本数据输入到预先训练好的离网预测模型中,以得到输出值;所述输出值用于确定所述终端在未来时间段是否离网。
6.根据权利要求5所述的离网预测装置,其特征在于,
所述获取单元,还用于获取历史时间段内的训练数据;所述训练数据包括:所述终端对应的用户在所述历史时间段内的行为画像信息和所述终端对应的用户在所述历史时间段内的离网信息;
所述处理单元,还用于根据卷积算法和神经网络算法,创建初始模型;所述初始模型的数据输入尺寸与所述训练数据的数据量对应;
所述处理单元,还用于基于所述训练数据,对所述初始模型执行预设次数的训练操作,以得到所述离网预测模型。
7.根据权利要求5所述的离网预测装置,其特征在于,所述获取单元,具体用于:
获取所述终端在所述当前时间段内的原始数据;
根据预设算法,对所述原始数据进行归一化处理,以得到所述样本数据。
8.根据权利要求7所述的离网预测装置,其特征在于,所述原始数据包括:所述终端对应的用户在所述当前时间段内的流量、业务流条数、上网时长、下行速率、上行速率、访问应用数、访问应用的流量、网内语音通话时长、异网通话时长、是否支持双卡、是否支持多种网络制式、网络业务时间分布中的至少一种。
9.一种离网预测装置,其特征在于,包括存储器和处理器;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过总线连接;
当所述离网预测装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述离网预测装置执行如权利要求1-4任一项所述的离网预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的离网预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110602440.4A CN113205231B (zh) | 2021-05-31 | 2021-05-31 | 一种离网预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110602440.4A CN113205231B (zh) | 2021-05-31 | 2021-05-31 | 一种离网预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113205231A true CN113205231A (zh) | 2021-08-03 |
CN113205231B CN113205231B (zh) | 2023-10-20 |
Family
ID=77024337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110602440.4A Active CN113205231B (zh) | 2021-05-31 | 2021-05-31 | 一种离网预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113205231B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117354737A (zh) * | 2023-12-04 | 2024-01-05 | 深圳沛喆微电子有限公司 | 一种基于低功耗的wifi信号调节方法与装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012040935A1 (en) * | 2010-09-30 | 2012-04-05 | France Telecom Research & Development Beijing Company Limited | Channel quality information prediction method, device and system |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN108600020A (zh) * | 2018-04-28 | 2018-09-28 | 中国联合网络通信集团有限公司 | 业务处理方法、装置及服务器 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112801716A (zh) * | 2021-02-20 | 2021-05-14 | 中国联合网络通信集团有限公司 | 一种套餐预测方法及装置 |
-
2021
- 2021-05-31 CN CN202110602440.4A patent/CN113205231B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012040935A1 (en) * | 2010-09-30 | 2012-04-05 | France Telecom Research & Development Beijing Company Limited | Channel quality information prediction method, device and system |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN108600020A (zh) * | 2018-04-28 | 2018-09-28 | 中国联合网络通信集团有限公司 | 业务处理方法、装置及服务器 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112801716A (zh) * | 2021-02-20 | 2021-05-14 | 中国联合网络通信集团有限公司 | 一种套餐预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
王金波: "中国移动用户数据分析推送平台的设计与实现", 《微型电脑应用》, vol. 31, no. 03, pages 18 - 21 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117354737A (zh) * | 2023-12-04 | 2024-01-05 | 深圳沛喆微电子有限公司 | 一种基于低功耗的wifi信号调节方法与装置 |
CN117354737B (zh) * | 2023-12-04 | 2024-02-09 | 深圳沛喆微电子有限公司 | 一种基于低功耗的wifi信号调节方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113205231B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220391771A1 (en) | Method, apparatus, and computer device and storage medium for distributed training of machine learning model | |
CN112291793B (zh) | 网络接入设备的资源分配方法和装置 | |
Huang et al. | DeePar: A hybrid device-edge-cloud execution framework for mobile deep learning applications | |
CN111047425A (zh) | 一种行为预测方法及装置 | |
US11334758B2 (en) | Method and apparatus of data processing using multiple types of non-linear combination processing | |
CN110247856A (zh) | 服务器资源释放方法和装置 | |
US12020272B2 (en) | Market segment analysis of product or service offerings | |
CN109144719A (zh) | 移动云计算系统中基于马尔科夫决策过程的协作卸载方法 | |
CN114816738A (zh) | 算力节点的确定方法、装置、设备及计算机可读存储介质 | |
US20220391780A1 (en) | Method of federated learning, electronic device, and storage medium | |
CN112506619A (zh) | 作业处理方法、装置、电子设备、存储介质和程序产品 | |
CN114548426A (zh) | 异步联邦学习的方法、业务服务的预测方法、装置及系统 | |
CN111740866A (zh) | 一种离网预测方法及装置 | |
CN110533459A (zh) | 一种基于梯度提升算法的终端更换概率预测方法及装置 | |
CN111769985A (zh) | 一种数据流量预测方法及装置 | |
CN113205231A (zh) | 一种离网预测方法及装置 | |
CN108632088B (zh) | 业务处理方法、装置及服务器 | |
CN109710447A (zh) | 用于数据访问的方法、装置、介质和计算设备 | |
CN110347477B (zh) | 一种云环境下服务自适应部署方法和装置 | |
CN113408817B (zh) | 流量分发方法、装置、设备及存储介质 | |
CN108710606A (zh) | 一种任务进度监控方法、计算机可读存储介质及终端设备 | |
CN114529143A (zh) | 外呼线索的推荐方法和装置、电子设备 | |
CN107320962A (zh) | 跨服匹配方法、装置及系统 | |
CN107256244A (zh) | 数据处理方法和系统 | |
CN112036418A (zh) | 用于提取用户特征的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |