CN110335058B - 一种用户满意度预测模型的样本生成方法及装置 - Google Patents
一种用户满意度预测模型的样本生成方法及装置 Download PDFInfo
- Publication number
- CN110335058B CN110335058B CN201910362355.8A CN201910362355A CN110335058B CN 110335058 B CN110335058 B CN 110335058B CN 201910362355 A CN201910362355 A CN 201910362355A CN 110335058 B CN110335058 B CN 110335058B
- Authority
- CN
- China
- Prior art keywords
- matrix
- self
- loss function
- user
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000011159 matrix material Substances 0.000 claims abstract description 309
- 238000013528 artificial neural network Methods 0.000 claims abstract description 82
- 230000006870 function Effects 0.000 claims description 176
- 238000012545 processing Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 15
- 238000012935 Averaging Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 10
- 210000004027 cell Anatomy 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5067—Customer-centric QoS measurements
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Biomedical Technology (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Optimization (AREA)
- Educational Administration (AREA)
- Computational Mathematics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
Abstract
本发明的实施例提供一种用户满意度预测模型的样本生成方法及装置,涉及计算机领域,能够降低样本的复杂度。该方法包括:获取网络的样本数据;对网络数据进行归一化处理,生成第一网络矩阵;将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;根据第一网络质量矩阵、第二网络质量矩阵计算第一自编码损失函数;根据第一用户信息矩阵、第二用户信息矩阵计算第二自编码损失函数;计算总损失函数,并根据总损失函数最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。本申请实施例应用于用户满意度预测模型的样本生成。
Description
技术领域
本发明的实施例涉及计算机领域,尤其涉及一种用户满意度预测模型的样本生成方法及装置。
背景技术
移动通信网飞速发展至今,经历了语音到数据时代的转变,用户满意度是网络运营商在未来发展中稳中求胜的首要问题。一旦用户对产品或服务不满意将会终止业务,并且可能引起连锁反应,使其周围用户受到不满意评价的影响,也终止相关通信业务。因此,提升用户满意度是提升通信网络服务产品在市场上的竞争力的重要手段。
现有的用户满意度预测技术多是简单融合业务支撑系统(business supportsystem,BSS)域及运营支撑系统(the office of strategic services,OSS)域的数据,获取用于预测用户满意度的指标数据;对指标数据进行清洗及标记;基于清洗及标记后的指标数据,通过改进的随机森林算法或其他决策树算法,预测用户满意度,即在BSS域与OSS域选取样本数据,然后使用机器学习算法学习样本数据,生成用户满意度预测模型,需要进行用户满意度预测时,输入预测样本数据,进行用户满意度预测。首先,现有技术没有说明如何融合BSS域和OSS域的数据,如果将BSS域和OSS域的数据直接作为机器学习算法学习的样本数据,不但样本数据具有较高的复杂度,而且会引入很多无用数据,增加用户满意度预测模型的复杂度,此外无用数据会形成干扰,降低结果准确率。其次,在利于用户满意度预测模型进行预测的过程中,现有方法主要通过抽样和遍历来进行用户满意度预测模型的样本数据的选择,但是通过抽样选择样本数据会降低预测结果的精度,通过遍历选择样本数据时,样本数据会具有较高的复杂度。因此,现有技术中所选取的样本数据的复杂度高的问题越发凸显。
发明内容
本发明的实施例提供一种用户满意度预测模型的样本生成方法及装置,能够降低样本的复杂度。
第一方面,提供一种用户满意度预测模型的样本生成方法,包括如下步骤:获取网络的样本数据,样本数据包含网络数据,其中网络数据包含网络质量数据、用户信息数据;对网络数据进行归一化处理,生成第一网络矩阵,其中,第一网络矩阵包含由网络质量数据生成的第一网络质量矩阵、由用户信息数据生成的第一用户信息矩阵;将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;根据第一网络质量矩阵、第二网络质量矩阵计算第一网络质量矩阵通过第一自编码神经网络后的第一自编码损失函数;根据第一用户信息矩阵、第二用户信息矩阵计算第一用户信息矩阵通过第二自编码神经网络后的第二自编码损失函数;根据第一自编码损失函数、第二自编码损失函数计算总损失函数;获取总损失函数的最小值,并根据最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本,用以训练用户满意度预测模型或者输入用户满意度预测模型进行用户满意度的预测。
上述方案中,获取网络的样本数据,样本数据包含网络数据;对网络数据进行归一化处理,生成第一网络矩阵;将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;根据第一网络质量矩阵、第二网络质量矩阵计算第一自编码损失函数;根据第一用户信息矩阵、第二用户信息矩阵计算第二自编码损失函数;根据第一自编码损失函数、第二自编码损失函数计算总损失函数;并根据总损失函数最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。首先,当将最终的样本用于用户满意度预测模型的训练时,本申请将BSS域的用户信息数据与OSS域的网络质量数据转化为矩阵,通过自编码神经网络进行样本数据的特征提取,降低了样本数据的复杂度,避免了将BSS域和OSS域的数据直接用于训练用户满意度预测模型,引入无用数据对预测结果的影响。其次,当将最终的样本用于输入用户满意度预测模型进行用户满意度预测时,通过第一自编码损失函数、第二自编码损失函数计算总损失函数,获取总损失函数最小值对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。获取到复杂度降低之后,又保持了最小损失的数据作为用户满意度预测模型的样本,避免了通过抽样选择样本时降低预测结果的精度,通过遍历选择样本时样本具有较高复杂度的问题。
第二方面,一种用户满意度预测模型的样本生成装置,包括:获取模块,用于获取网络的样本数据,样本数据包含网络数据,其中网络数据包含网络质量数据、用户信息数据;生成模块,用于对获取模块获取到的网络数据进行归一化处理,生成第一网络矩阵,其中,第一网络矩阵包含由网络质量数据生成的第一网络质量矩阵、由用户信息数据生成的第一用户信息矩阵;提取模块,用于将生成模块生成的第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;提取模块,还用于将生成模块生成的第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;计算模块,用于根据第一网络质量矩阵、第二网络质量矩阵计算第一网络质量矩阵通过第一自编码神经网络后的第一自编码损失函数;计算模块,还用于根据第一用户信息矩阵、第二用户信息矩阵计算第一用户信息矩阵通过第二自编码神经网络后的第二自编码损失函数;计算模块,还用于根据第一自编码损失函数、第二自编码损失函数计算总损失函数;处理模块,用于获取计算模块计算的总损失函数的最小值,并根据最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本,用以训练用户满意度预测模型或者输入用户满意度预测模型进行用户满意度的预测。
第三方面,提供一种用户满意度预测模型的样本生成装置,包括通信接口、处理器、存储器、总线;存储器用于存储计算机执行指令,处理器与存储器通过总线连接,当用户满意度预测模型的样本生成装置运行时,处理器执行存储器存储的计算机执行指令,以使用户满意度预测模型的样本生成装置执行如上述的用户满意度预测模型的样本生成方法。
第四方面,提供一种计算机存储介质,包括指令,当指令在计算机上运行时,使得计算机执行如上述的用户满意度预测模型的样本生成方法。
第五方面,提供一种计算机程序产品,计算机程序产品包括指令代码,指令代码用于执行如上述的用户满意度预测模型的样本生成方法。
可以理解地,上述提供的任一种用户满意度预测模型的样本生成装置、计算机存储介质或计算机程序产品均用于执行上文所提供的第一方面对应的方法,因此,其所能达到的有益效果可参考上文第一方面的方法以及下文具体实施方式中对应的方案的有益效果,此处不再赘述。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例提供的一种自编码器工作流程示意图;
图2为本发明的实施例提供的一种自编码神经网络架构示意图;
图3为本发明的实施例提供的一种用户满意度预测模型的样本生成方法示意图;
图4为本发明的实施例提供的一种用户满意度预测模型的样本生成装置的结构示意图;
图5为本发明的另一实施例提供的一种用户满意度预测模型的样本生成装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
移动通信网飞速发展至今,经历了语音到数据时代的转变,用户满意度是网络运营商在未来发展中稳中求胜的首要问题。一旦用户对产品或服务不满意将会终止业务,并且可能引起连锁反应,使其周围用户受到不满意评价的影响,也终止相关通信业务。因此,提升用户满意度是提升通信网络服务产品在市场上的竞争力的重要手段。而现今对用户满意度评估的研究已经有了较多研究成果,例如,利用大数据和机器学习的方法解决用户满意度的影响因素复杂、相关数据类型多样的问题,其中,机器学习算法包括决策树、支持向量机(support vector machine,SVM)、k最邻近分类算法(k-nearest neighbor,KNN)、循环神经网络(recurrent neural network,RNN)等多种算法。但这些用户满意度预测技术多是简单融合BSS域和OSS域的数据,将两域数据直接作为输入,进行用户满意度预测模型的训练,引入了大量无用数据;并且在预测过程中,对于预测样本的选择主要是通过抽样和遍历来进行选择的,容易造成预测结果不准确或者时间浪费,因此快速准确的生成用户满意度预测模型的样本显得尤为重要。
自编码,又称自编码器(autoencoder),是神经网络的一种,是一种数据的压缩算法,属于无监督学习,经过训练后能尝试将输入复制到输出。自编码器神经网络工作流程参照图1所示,包括输入11、编码12、压缩13、译码14、输出15等五个步骤,输入11需要提取特征或降维的源数据,该源数据可以为多种形式,例如,数据集、图像等等;将输入11的源数据进行特定的编码12;使用压缩算法将编码12之后的编码数据进行压缩13得到压缩数据;将压缩数据进行译码14,生成译码数据,进行输出15,得到所需要的降维数据或特征数据。因此,自编码器也是一种有损压缩,可以通过使得损失函数最小,来实现所需要的降维数据或特征数据近似于源数据的值。自编码器内部有一个隐藏层h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数h=f(x)表示的编码器和一个生成重构的解码器r=g(h)。所以,简单的自编码器是一种三层的神经网络模型,参照图2所示,包含输入层、隐含层、输出层、编码器21、神经元22、译码器23,同时也是一种无监督学习模型。从输入层到隐含层称为编码过程,从隐含层到输出层称为解码(译码)过程。自编码就相当于自己生成标签,而且标签就是样本数据本身。
基于快速选取并生成用户满意度预测模型的样本的需要,本申请提供一种用户满意度预测模型的样本生成方法,参照图3所示,具体包括如下步骤:
301、获取网络的样本数据。
样本数据包含网络数据,其中网络数据包含网络质量数据、用户信息数据,从网管系统中获取网络质量数据,例如,小区的ID,弱覆盖占比110、日均上行流量、日均下行流量、小区级上行单用户平均感知速率、小区级下行单用户平均感知速率、长期演进(long termevolution,LTE)重定向次数、演进的无线接入承载(evolved radio access bearer,ERAB)建立成功率、掉线率、无线资源控制(radio resource control,RRC)成功率、信道质量指示(channel quality indication,CQI)质差占比等参数;从用户信息系统中获取用户信息数据,例如,用户标识,业务类型,产品类别,入网年份,入网月份,是否上网卡,客户年龄,客户性别,平均每户每月上网流量(dataflow of usage,DOU),非漫游的总流量数,平均每户每月通话时间(minutes of usage,MOU),主叫的总分钟数,被叫的总分钟数,非漫游的总分钟数,每用户平均收入(average revenue per user,ARPU),套餐费用,超套月流量费用,超套月语音费用,超套月短信费用,超套月增值费用,是否合约计划,合约失效期,融合类型,终端类型,终端厂家,终端型号,是否锁屏,老人机标签,互联网套餐等参数。
对用户信息数据进行独热码one-hot编码,对用户信息数据中文字类型数据进行one-hot编码,例如,对业务类型、终端类型、互联网套餐等文字类型数据one-hot编码。
对网络数据进行如下一项或多项处理:删除具有单一值的网络数据,例如,用户信息数据中的“是否锁屏”只有一个值0,不能提供信息量则删除;删除缺失度大于第二阈值的网络数据,例如,“融合类型”缺失度大于80%,则删除该数据;补全缺失度小于或等于第二阈值的网络数据,当用户信息数据或网络质量数据缺失度小于或等于第二阈值时,使用该数据的均值填充缺失值。
302、对网络数据进行归一化处理,生成第一网络矩阵。
具体的,第一网络矩阵包含由网络质量数据生成的第一网络质量矩阵U、由用户信息数据生成的第一用户信息矩阵N。
例如,当网络质量数据为步骤301中示例中的数据时,第一网络质量矩阵如下:
例如,当用户信息数据为步骤301中示例中的数据时,第一用户信息矩阵
303、将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵。
进一步的,本申请选取具有两层隐含层的自编码神经网络进行第一网络质量矩阵样本的选择,例如,设第一自编码神经网络参数为W11、B11、W12、B12,即第一自编码神经网络的中间层的第一层参数为W11、B11,中间层的第二层参数为W12、B12,输入为步骤302中的第一网络质量矩阵U,记为Ui,输出为第二网络质量矩阵Uo,激励函数为S,则编码后的网络质量矩阵Ue=S(W11*Ui+B11),解码后的网络质量矩阵即要输出的第二网络质量矩阵Uo=Ue*W12+B12。
304、将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵。
进一步的,本申请选取具有两层隐含层的自编码神经网络进行第一网络质量矩阵样本的选择,例如,设第二自编码神经网络参数为W21、B21、W22、B22,即第二自编码神经网络的中间层的第一层参数为W21、B21,中间层的第二层参数为W22、B22,输入为步骤302中的第一用户信息矩阵N,记为Ni,输出为第二用户信息矩阵No,激励函数为S,则编码后的用户信息矩阵Ne=S(W21*Ni+B21),解码后的用户信息矩阵即要输出的第二用户信息矩阵No=Ne*W22+B22。
305、根据第一网络质量矩阵、第二网络质量矩阵计算第一网络质量矩阵通过第一自编码神经网络后的第一自编码损失函数。
进一步的,根据公式L1=fmean(∑(Ui-Uo)2)计算第一网络质量矩阵通过第一自编码神经网络后的第一自编码损失函数,其中,L1为第一自编码损失函数,fmean表示求平均函数,Ui表示第一网络质量矩阵,Uo表示第二网络质量矩阵。
306、根据第一用户信息矩阵、第二用户信息矩阵计算第一用户信息矩阵通过第二自编码神经网络后的第二自编码损失函数。
根据公式L2=fmean(∑(Ni-No)2)计算第一用户信息矩阵通过第二自编码神经网络后的第二自编码损失函数,其中,L2为第二自编码损失函数,fmean表示求平均函数,Ni表示第一用户信息矩阵,No表示第二用户信息矩阵。
307、根据第一自编码损失函数、第二自编码损失函数计算总损失函数。
具体的,根据公式L=αL1+βL2计算总损失函数,其中,L表示总损失函数,L1表示第一自编码损失函数,L2表示第二自编码损失函数,α表示第一网络质量矩阵通过第一自编码神经网络后的误差对预测结果的影响率,β表示第一用户信息矩阵通过第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数,0≤α≤1,0≤β≤1。
308、获取总损失函数的最小值,并根据最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。
根据总损失函数的最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。
上述方案中,获取网络的样本数据,样本数据包含网络数据;对网络数据进行归一化处理,生成第一网络矩阵;将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;根据第一网络质量矩阵、第二网络质量矩阵计算第一自编码损失函数;根据第一用户信息矩阵、第二用户信息矩阵计算第二自编码损失函数;根据第一自编码损失函数、第二自编码损失函数计算总损失函数;并根据总损失函数最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。首先,当将最终的样本用于用户满意度预测模型的训练时,本申请将BSS域的用户信息数据与OSS域的网络质量数据转化为矩阵,通过自编码神经网络进行样本数据的特征提取,降低了样本数据的复杂度,避免了将BSS域和OSS域的数据直接用于训练用户满意度预测模型,引入无用数据对预测结果的影响。其次,当将最终的样本用于输入用户满意度预测模型进行用户满意度预测时,通过第一自编码损失函数、第二自编码损失函数计算总损失函数,获取总损失函数最小值对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本。获取到复杂度降低之后,又保持了最小损失的数据作为用户满意度预测模型的样本,避免了通过抽样选择样本时降低预测结果的精度,通过遍历选择样本时样本数据具有较高复杂度的问题。
其中,若步骤308生成的样本用于输入用户满意度预测模型进行用户满意度的预测,则在步骤301中获取样本数据时,直接获取现网数据或者获取预定时间段内的现网数据作为样本数据,进行用户满意度预测模型的样本的生成,获取到目标第二网络质量矩阵以及目标第二用户信息矩阵输入用户满意度预测模型进行用户满意度预测。若步骤308生成的样本用于训练用户满意度预测模型时,则在获取样本数据时,需要获取特定时间段内历史的网络数据作为步骤301中的样本数据,其中由于训练用户满意度预测模型时,需要用作输入的样本数据以及用作输出的样本数据,在本发明的实施例中,网络数据为用作训练用户满意度预测模型的输入的样本数据,用户评分数据为用于训练用户满意度预测模型的输出的样本数据,因此,还需要获取特定时间段内网络数据对应的用户评分数据。
本申请提供一种用户满意度预测模型的样本生成方法,该样本用于训练用户满意度预测模型,具体包括如下步骤:
401、获取网络的样本数据。
样本数据包含网络数据以及用户评分数据,其中网络数据包含网络质量数据、用户信息数据,其中网络质量数据、用户信息数据可以参考步骤301中所述。
用户评分数据从用户反馈信息中提取,其中,在获取用户评分数据时,同时获取用户使用频率大于预订阈值的小区的ID。
402、对网络数据进行归一化处理,生成第一网络矩阵。
具体的,对网络质量数据进行归一化处理得到第一网络质量矩阵U、对用户信息数据进行归一化处理得到第一用户信息矩阵N,其中对网络质量数据、用户信息数据的归一化处理可以参考步骤302中所述。
将用户评分数据映射到小区的ID,生成第一用户评分矩阵R。
具体的,行代表用户,列代表小区的ID,Rij代表用户i对小区j的评分。
则第一用户评分矩阵如下:
403、将第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;将第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;根据公式Ro=Ue*Ne计算第二用户评分矩阵。其中对第一网络质量矩阵、第一用户信息矩阵的处理可以参考步骤303、304中所述。
具体的,Ue为第一网络质量矩阵经过第一自编码神经网络编码后的网络质量矩阵,Ne为第一用户信息矩阵经过第二自编码神经网络编码后的用户信息矩阵。
404、根据第一网络质量矩阵、第二网络质量矩阵以及公式L1=fmean(∑(Ui-Uo)2)计算第一网络质量矩阵通过第一自编码神经网络后的第一自编码损失函数。其中,L1为第一自编码损失函数,fmean表示求平均函数,Ui表示第一网络质量矩阵,Uo表示第二网络质量矩阵。
根据第一用户信息矩阵、第二用户信息矩阵以及公式L2=fmean(∑(Ni-No)2)计算第一用户信息矩阵通过第二自编码神经网络后的第二自编码损失函数。其中,L2为第二自编码损失函数,fmean表示求平均函数,Ni表示第一用户信息矩阵,No表示第二用户信息矩阵。
根据第一用户评分矩阵、第二用户评分矩阵以及公式L3=fmean(∑((Ri-Ro)*F)2)计算第一用户评分矩阵与第二用户评分矩阵之间的第三自编码损失函数。其中,L3为第三自编码损失函数,fmean表示求平均函数,Ri表示第一用户评分矩阵,Ro表示第二用户评分矩阵,F表示根据第一用户评分矩阵提取的用户标识评分矩阵。
具体的,当根据第一用户评分矩阵提取用户标识评分矩阵F时,提取规则为当用户i对小区j有评分时,Fij记为1,否则记为0。
405、根据第一自编码损失函数、第二自编码损失函数以及第三自编码损失函数计算总损失函数。
具体的,根据公式L=αL1+βL2+L3计算总损失函数,其中L表示总损失函数,L1为第一自编码损失函数,其中L2为第二自编码损失函数,其中L3为第三自编码损失函数,α表示第一网络质量矩阵通过第一自编码神经网络后的误差对预测结果的影响率,β表示第一用户信息矩阵通过第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数,0≤α≤1,0≤β≤1。
406、获取总损失函数的最小值,并根据总损失函数的最小值提取对应的目标第二网络质量矩阵、目标第二用户信息矩阵以及目标第二用户评分矩阵作为用户满意度预测模型的样本。
进一步的,将目标第二网络质量矩阵、目标第二用户信息矩阵作为神经网络的输入,目标第二用户评分矩阵作为神经网络的输出,训练用户满意度预测模型。
参照图4所示,提供一种用户满意度预测模型的样本生成装置,包括:
获取模块41,用于获取网络的样本数据,所述样本数据包含网络数据,其中所述网络数据包含网络质量数据、用户信息数据;生成模块42,用于对所述获取模块41获取到的所述网络数据进行归一化处理,生成第一网络矩阵,其中,所述第一网络矩阵包含由所述网络质量数据生成的第一网络质量矩阵、由所述用户信息数据生成的第一用户信息矩阵;提取模块43,用于将所述生成模块42生成的所述第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;所述提取模块43,还用于将所述生成模块42生成的所述第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;计算模块44,用于根据所述第一网络质量矩阵、所述第二网络质量矩阵计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数;所述计算模块44,还用于根据所述第一用户信息矩阵、所述第二用户信息矩阵计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数;所述计算模块44,还用于根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数;处理模块45,用于获取所述计算模块44计算的所述总损失函数的最小值,并根据所述最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本,用以训练用户满意度预测模型或者输入所述用户满意度预测模型进行用户满意度的预测。
可选的,所述计算模块,具体用于根据公式L1=fmean(∑(Ui-Uo)2)计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数,其中,L1为所述第一自编码损失函数,fmean表示求平均函数,Ui表示所述第一网络质量矩阵,Uo表示所述第二网络质量矩阵。
可选的,所述计算模块,具体用于根据公式L2=fmean(∑(Ni-No)2)计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数,其中,L2为所述第二自编码损失函数,fmean表示求平均函数,Ni表示所述第一用户信息矩阵,No表示所述第二用户信息矩阵。
可选的,所述计算模块44,具体用于根据公式L=αL1+βL2计算所述总损失函数,其中,L表示所述总损失函数,L1表示所述第一自编码损失函数,L2表示所述第二自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
可选的,所述生成模块42,还用于将所述用户评分数据映射到小区的ID,生成第一用户评分矩阵;所述提取模块43,还用于根据公式Ro=Ue*Ne计算第二用户评分矩阵,其中,Ro为所述第二用户评分矩阵,Ue为所述第一网络质量矩阵经过所述第一自编码神经网络编码后的网络质量矩阵,Ne为所述第一用户信息矩阵经过所述第二自编码神经网络编码后的用户信息矩阵;所述计算模块44,还用于根据所述第一用户评分矩阵、所述第二用户评分矩阵以及公式L3=fmean(∑((Ri-Ro)*F)2)计算所述第一用户评分矩阵与所述第二用户评分矩阵之间的第三自编码损失函数,其中,L3为所述第三自编码损失函数,fmean表示求平均函数,Ri表示所述第一用户评分矩阵,Ro表示所述第二用户评分矩阵,F表示根据所述第一用户评分矩阵提取的用户标识评分矩阵;所述计算模块44,还用于根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数,包括:所述计算模块44,具体用于根据所述第一自编码损失函数、所述第二自编码损失函数以及所述第三自编码损失函数计算总损失函数;所述处理模块45,还用于获取所述总损失函数的最小值时,将根据所述最小值提取对应的目标第二用户评分矩阵作为用户满意度预测模型的样本,其中所述目标第二网络质量矩阵、目标第二用户信息矩阵以及所述目标第二用户评分矩阵用于训练所述用户满意度预测模型。
可选的,所述计算模块44,具体用于根据公式L=αL1+βL2+L3计算所述总损失函数,其中L表示所述总损失函数,L1为所述第一自编码损失函数,其中L2为所述第二自编码损失函数,其中L3为所述第三自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
可选的,编码模块46,用于对所述用户信息数据进行独热码one-hot编码。
可选的,所述处理模块45,还用于对所述网络数据进行如下一项或多项处理:删除具有单一值的网络数据;删除缺失度大于第二阈值的网络数据;补全缺失度小于或等于第二阈值的网络数据。
在采用集成的模块的情况下,用户满意度预测模型的样本生成装置包括:存储单元、处理单元以及接口单元。处理单元用于对用户满意度预测模型的样本生成装置的动作进行控制管理。接口单元,用于用户满意度预测模型的样本生成装置与其他设备的信息交互。存储单元,用于存储用户满意度预测模型的样本生成装置的程序代码和数据。
其中,以处理单元为处理器,存储单元为存储器,接口单元为通信接口为例。其中,用户满意度预测模型的样本生成装置参照图5中所示,包括通信接口501、处理器502、存储器503和总线504,通信接口501、处理器502通过总线504与存储器503相连。
处理器502可以是一个通用中央处理器(Central Processing Unit,CPU),微处理器,特定应用集成电路(Application-Specific Integrated Circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
存储器503可以是只读存储器(Read-Only Memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(Random Access Memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器503用于存储执行本申请方案的应用程序代码,并由处理器502来控制执行。通信接口501用于与其他设备进行信息交互,例如支持用户满意度预测模型的样本生成装置与其他设备的信息交互,例如从其他设备获取数据或者向其他设备发送数据。处理器502用于执行存储器503中存储的应用程序代码,从而实现本申请实施例中所述的方法。
此外,还提供一种计算存储媒体(或介质),包括在被执行时进行上述实施例中的用户满意度预测模型的样本生成装置执行的方法操作的指令。另外,还提供一种计算机程序产品,包括上述计算存储媒体(或介质)。
其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,其作用在此不再赘述。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:read-only memory,英文简称:ROM)、随机存取存储器(英文全称:random access memory,英文简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (18)
1.一种用户满意度预测模型的样本生成方法,其特征在于,
获取网络的样本数据,所述样本数据包含网络数据,其中所述网络数据包含网络质量数据、用户信息数据;
对所述网络数据进行归一化处理,生成第一网络矩阵,其中,所述第一网络矩阵包含由所述网络质量数据生成的第一网络质量矩阵、由所述用户信息数据生成的第一用户信息矩阵;
将所述第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;
将所述第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;
根据所述第一网络质量矩阵、所述第二网络质量矩阵计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数;
根据所述第一用户信息矩阵、所述第二用户信息矩阵计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数;
根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数;
获取所述总损失函数的最小值,并根据所述最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本,用以训练用户满意度预测模型或者输入所述用户满意度预测模型进行用户满意度的预测。
2.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,根据所述第一网络质量矩阵、所述第二网络质量矩阵计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数,包括:
根据公式L1=fmean(∑(Ui-Uo)2)计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数,其中,L1为所述第一自编码损失函数,fmean表示求平均函数,Ui表示所述第一网络质量矩阵,Uo表示所述第二网络质量矩阵。
3.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,根据所述第一用户信息矩阵、所述第二用户信息矩阵计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数,包括:
根据公式L2=fmean(∑(Ni-No)2)计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数,其中,L2为所述第二自编码损失函数,fmean表示求平均函数,Ni表示所述第一用户信息矩阵,No表示所述第二用户信息矩阵。
4.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,所述根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数,包括:
根据公式L=αL1+βL2计算所述总损失函数,其中,L表示所述总损失函数,L1表示所述第一自编码损失函数,L2表示所述第二自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
5.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,所述样本数据还包含用户评分数据,所述方法还包括:
将所述用户评分数据映射到小区的ID,生成第一用户评分矩阵;
根据公式Ro=Ue*Ne计算第二用户评分矩阵,其中,Ro为所述第二用户评分矩阵,Ue为所述第一网络质量矩阵经过所述第一自编码神经网络编码后的网络质量矩阵,Ne为所述第一用户信息矩阵经过所述第二自编码神经网络编码后的用户信息矩阵;
根据所述第一用户评分矩阵、所述第二用户评分矩阵以及公式L3=fmean(∑((Ri-Ro)*F)2)计算所述第一用户评分矩阵与所述第二用户评分矩阵之间的第三自编码损失函数,其中,L3为所述第三自编码损失函数,fmean表示求平均函数,Ri表示所述第一用户评分矩阵,Ro表示所述第二用户评分矩阵,F表示根据所述第一用户评分矩阵提取的用户标识评分矩阵;
根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数,包括:
根据所述第一自编码损失函数、所述第二自编码损失函数以及所述第三自编码损失函数计算总损失函数;
所述方法还包括:获取所述总损失函数的最小值时,将根据所述最小值提取对应的目标第二用户评分矩阵作为用户满意度预测模型的样本,其中所述目标第二网络质量矩阵、目标第二用户信息矩阵以及所述目标第二用户评分矩阵用于训练所述用户满意度预测模型。
6.根据权利要求5所述的用户满意度预测模型的样本生成方法,其特征在于,所述根据所述第一自编码损失函数、所述第二自编码损失函数以及所述第三自编码损失函数计算总损失函数,包括:
根据公式L=αL1+βL2+L3计算所述总损失函数,其中L表示所述总损失函数,L1为所述第一自编码损失函数,其中L2为所述第二自编码损失函数,其中L3为所述第三自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
7.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,对所述网络数据进行归一化处理,生成第一网络矩阵之前,还包括:
对所述用户信息数据进行独热码one-hot编码。
8.根据权利要求1所述的用户满意度预测模型的样本生成方法,其特征在于,对所述网络数据进行归一化处理,生成第一网络矩阵之前,还包括:对所述网络数据进行如下一项或多项处理:删除具有单一值的网络数据;删除缺失度大于第二阈值的网络数据;补全缺失度小于或等于第二阈值的网络数据。
9.一种用户满意度预测模型的样本生成装置,其特征在于,
获取模块,用于获取网络的样本数据,所述样本数据包含网络数据,其中所述网络数据包含网络质量数据、用户信息数据;
生成模块,用于对所述获取模块获取到的所述网络数据进行归一化处理,生成第一网络矩阵,其中,所述第一网络矩阵包含由所述网络质量数据生成的第一网络质量矩阵、由所述用户信息数据生成的第一用户信息矩阵;
提取模块,用于将所述生成模块生成的所述第一网络质量矩阵输入第一自编码神经网络,得到第二网络质量矩阵;
所述提取模块,还用于将所述生成模块生成的所述第一用户信息矩阵输入第二自编码神经网络,得到第二用户信息矩阵;
计算模块,用于根据所述第一网络质量矩阵、所述第二网络质量矩阵计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数;
所述计算模块,还用于根据所述第一用户信息矩阵、所述第二用户信息矩阵计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数;
所述计算模块,还用于根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数;
处理模块,用于获取所述计算模块计算的所述总损失函数的最小值,并根据所述最小值提取对应的目标第二网络质量矩阵以及目标第二用户信息矩阵作为用户满意度预测模型的样本,用以训练用户满意度预测模型或者输入所述用户满意度预测模型进行用户满意度的预测。
10.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,
所述计算模块,具体用于根据公式L1=fmean(∑(Ui-Uo)2)计算所述第一网络质量矩阵通过所述第一自编码神经网络后的第一自编码损失函数,其中,L1为所述第一自编码损失函数,fmean表示求平均函数,Ui表示所述第一网络质量矩阵,Uo表示所述第二网络质量矩阵。
11.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,
所述计算模块,具体用于根据公式L2=fmean(∑(Ni-No)2)计算所述第一用户信息矩阵通过所述第二自编码神经网络后的第二自编码损失函数,其中,L2为所述第二自编码损失函数,fmean表示求平均函数,Ni表示所述第一用户信息矩阵,No表示所述第二用户信息矩阵。
12.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,
所述计算模块,具体用于根据公式L=αL1+βL2计算所述总损失函数,其中,L表示所述总损失函数,L1表示所述第一自编码损失函数,L2表示所述第二自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
13.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,所述样本数据还包含用户评分数据,
所述生成模块,还用于将所述用户评分数据映射到小区的ID,生成第一用户评分矩阵;
所述提取模块,还用于根据公式Ro=Ue*Ne计算第二用户评分矩阵,其中,Ro为所述第二用户评分矩阵,Ue为所述第一网络质量矩阵经过所述第一自编码神经网络编码后的网络质量矩阵,Ne为所述第一用户信息矩阵经过所述第二自编码神经网络编码后的用户信息矩阵;
所述计算模块,还用于根据所述第一用户评分矩阵、所述第二用户评分矩阵以及公式L3=fmean(∑((Ri-Ro)*F)2)计算所述第一用户评分矩阵与所述第二用户评分矩阵之间的第三自编码损失函数,其中,L3为所述第三自编码损失函数,fmean表示求平均函数,Ri表示所述第一用户评分矩阵,Ro表示所述第二用户评分矩阵,F表示根据所述第一用户评分矩阵提取的用户标识评分矩阵;
所述计算模块,还用于根据所述第一自编码损失函数、所述第二自编码损失函数计算总损失函数,包括:
所述计算模块,具体用于根据所述第一自编码损失函数、所述第二自编码损失函数以及所述第三自编码损失函数计算总损失函数;
所述处理模块,还用于获取所述总损失函数的最小值时,将根据所述最小值提取对应的目标第二用户评分矩阵作为用户满意度预测模型的样本,其中所述目标第二网络质量矩阵、目标第二用户信息矩阵以及所述目标第二用户评分矩阵用于训练所述用户满意度预测模型。
14.根据权利要求13所述的用户满意度预测模型的样本生成装置,其特征在于,
所述计算模块,具体用于根据公式L=αL1+βL2+L3计算所述总损失函数,其中L表示所述总损失函数,L1为所述第一自编码损失函数,其中L2为所述第二自编码损失函数,其中L3为所述第三自编码损失函数,α表示所述第一网络质量矩阵通过所述第一自编码神经网络后的误差对预测结果的影响率,β表示所述第一用户信息矩阵通过所述第二自编码神经网络后的误差对预测结果的影响率,α、β均为常数。
15.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,
编码模块,用于对所述用户信息数据进行独热码one-hot编码。
16.根据权利要求9所述的用户满意度预测模型的样本生成装置,其特征在于,
所述处理模块,还用于对所述网络数据进行如下一项或多项处理:删除具有单一值的网络数据;删除缺失度大于第二阈值的网络数据;补全缺失度小于或等于第二阈值的网络数据。
17.一种用户满意度预测模型的样本生成装置,其特征在于,包括通信接口、处理器、存储器、总线;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,当所述用户满意度预测模型的样本生成装置运行时,所述处理器执行所述存储器存储的计算机执行指令,以使所述用户满意度预测模型的样本生成装置执行如权利要求1-8任一项所述的用户满意度预测模型的样本生成方法。
18.一种计算机存储介质,包括指令,其特征在于,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1-8任一项所述的用户满意度预测模型的样本生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910362355.8A CN110335058B (zh) | 2019-04-30 | 2019-04-30 | 一种用户满意度预测模型的样本生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910362355.8A CN110335058B (zh) | 2019-04-30 | 2019-04-30 | 一种用户满意度预测模型的样本生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110335058A CN110335058A (zh) | 2019-10-15 |
CN110335058B true CN110335058B (zh) | 2021-09-14 |
Family
ID=68140078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910362355.8A Active CN110335058B (zh) | 2019-04-30 | 2019-04-30 | 一种用户满意度预测模型的样本生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110335058B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111683273A (zh) * | 2020-06-02 | 2020-09-18 | 中国联合网络通信集团有限公司 | 视频卡顿信息的确定方法及装置 |
CN114070676B (zh) * | 2020-08-05 | 2023-03-14 | 展讯半导体(南京)有限公司 | Ai网络模型支持能力上报、接收方法及装置、存储介质 |
CN114693325A (zh) * | 2020-12-29 | 2022-07-01 | 中国联合网络通信集团有限公司 | 基于神经网络的用户口碑智能保障方法及装置 |
CN112329928B (zh) * | 2020-12-30 | 2021-04-30 | 四川新网银行股份有限公司 | 基于异构模型的用户满意度分析方法 |
CN115250244B (zh) * | 2021-04-28 | 2023-07-11 | 中国移动通信集团湖南有限公司 | 一种网络质量评价方法和装置 |
CN113543178B (zh) * | 2021-07-28 | 2024-04-09 | 北京红山信息科技研究院有限公司 | 基于用户感知的业务优化方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107026746A (zh) * | 2016-01-30 | 2017-08-08 | 华为技术有限公司 | 网络业务质量评估方法、系统及网络设备 |
CN107733705A (zh) * | 2017-10-10 | 2018-02-23 | 锐捷网络股份有限公司 | 一种用户体验质量评估模型建立方法及设备 |
CN107798243A (zh) * | 2017-11-25 | 2018-03-13 | 国网河南省电力公司电力科学研究院 | 终端应用的检测方法和装置 |
CN109495920A (zh) * | 2017-09-13 | 2019-03-19 | 中国移动通信集团设计院有限公司 | 一种无线通信网络特征画像方法、设备和计算机程序产品 |
-
2019
- 2019-04-30 CN CN201910362355.8A patent/CN110335058B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107026746A (zh) * | 2016-01-30 | 2017-08-08 | 华为技术有限公司 | 网络业务质量评估方法、系统及网络设备 |
CN109495920A (zh) * | 2017-09-13 | 2019-03-19 | 中国移动通信集团设计院有限公司 | 一种无线通信网络特征画像方法、设备和计算机程序产品 |
CN107733705A (zh) * | 2017-10-10 | 2018-02-23 | 锐捷网络股份有限公司 | 一种用户体验质量评估模型建立方法及设备 |
CN107798243A (zh) * | 2017-11-25 | 2018-03-13 | 国网河南省电力公司电力科学研究院 | 终端应用的检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110335058A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335058B (zh) | 一种用户满意度预测模型的样本生成方法及装置 | |
CN110717325B (zh) | 文本的情感分析方法、装置、电子设备及存储介质 | |
CN112633962B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN110659744A (zh) | 训练事件预测模型、评估操作事件的方法及装置 | |
CN110942326A (zh) | 一种用户满意度预测方法及装置、服务器 | |
CN111797629B (zh) | 医疗文本数据的处理方法、装置、计算机设备和存储介质 | |
CN110008977B (zh) | 聚类模型构建方法以及装置 | |
CN111353689B (zh) | 一种风险评估方法及装置 | |
CN111950889A (zh) | 一种客户风险评估方法、装置、可读存储介质及终端设备 | |
CN109977977B (zh) | 一种识别潜在用户的方法及对应装置 | |
CN110020728B (zh) | 业务模型强化学习方法以及装置 | |
CN112819069B (zh) | 一种事件的定级方法及装置 | |
CN110390041B (zh) | 在线学习方法及装置、计算机可读存储介质 | |
CN109241249B (zh) | 一种确定突发问题的方法及装置 | |
CN112905987A (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN116012061A (zh) | 商品文案生成方法、装置、设备及存储介质 | |
CN113220947A (zh) | 对事件特征进行编码的方法和装置 | |
CN114281904A (zh) | 问题生成方法、装置、电子设备和存储介质 | |
CN113868534A (zh) | 业务处理方法、业务处理装置、电子设备及存储介质 | |
CN110852854A (zh) | 一种量化收益模型的生成方法和风险控制策略的评价方法 | |
CN114861597B (zh) | 填空题解题模型的训练方法及装置 | |
CN113536672B (zh) | 目标对象处理方法及装置 | |
Siskos et al. | Interactive Multicriteria Methodology Based on a Synergy of PROMETHEE II and Robust Simos Methods: Application to the Evaluation of E-government in Europe | |
CN118803036A (zh) | 内容推送方法、装置、设备、介质及产品 | |
CN118799000A (zh) | 家庭宽带用户满意度预测方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |