CN116456323A - 一种基于用户偏好解耦的用户套餐推荐方法及系统 - Google Patents
一种基于用户偏好解耦的用户套餐推荐方法及系统 Download PDFInfo
- Publication number
- CN116456323A CN116456323A CN202310621756.7A CN202310621756A CN116456323A CN 116456323 A CN116456323 A CN 116456323A CN 202310621756 A CN202310621756 A CN 202310621756A CN 116456323 A CN116456323 A CN 116456323A
- Authority
- CN
- China
- Prior art keywords
- user
- package
- data
- representing
- preference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012512 characterization method Methods 0.000 claims abstract description 71
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 72
- 230000006399 behavior Effects 0.000 claims description 48
- 230000015654 memory Effects 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 235000012054 meals Nutrition 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011867 re-evaluation Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/50—Service provisioning or reconfiguring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于用户偏好解耦的用户套餐推荐方法及系统,方法的步骤包括:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集;构造三个嵌入表示来分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;使用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。本发明的方法将用户对于套餐中流量、语音和价格的偏好进行解耦,使得推荐结果更具可解释性,提升了个性化推荐服务的精准度。
Description
技术领域
本发明属于电通信技术领域,具体涉及一种移动通信服务行业用户套餐推荐方法及系统。
背景技术
当前,移动通信服务行业越来越强调以用户体验为中心,推进用户服务的个性化和定制化。推荐系统可以根据用户的历史交互数据挖掘用户的偏好,从而主动给用户推荐个性化的服务,因此受到了越来越广泛的应用。当前的推荐技术基于协同过滤的方法,使用矩阵分解模型或者神经网络模型达到了比较好的推荐效果。
然而,现有的推荐技术只是简单的判断用户与套餐之间的匹配程度,即用户对于套餐是否满意。对于运营商而言,目前仅仅简单判断用户对于套餐是否满意已经无法满足其对于掌握用户精细倾向的需求。运营商需要了解用户对于套餐各个方面的需求,才能有针对性地提供个性化的套餐,这就要求推荐技术具有更好的可解释性,即更好的根因分析能力。
发明内容
本发明所要解决的技术问题是,在移动通信服务行业,现有用户套餐推荐方法缺乏可解释性以及推荐精度不足。
为解决上述技术问题, 本发明提供一种基于用户偏好解耦的用户套餐推荐方法,包括以下步骤:
步骤S1:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
步骤S2:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
步骤S3:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
步骤S4:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
前述的基于用户偏好解耦的用户套餐推荐方法,在步骤S1中,包括以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意;
步骤S12:对用户套餐订阅数据集中的数据进行预处理,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征/>,编码之后的向量为/>,其中,向量的长度为集合的大小/>,向量的第/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
前述的基于用户偏好解耦的用户套餐推荐方法,在步骤S2中,包括以下步骤:
步骤S21:从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格;
步骤S22:基于数据集一、数据集二/>和数据集三/>子数据集分别训练矩阵分解模型,学习用户对于套餐中流量、语音和价格的偏好,得到流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示/>,其中,矩阵分解模型的计算步骤为,首先初始化一个用户因子向量和一个物品因子向量,然后通过计算这两个向量的内积来建模用户对于物品的评分,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>、/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列,用户与套餐的交互信息为显式反馈数据,即用户对于套餐的满意度;
使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中,/>、/>分别表示用户和套餐的数量,/>表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小;
将用户ID特征与用户画像特征级联构成初始用户特征,其中,/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
利用矩阵分解模型来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,/>,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,为建模用户某一偏好时的损失函数;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示,分别表征用户对于套餐中流量、语音和价格的偏好。
前述的基于用户偏好解耦的用户套餐推荐方法,在步骤S3中,包括以下步骤:
步骤S31:基于用户套餐订阅序列数据,利用长短时记忆网络学习用户短期倾向,长短时记忆网络的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,
,
,
,
其中,、/>和/>分别表示遗忘门参数一、遗忘门参数二和遗忘门参数三,/>、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征,/>表示按照元素相乘,/>是/>函数,/>是函数,/>表示用户在第/>个时刻的短期偏好;/>表示用户在第k-1时刻的短期偏好,表示k-1时刻记忆元的状态;
步骤S32:设关键因素集合为;
使用注意力网络计算最终的用户表征:
,
其中,表示用户总体偏好表征,/>表示注意力网络,给定用户/>的短期偏好,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>表示第/>个时刻/>方面偏好表征的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,计算方式如下:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,/>表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>为经过/>更新后的用户在/>方面偏好表征。
前述的基于用户偏好解耦的用户套餐推荐方法,在步骤S4中,具体包括以下步骤:
步骤S41:使用矩阵分解层(Matrix factorization layer)计算用户对于套餐/>的整体满意度:
,
其中,为套餐/>的特征,/>为超参数,可以调整用户短期偏好和用户总体偏好在推荐时的重要性,在本发明实例中,设定/>=0.2,
同样,使用均方差损失来优化模型参数:
,
其中,为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,然后按照整体满意度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为的套餐推荐给用户。
一种基于用户偏好解耦的用户套餐推荐系统,包括以下模块:
数据采集模块:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
训练模块:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
融合模块:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
套餐生成模块:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
前述的基于用户偏好解耦的用户套餐推荐系统,在数据采集模块中,执行以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意;
步骤S12:对用户套餐订阅数据集中的数据进行预处理,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征/>,编码之后的向量为/>,其中,向量的长度为集合的大小/>,向量的第/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
前述的基于用户偏好解耦的用户套餐推荐系统,在训练模块中,执行以下步骤:
步骤S21:从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格;
步骤S22:基于数据集一、数据集二/>和数据集三子数据集分别训练矩阵分解模型,学习用户对于套餐中流量、语音和价格的偏好,得到流量嵌入表示/>、语音嵌入表示和价格嵌入表示/>,其中,矩阵分解模型的计算步骤为,首先初始化一个用户因子向量和一个物品因子向量,然后通过计算这两个向量的内积来建模用户对于物品的评分,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>、/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列,用户与套餐的交互信息为显式反馈数据, 即用户对于套餐的满意度;
使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中,/>、/>分别表示用户和套餐的数量,/>表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小,/>表示实数域;
将用户ID特征与用户画像特征级联构成初始用户特征,其中,/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
利用矩阵分解层来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,/>,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,为建模用户某一偏好时的损失函数;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示,分别表征用户对于套餐中流量、语音和价格的偏好。
前述的基于用户偏好解耦的用户套餐推荐系统,在融合模块中,执行以下步骤:
步骤S31:基于用户套餐订阅序列数据,利用长短时记忆网络学习用户短期倾向,长短时记忆网络的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,
,
,
,
其中,、/>和/>分别表示遗忘门中的参数一、遗忘门参数二和遗忘门参数三,、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征,/>表示按照元素相乘,/>是/>函数,/>是/>函数,/>表示用户在第/>个时刻的短期偏好,/>表示用户在第k-1时刻的短期偏好,/>表示k-1时刻记忆元的状态;
步骤S32:设关键因素集合为;
使用注意力网络计算最终的用户表征:
,
其中,表示用户总体偏好表征,/>表示注意力网络,给定用户/>的短期偏好,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>表示第/>个时刻/>方面偏好表征的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,具体计算方式如公式(9)~公式(11)所示:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,/>表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>为经过/>更新后的用户在/>方面偏好表征。
前述的基于用户偏好解耦的用户套餐推荐系统,在套餐生成模块中,执行以下步骤:
步骤S41:使用矩阵分解层计算用户对于套餐/>的整体满意度:
,
其中,为套餐/>的特征,/>为超参数;
同样,使用均方差损失来优化模型参数:
,
其中,为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,按照满意程度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为前的套餐推荐给用户。
本发明达到的有益效果:本发明的方法中利用解耦表征学习的方法,通过构建特定数据来挖掘用户在特定方面的偏好,从而使得推荐结果更具有可解释性,同时,通过注意力机制来自适应地融合用户不同方面偏好,额外考虑了上下文信息,即用户最近的消费倾向,使得模型可以感知用户偏好的变化,从而自适应地决定用户每个方面偏好的重要性,提高了推荐的精准度。
附图说明
图1为本发明实施例提供的一种基于用户偏好解耦的用户套餐推荐方法的流程图;
图2为本发明实施例提供的长短期记忆网络示意图;
图3为本发明实施例提供的注意力机制示意图;
图4为本发明实施例提供的样例研究示意图。
具体实施方式
下面结合附图对本发明具体实施方式加以详细的说明。
实施例1
本实施方式中,以用户套餐订阅数据为例对本实施方式的套餐推荐模型进行说明。
如图1~图3所示,一种基于用户偏好解耦的用户套餐推荐方法,包括以下步骤:
步骤S1:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
步骤S2:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
步骤S3:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
步骤S4:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
在步骤S1中,包括以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意。
在本发明实例中,采用移动集团提供的用户资费满意度预警_北京数据集,数据集包含87382297个用户和3013个套餐,本发明筛选出其中一部分信息完整的数据,包含5353585个用户和3006个套餐以及相应的订阅数据,满意度评分的具体表现形式为:满意用0表示,不满意用1表示。
步骤S12:对用户套餐订阅数据集中的数据进行预处理,以获得适合推荐模型输入的数据格式,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码(one-hot encoding)重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征(套餐)/>,编码之后的向量为,其中,向量的长度为集合的大小/>,向量的第/>=/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数,所述二元特征包括性别、流量等,二元特征以用户性别为例,处理方式为:男性置0,女性置1,连续值特征以用户年龄为例,处理方式为:假设用户的年龄为/>,则将年龄值特征归一化为/>,其中,/>为用户套餐订阅数据集中年龄最大用户的年龄;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
在步骤S2中,包括以下步骤:
步骤S21:为解耦用户对于套餐的偏好,从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格,在本发明实例中,设定/>值为0.001,/>值为1;
步骤S22:基于数据集一、数据集二/>和数据集三/>子数据集分别训练矩阵分解模型(Matrix Factorization,MF),学习用户对于套餐中流量、语音和价格的偏好,得到三个嵌入表示:流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示/>,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>和/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列,用户与套餐的交互信息为显式反馈数据,即用户对于套餐的满意度,在本发明实例中,用户行为序列数据的数据颗粒度为月,序列长度n的最大值为12;
然后,使用嵌入层将高维稀疏的独热(one-hot)用户ID向量和套餐ID向量映射为密集的低维向量,形成用户ID特征和套餐ID特征,具体地,使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中,/>、/>分别表示用户和套餐的数量,表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小,/>表示实数域,在本发明实例中,设定/>=/>=32;
将用户ID特征与用户画像特征级联构成初始用户特征,其中,/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
最后,利用矩阵分解层来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,防止过拟合,,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,如/>和/>表示子数据集二/>中的用户集合和套餐集合,/>为建模用户某一偏好时的损失函数,如/>为建模用户语音偏好时的损失函数。为三个损失函数/>、/>和/>之和;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示,分别表征用户对于套餐中流量、语音和价格的偏好。
在步骤S3中,具体包括以下步骤:
步骤S31:由于用户的偏好会随时间发生改变,不同时刻用户各方面偏好的重要性也不同,因此,需要考虑上下文信息,即用户当前的消费倾向。首先基于用户套餐订阅序列数据,利用长短时记忆网络(LSTM)学习用户短期倾向,从而更好地感知用户当前的偏好和需求,LSTM的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,
,
,
,
其中,、/>和/>分别表示遗忘门参数一、遗忘门参数二和遗忘门参数三,/>、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征/>,/>表示按照元素相乘,/>是/>函数,是/>函数,/>表示用户在第/>个时刻的短期偏好;/>表示用户在第k-1时刻的短期偏好,/>表示k-1时刻记忆元的状态;步骤S32:基于用户的短期倾向,使用注意力机制确定用户不同方面偏好的重要性,同时融合用户不同方面的偏好,得到用户总体偏好表征/>,包括以下步骤:
设关键因素集合为;
使用注意力网络(Attention Neural Network, ANN)计算最终的用户表征:
,
其中,表示注意力网络,给定用户/>的短期偏好/>,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>=/>时,/>表示第/>个时刻/>方面偏好表征的重要性,/>表示语音偏好用户表征/>在预测时的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,具体计算方式如公式(9)~公式(11)所示:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,/>表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>表示第/>时刻/>方面偏好表征的重要性,/>为经过/>更新后的用户在/>方面偏好表征。
在步骤S4中,具体包括以下步骤:
步骤S41:使用矩阵分解层(Matrix factorization layer)计算用户对于套餐/>的整体满意度:
,
其中,为套餐/>的特征,/>为超参数,可以调整用户短期偏好和用户总体偏好在推荐时的重要性,在本发明实例中,设定/>=0.2;
同样,使用均方差损失来优化模型参数:
,
其中,、/>表示数据来自用户套餐订阅数据集,/>为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,然后按照整体满意度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为前的套餐推荐给用户,在本实施例中,/>的值取5。
为了评估本实施例,使用用户套餐订阅数据集来测试模型的性能。本发明使用的评价指标为召回率(Recall@Q)以及归一化折损累计增益Normalized Discounted cumulative Gain@Q(NDCG@Q), Recall@Q等价于Hit-Ratio@Q(HR@Q),它计算正确商品的预测排名出现在排序列表前个商品中的比例。NDCG@K指标考虑了推荐列表中排名的位置信息,相关商品的排名越高则得分越高,在本发明中,使用了/>= 5,10时的Recall和NDCG作为评价指标。
表1为本发明实施例1提供的推荐结果;表2为本发明实施例1提供的可解释性实验结果;
表1
表2
表1中列出了本发明与其他基线模型在用户套餐订阅数据集上的实验结果,可以看出,本技术的性能超过了所有基线模型方法。
通过比较基线模型方法和本技术方法的结果,可以得到以下结论:1)基于RNN(GRU4Rec)的模型比基于self-attention的模型(SASRec, SSEPT)取得了更好的效果,表明了RNN模型在短期序列数据建模上的优越性。2)在基于self-attention的模型中,SSEPT额外融入了用户特征信息,因此比SASRec取得了更好的效果。BERT4Rec的性能不如SSEPT和SASRec,说明对于序列数据的双向建模并不适用于用户消费行为数据。3)和GRU4Rec相比,本技术同样使用了基于RNN的LSTM,但本技术采用了解耦训练的方法,并且使用注意力机制自适应地融合了用户不同方面的偏好,因此取得了比GRU4Rec更好的效果。
为了测试解耦的表征是否可以体现用户对应方面的偏好,本发明利用用户对于套餐中流量和语音的评分来测试解耦表征的质量。具体地,本发明单独使用语音偏好表征或者流量偏好表征做出推荐,然后基于流量和语音满意度评分计算推荐效果,此外,为了和常规基于序列推荐的算法相比较,本发明额外使用流量评分和语音评分来分别监督序列推荐算法的训练,其中,训练序列推荐算法的数据来自原始分布的数据集。表2中列出了GRU4Rec,SASRec和本章方法的实验结果,可以看出,使用解耦表征方法的性能大幅超过了常规的序列推荐的方法,证明了解耦表征方法具有更好的可解释性,而常规基于序列推荐的方法则无法很好地将用户对于流量和语音的偏好区分开来。
为了直观地展示本技术的推荐效果,本发明从用户套餐订阅数据集中随机抽取了一个不满意用户,并向其推荐套餐,如图4中所示,通过模型评估可以得出,当前用户对于套餐中的流量最不满意,因此,模型根据该因素给用户重新推荐了一个流量多的套餐,经过模型的重新评估,用户对于套餐中流量的不满意程度降低,从而使得用户对于套餐整体感到满意。
一种基于用户偏好解耦的用户套餐推荐系统,包括以下模块:
数据采集模块:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
训练模块:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
融合模块:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
套餐生成模块:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
在数据采集模块中,执行以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意。
在本发明实例中,采用移动集团提供的用户资费满意度预警_北京数据集,数据集包含87382297个用户和3013个套餐,本发明筛选出其中一部分信息完整的数据,包含5353585个用户和3006个套餐以及相应的订阅数据,满意度评分的具体表现形式为:满意用0表示,不满意用1表示。
步骤S12:对用户套餐订阅数据集中的数据进行预处理,以获得适合推荐模型输入的数据格式,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码(one-hot encoding)重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征(套餐)/>,编码之后的向量为,其中,向量的长度为集合的大小/>,向量的第/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数,所述二元特征包括性别、流量等,二元特征以用户性别为例,处理方式为:男性置0,女性置1,连续值特征以用户年龄为例,处理方式为:假设用户的年龄为/>,则将年龄值特征归一化为/>,其中,/>为用户套餐订阅数据集中年龄最大用户的年龄;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
在训练模块中,执行以下步骤:
步骤S21:为解耦用户对于套餐的偏好,从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格,在本发明实例中,设定/>值为0.001,/>值为1;
步骤S22:基于数据集一、数据集二/>和数据集三/>子数据集分别训练矩阵分解模型(Matrix Factorization,MF),学习用户对于套餐中流量、语音和价格的偏好,得到三个嵌入表示:流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示/>,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>、/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列/>,用户与套餐的交互信息为显式反馈数据,即用户对于套餐的满意度,在本发明实例中,用户行为序列数据的数据颗粒度为月,序列长度n的最大值为12;
然后,使用嵌入层将高维稀疏的独热(one-hot)用户ID向量和套餐ID向量映射为密集的低维向量,形成用户ID特征和套餐ID特征,具体地,使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中,/>、/>分别表示用户和套餐的数量,表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小,/>表示实数域,在本发明实例中,设定/>=/>=32;
将用户ID特征与用户画像特征级联构成初始用户特征,其中,/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
最后,利用矩阵分解层来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,防止过拟合,,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,如/>和/>表示子数据集二/>中的用户集合和套餐集合,/>为建模用户某一偏好时的损失函数,如/>为建模用户语音偏好时的损失函数。为三个损失函数/>、/>和/>之和;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示,分别表征用户对于套餐中流量、语音和价格的偏好。
在融合模块中,执行以下步骤:
步骤S31:由于用户的偏好会随时间发生改变,不同时刻用户各方面偏好的重要性也不同,因此,需要考虑上下文信息,即用户当前的消费倾向。首先基于用户套餐订阅序列数据,利用长短时记忆网络(LSTM)学习用户短期倾向,从而更好地感知用户当前的偏好和需求,LSTM的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,/>
,
,
,
其中,、/>和/>分别表示遗忘门参数一、遗忘门参数二和遗忘门参数三,/>、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征/>,/>表示按照元素相乘,/>是/>函数,是/>函数,/>表示用户在第/>个时刻的短期偏好,/>表示用户/>的短期偏好/>;/>表示用户在第k-1时刻的短期偏好,/>表示k-1时刻记忆元的状态;
步骤S32:基于用户的短期倾向,使用注意力机制确定用户不同方面偏好的重要性,同时融合用户不同方面的偏好,得到用户总体偏好表征,包括以下步骤:
设关键因素集合为;
使用注意力网络(Attention Neural Network, ANN)计算最终的用户表征:
,
其中, 表示表示注意力网络,给定用户/>的短期偏好/>,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>=/>时,/>表示第/>个时刻/>方面偏好表征的重要性,/>表示语音偏好用户表征/>在预测时的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,具体计算方式如公式(9)~公式(11)所示:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,/>表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>为经过/>更新后的用户在/>方面偏好表征。
在套餐生成模块中,执行以下步骤:
步骤S41:使用矩阵分解层(Matrix factorization layer)计算用户对于套餐/>的整体满意度:/>
,
其中,为套餐/>的特征,/>为超参数,可以调整用户短期偏好和用户总体偏好在推荐时的重要性,在本发明实例中,设定/>=0.2,
同样,使用均方差损失来优化模型参数:
,
其中,、/>表示数据来自用户套餐订阅数据集,/>为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,然后按照整体满意度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为前的套餐推荐给用户,在本实施例中,/>的值取5。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种基于用户偏好解耦的用户套餐推荐方法,其特征在于,包括以下步骤:
步骤S1:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
步骤S2:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
步骤S3:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
步骤S4:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
2.根据权利要求1所述的基于用户偏好解耦的用户套餐推荐方法,其特征在于,在步骤S1中,包括以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意;
步骤S12:对用户套餐订阅数据集中的数据进行预处理,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征/>,编码之后的向量为/>,其中,向量的长度为集合的大小/>,向量的第/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
3.根据权利要求2所述的基于用户偏好解耦的用户套餐推荐方法,其特征在于,在步骤S2中,包括以下步骤:
步骤S21:从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格;
步骤S22:基于数据集一、数据集二/>和数据集三/>子数据集分别训练矩阵分解模型学习用户对于套餐中流量、语音和价格的偏好,得到流量嵌入表示/>、语音嵌入表示和价格嵌入表示/>,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>、/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列,用户与套餐的交互信息为显式反馈数据, 即用户对于套餐的满意度;
使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中/>、分别表示用户和套餐的数量,/>表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小;
将用户ID特征与用户画像特征级联构成初始用户特征,其中/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
利用矩阵分解层来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,/>,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,/>为建模用户某一偏好时的损失函数;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示/>,分别表征用户对于套餐中流量、语音和价格的偏好。
4.根据权利要求3所述的基于用户偏好解耦的用户套餐推荐方法,其特征在于,在步骤S3中,包括以下步骤:
步骤S31:基于用户套餐订阅序列数据,利用长短时记忆网络学习用户短期倾向,长短时记忆网络的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,
,
,
,
其中,、/>和/>分别表示遗忘门参数一、遗忘门参数二和遗忘门参数三,/>、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征,/>表示按照元素相乘,/>是/>函数,/>是/>函数,/>表示用户在第/>个时刻的短期偏好;/>表示用户在第k-1时刻的短期偏好,/>表示k-1时刻记忆元的状态;
步骤S32:设关键因素集合为;
使用注意力网络计算最终的用户表征:
,
其中,表示用户总体偏好表征,/>表示注意力网络,给定用户/>的短期偏好/>,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>表示第/>个时刻/>方面偏好表征的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,计算方式如公式(9)~公式(11)所示:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>为经过更新后的用户在/>方面偏好表征。
5.根据权利要求4所述的基于用户偏好解耦的用户套餐推荐方法,其特征在于,在步骤S4中,具体包括以下步骤:
步骤S41:使用矩阵分解层计算用户对于套餐/>的整体满意度:
,
其中,为套餐/>的特征,/>为超参数,用于调整用户短期偏好和用户总体偏好在推荐时的重要性;
同样,使用均方差损失来优化模型参数:
,
其中,为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,然后按照整体满意度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为前的套餐推荐给用户。
6.一种基于用户偏好解耦的用户套餐推荐系统,其特征在于,包括以下模块:
数据采集模块:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,并进行数据预处理;
训练模块:使用三个嵌入表示分别表征用户对于套餐中流量、语音和价格的偏好,并且从用户套餐订阅数据集中抽取特定数据来训练每个嵌入表示,使得每个嵌入表示只捕捉其中一种偏好;
融合模块:利用注意力机制自适应融合三个嵌入表示,得到用户总体偏好表征;
套餐生成模块:基于用户总体偏好表征计算用户对于候选套餐的满意程度,并根据满意程度生成套餐推荐列表。
7.根据权利要求6所述的基于用户偏好解耦的用户套餐推荐系统,其特征在于,在数据采集模块中,执行以下步骤:
步骤S11:采集用户的套餐订阅数据和满意度评分数据,建立用户套餐订阅数据集,所述用户套餐订阅数据集包括用户画像数据、套餐详情数据、套餐消费数据和满意度评分数据,所述满意度评分数据包括语音满意度评分、流量满意度评分以及套餐整体满意度评分,评分数据包括满意和不满意;
步骤S12:对用户套餐订阅数据集中的数据进行预处理,预处理包括以下步骤:
1)对所述用户套餐订阅数据集中的数据重复项进行去重;
2)使用独热编码重新编码用户ID和套餐ID,假设套餐集合为,对于其中任意一个特征/>,编码之后的向量为/>,其中,向量的长度为集合的大小/>,向量的第/>维为1,其余维度为0;
3)将所述用户套餐订阅数据集中的二元特征或者连续值特征标准化到[0,1]之间的一个实数;
步骤S13:基于预处理后的用户套餐订阅数据集,构建每个用户的订阅行为序列,一个用户的行为序列为用户所有行为按照时间顺序构成的序列,用户的每个行为定义为用户当前订阅的套餐和套餐消费行为。
8.根据权利要求7所述的基于用户偏好解耦的用户套餐推荐系统,其特征在于,在训练模块中,执行以下步骤:
步骤S21:从用户套餐订阅数据集中抽取三种特定数据,形成三个子数据集一、数据集二/>和数据集三/>,使得模型分别从三个子数据集中学习用户对于套餐中流量、语音和价格的偏好;
所述数据集一中每条数据的满意度标签满足:语音满意度标签为满意,而流量满意度标签为不满意;
数据集二中每条数据的满意度标签满足:流量满意度标签为不满意,语音满意度标签为满意;
数据集三中的数据满足:正样本的套餐性价比高于负样本的套餐性价比,所述正样本即套餐整体满意度评分为满意的用户,负样本为套餐整体满意度评分为不满意的用户,套餐性价比/>的计算方式为:/>,其中,/>和/>分别为计算性价比时流量和语音的权重,/>表示套餐中包含的流量,/>表示套餐中包含的语音时长,/>表示套餐的价格;
步骤S22:基于数据集一、数据集二/>和数据集三/>子数据集分别训练矩阵分解模型,学习用户对于套餐中流量、语音和价格的偏好,得到流量嵌入表示/>、语音嵌入表示和价格嵌入表示/>,具体步骤为:
在推荐场景下,设定为用户集合,/>为套餐集合,其中,/>和/>分别为用户ID和套餐ID;设定/>、/>、/>分别为用户画像特征、套餐信息特征和用户套餐消费特征,一个用户的行为/>定义为该用户在第/>月订阅的套餐信息/>、套餐信息特征/>以及在当月的用户套餐消费特征/>;
一个用户的订阅行为序列定义为用户所有的行为按照时间顺序构成的序列,用户与套餐的交互信息为显式反馈数据, 即用户对于套餐的满意度;
使用全连接层一和全连接层二/>分别将用户ID向量和套餐ID向量转换为一系列密集向量的集合一/>和集合二/>,其中/>、分别表示用户和套餐的数量,/>表示初始用户ID特征向量维度的大小,/>表示初始套餐ID特征向量维度的大小,/>表示实数域;
将用户ID特征与用户画像特征级联构成初始用户特征,其中,/>表示将两个向量级联,将套餐ID特征与套餐信息特征级联构成套餐初始特征/>;
利用矩阵分解层来预测用户对于套餐的整体满意度,具体步骤为:
计算用户特征与套餐特征/>的内积得到用户/>对于套餐/>的满意度预测值,使用均方差损失优化推荐模型,使满意度预测值/>不断接近满意度真实值/>:
,
,
其中,为模型的参数,/>为/>正则化项,/>,表示三个关键因素:流量、语音和价格;/>和/>表示某一个子数据集中的用户集合和套餐集合,/>为建模用户某一偏好时的损失函数;
基于流量的模型参数、语音的模型参数、价格的模型参数、/>和/>,用户初始特征/>分别更新为流量嵌入表示/>、语音嵌入表示/>和价格嵌入表示/>,分别表征用户对于套餐中流量、语音和价格的偏好。
9.根据权利要求8所述的基于用户偏好解耦的用户套餐推荐系统,其特征在于,在融合模块中,执行以下步骤:
步骤S31:基于用户套餐订阅序列数据,利用长短时记忆网络学习用户短期倾向,长短时记忆网络的序列步骤更新方式计算如公式(3)~公式(7)所示:
,
,
,
,
,
其中,、/>和/>分别表示遗忘门参数一、遗忘门参数二和遗忘门参数三,/>、/>和/>分别表示输入门参数一、输入门参数二和输入门参数三,/>、/>和/>分别表示输出门参数一、输出门参数二和输出门参数三,/>、/>和/>分别表示遗忘门、输入门和输出门,/>表示记忆元,/>、/>和/>分别表示记忆元参数一、记忆元参数二和记忆元参数三,/>表示用户订阅行为序列中第/>个行为的套餐消费特征,/>表示按照元素相乘,/>是/>函数,/>是/>函数,/>表示用户在第/>个时刻的短期偏好;/>表示用户在第k-1时刻的短期偏好,/>表示k-1时刻记忆元的状态;
步骤S32:设关键因素集合为;
使用注意力网络计算最终的用户表征:
,
其中,表示用户总体偏好表征,/>表示注意力网络,给定用户/>的短期偏好/>,注意力函数/>将维度为/>的关键因素用户表征/>映射为权重值/>,/>表示第/>个时刻/>方面偏好表征的重要性;
以此类推,聚合函数将所有关键因素用户表征聚合为用户总体偏好表征/>,具体计算方式如公式(9)~公式(11)所示:
,
,
,
其中,,/>为模型参数,/>为/>激活函数,/>表示向量转置符号,表示指数函数,/>表示用户/>在第/>时刻/>方面偏好表征,/>为经过更新后的用户在/>方面偏好表征。
10.根据权利要求9所述的基于用户偏好解耦的用户套餐推荐系统,其特征在于,在套餐生成模块中,执行以下步骤:
步骤S41:使用矩阵分解层计算用户对于套餐/>的整体满意度:
,
其中,为套餐/>的特征,/>为超参数;
同样,使用均方差损失来优化模型参数:
,
其中,为损失函数,/>为正则化项/>的系数;
步骤S42: 基于用户总体偏好表征、用户短期偏好表征和套餐表征,计算用户对所有候选套餐的整体满意度,按照满意程度从高到低排序,生成套餐推荐列表,取套餐推荐列表排名为前的套餐推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310621756.7A CN116456323B (zh) | 2023-05-30 | 2023-05-30 | 一种基于用户偏好解耦的用户套餐推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310621756.7A CN116456323B (zh) | 2023-05-30 | 2023-05-30 | 一种基于用户偏好解耦的用户套餐推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116456323A true CN116456323A (zh) | 2023-07-18 |
CN116456323B CN116456323B (zh) | 2023-09-12 |
Family
ID=87123962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310621756.7A Active CN116456323B (zh) | 2023-05-30 | 2023-05-30 | 一种基于用户偏好解耦的用户套餐推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116456323B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611896A (zh) * | 2023-07-19 | 2023-08-18 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955828A (zh) * | 2019-11-19 | 2020-04-03 | 浙江鸿程计算机系统有限公司 | 一种基于深度神经网络的多因素嵌入个性化套餐推荐方法 |
CN113806634A (zh) * | 2021-09-17 | 2021-12-17 | 中国联合网络通信集团有限公司 | 业务套餐的推荐方法、装置及服务器 |
CN113962160A (zh) * | 2021-11-04 | 2022-01-21 | 中南大学 | 基于用户画像的互联网卡用户流失预测方法及系统 |
CN114022202A (zh) * | 2021-11-03 | 2022-02-08 | 中南大学 | 基于深度学习的用户流失预测方法及系统 |
CN115907907A (zh) * | 2022-11-21 | 2023-04-04 | 中国联合网络通信集团有限公司 | 移动网络套餐推荐方法、系统、电子设备及存储介质 |
CN116127184A (zh) * | 2022-12-07 | 2023-05-16 | 中国电信股份有限公司 | 产品的推荐方法及装置、非易失性存储介质、电子设备 |
CN116170330A (zh) * | 2022-12-29 | 2023-05-26 | 中国电信股份有限公司 | 业务套餐的推荐方法、装置及电子设备 |
-
2023
- 2023-05-30 CN CN202310621756.7A patent/CN116456323B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955828A (zh) * | 2019-11-19 | 2020-04-03 | 浙江鸿程计算机系统有限公司 | 一种基于深度神经网络的多因素嵌入个性化套餐推荐方法 |
CN113806634A (zh) * | 2021-09-17 | 2021-12-17 | 中国联合网络通信集团有限公司 | 业务套餐的推荐方法、装置及服务器 |
CN114022202A (zh) * | 2021-11-03 | 2022-02-08 | 中南大学 | 基于深度学习的用户流失预测方法及系统 |
CN113962160A (zh) * | 2021-11-04 | 2022-01-21 | 中南大学 | 基于用户画像的互联网卡用户流失预测方法及系统 |
CN115907907A (zh) * | 2022-11-21 | 2023-04-04 | 中国联合网络通信集团有限公司 | 移动网络套餐推荐方法、系统、电子设备及存储介质 |
CN116127184A (zh) * | 2022-12-07 | 2023-05-16 | 中国电信股份有限公司 | 产品的推荐方法及装置、非易失性存储介质、电子设备 |
CN116170330A (zh) * | 2022-12-29 | 2023-05-26 | 中国电信股份有限公司 | 业务套餐的推荐方法、装置及电子设备 |
Non-Patent Citations (2)
Title |
---|
王文: "基于深度学习的电信套餐推荐模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈豪: "基于深度学习的电信套餐升级预测模型研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611896A (zh) * | 2023-07-19 | 2023-08-18 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
CN116611896B (zh) * | 2023-07-19 | 2023-10-24 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116456323B (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648049B (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
CN109543109B (zh) | 一种融合时间窗技术和评分预测模型的推荐算法 | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
CN110232480A (zh) | 利用变分的正则化流实现的项目推荐方法及模型训练方法 | |
CN112650929B (zh) | 一种融入评论信息的图神经网络推荐方法 | |
CN111209386A (zh) | 一种基于深度学习的个性化文本推荐方法 | |
Cosma et al. | A computational intelligence approach to efficiently predicting review ratings in e-commerce | |
CN116456323B (zh) | 一种基于用户偏好解耦的用户套餐推荐方法及系统 | |
Gu et al. | Multitask coupled logistic regression and its fast implementation for large multitask datasets | |
Zhong et al. | Session-based recommendation via flow-based deep generative networks and Bayesian inference | |
Lu et al. | Binary classification from multiple unlabeled datasets via surrogate set classification | |
Liu | E‐Commerce Precision Marketing Model Based on Convolutional Neural Network | |
CN113032676B (zh) | 基于微反馈的推荐方法和系统 | |
Paul et al. | A weighted hybrid recommendation approach for user’s contentment using natural language processing | |
CN114119191A (zh) | 风控方法、逾期预测方法、模型训练方法及相关设备 | |
Wei et al. | Sequential recommendation based on long-term and short-term user behavior with self-attention | |
CN112559905B (zh) | 一种基于双模式注意力机制和社交相似度的会话推荐方法 | |
CN111666410B (zh) | 商品用户评论文本的情感分类方法及系统 | |
Kim | Time-varying Item Feature Conditional Variational Autoencoder for Collaborative Filtering | |
CN114092194A (zh) | 一种产品推荐方法、装置、介质及设备 | |
Zhao et al. | Characterizing and learning representation on customer contact journeys in cellular services | |
Shi et al. | Recommender system for telecom packages based on the deep & cross network | |
Rajarajeshwari et al. | A Naïve Bayes Model using Semi-Supervised Parameters for Enhancing the Performance of Text Analytics | |
Stanhope et al. | Group link prediction | |
Bharathi et al. | Twitter Text Sentiment Analysis of Amazon Unlocked Mobile Reviews Using Supervised Learning Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |