CN113852864A - 一种面向iptv终端应用的用户定制化服务推荐方法及系统 - Google Patents
一种面向iptv终端应用的用户定制化服务推荐方法及系统 Download PDFInfo
- Publication number
- CN113852864A CN113852864A CN202110671425.5A CN202110671425A CN113852864A CN 113852864 A CN113852864 A CN 113852864A CN 202110671425 A CN202110671425 A CN 202110671425A CN 113852864 A CN113852864 A CN 113852864A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- information
- module
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000006243 chemical reaction Methods 0.000 claims abstract description 21
- 238000004140 cleaning Methods 0.000 claims abstract description 15
- 230000006399 behavior Effects 0.000 claims abstract description 13
- 238000013135 deep learning Methods 0.000 claims abstract description 10
- 238000013075 data extraction Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012706 support-vector machine Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 230000000306 recurrent effect Effects 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
- H04N21/4665—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms involving classification methods, e.g. Decision trees
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
- H04N21/4666—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Social Psychology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明涉及一种面向IPTV终端应用的用户定制化服务推荐方法及系统。由用户数据获取模块通过在IPTV终端应用中进行数据埋点,采集用户原始行为数据,并处理成日志数据;由数据清洗模块将日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载;由用户群划分模块利用清洗后的数据通过深度学习将各用户按用户群体进行划分;以及由个性化推送模块,针对所划分的用户群体,将来自资源库的资源进行分类推送。本发明解决用户信息获取、用户画像、用户分类以及个性化服务推荐的相关问题,可提高用户的使用满意度,增强用户粘性。
Description
技术领域
本发明涉及智能电视领域,尤其涉及基于大数据分析技术和智能推荐技术的一种面向IPTV终端应用的用户定制化服务推荐方法及系统。
背景技术
随着互联网技术的不断发展,智能家电的普及,尤其是随着超高清视频技术的飞速提升,智能电视终端已经成为很多家庭必不可少的家电设备。智能电视终端为用户带来了前所未有的观感体验和群聚效应。
IPTV应用由于其可以提供高速、超高清的播放效果和优质片源的引进等特性,已成为目前智能电视终端的核心应用,用户量在不断激增。IPTV可以提供多种智能应用,包括少儿专题、游戏专区、影视专栏、商城等应用入口。其中视频播放是IPTV的核心功能,也是用户选择IPTV产品的根本价值。针对庞大的用户群体,如何有效收集用户行为信息,为用户实现个性化的服务,从而提升用户的使用体验,一直是IPTV业务供应商所要面对的重中之重。目前的视频推荐,主要是对当前热片以及最新上映视频的推送,推荐视频专区功能比较固定,不够灵活。由于每个用户的观影喜好和观影习惯不同,针对全部用户使用相同的推送方案,必然会降低用户使用体验。
亟须一种能够采集更全面的用户信息,尤其是核心数据,并对数据流进行清洗,从而对用户进行全方位的个性化个性推荐的方法和系统,才可以提高用户满意度,增强用户粘性。
发明内容
提供本发明内容以便以简化形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识出所要求保护的主题的关键特征或必要特征;也不旨在用于确定或限制所要求保护的主题的范围。
本发明针对IPTV产品的特点,通过在IPTV收视界面进行功能性埋点,即对用户的使用行为作出对应的埋点事件,从而对用户进行全方位的信息采集,将采集的信息数据及时输入Hive数据仓库,完成快速的数据清洗,弃除用户数据中包含的无关信息及恶意用户的信息干扰,针对清洗后的数据结合深度学习中的智能分类算法,对用户群体进行划分。
本发明的个性化推荐系统包括:用户数据获取模块、数据清洗模块、用户群划分模块、个性化推送模块。其中:
·用户数据获取模块通过在IPTV终端应用中进行数据埋点,包括在用户触发操作时向数据清洗模块上传事件日志,来采集用户原始行为数据,将获取的用户信息、事件信息、资源信息分离,并处理成日志数据。
·数据清洗模块采用了数据仓库分层架构,包括原始数据的录入层、数据转换层、应用展示层。数据清洗模块将日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载。
·用户群划分模块利用清洗后的数据通过深度学习将各用户按用户群体进行划分。
·个性化推送模块针对所划分的用户群体,将来自资源库的资源进行分类推送。
本发明的个性化推荐方法包括:在用户终端应用中进行埋点,获取用户原始数据,并将所获取的用户原始数据整理成日志数据;将日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载;利用清洗后的数据通过深度学习进行用户群划分,包括采用支持向量机SVM+K-Means聚类的方法进行分类,并可进一步包括使用深度神经网络DNN,由对应的卷积神经网络CNN和循环神经网络RNN相结合,获得分类标签,根据标签进行用户群划分,对已经划分出来的用户群体还可以进行动态权重调整,结合规定的阈值完成群体划分;针对所划分的各用户群体,将来自资源库的资源进行分类并对用户进行个性化推送;继续实时收集用户数据,并根据用户播放数变化,确定推送是否成功,在不成功的情况下,进行动态调整。
其中,将日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载包括以下步骤:在原始数据的录入层,将用户信息、事件信息、资源信息分别录入不同的原始数据的录入层的数据表内;在数据转换层,将所需的信息从录入层的数据表内抽离,并进行数据关联,将产生的数据录入数据转换层的数据表内;以及在应用展示层,进一步抽取数据转换层的数据表中的数据,获取完整信息。
本发明解决用户信息获取、用户画像、用户分类以及个性化服务推荐的相关问题,提高用户的使用满意度,增强用户粘性。
通过阅读下面的详细描述并参考相关联的附图,这些及其他特点和优点将变得显而易见。应该理解,前面的概括说明和下面的详细描述只是说明性的,不会对所要求保护的各方面形成限制。
附图说明
以下将通过参考附图中示出的具体实施例来对本发明进行更具体描述。
图1示出了本发明的面向IPTV终端应用的用户定制化服务推荐系统的示意框图;
图2示出了本发明的面向IPTV终端应用的用户定制化服务推荐方法的流程图。
附图中的流程图和框图显示了根据本申请的实施例的系统、方法可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
具体实施方式
以下将通过参考附图中示出的具体实施例来对本发明进行更具体描述。通过阅读下文具体实施方式的详细描述,本发明的各种优点和益处对于本领域普通技术人员将变得清楚明了。然而应当理解,可以以各种形式实现本发明而不应被这里阐述的各实施方式所限制。提供以下实施方式是为了能够更透彻地理解本发明。除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
图1示出了本发明的面向IPTV终端应用的用户定制化服务推荐系统。
该系统包括:用户数据获取模块101、数据清洗模块102、用户群划分模块103以及个性化推送模块104。其中:
用户数据获取模块101:负责IPTV终端应用的数据埋点,采集用户的原始行为数据,并将原始用户数据处理成日志数据,并将日志数据发送给数据清洗模块102。在此,埋点操作是指,当用户触发某类操作时(例如开始/结束视频播放时)向服务器端上传一条事件日志。
数据清洗模块102:将从用户数据获取模块101接收到的日志数据按照指定格式录入已建立好的Hive数据仓库中,完成数据提取、数据转换、数据加载,最终生成已经清洗好的应用层数据,并将其发送到用户群划分模块103。
用户群划分模块103:对从数据清洗模块102接收到的已经清洗好的应用层数据,按照深度学习中的方法实现用户群体的划分,划分出1-N个用户群,并将对应用户划分到对应的用户群体内。可以理解一个用户可以被同时分配到若干个不同的用户群体。
个性化推送模块104:从用户群划分模块103接受用户和用户群体的对应关系,同时对来自资源库的数据进行分类,按照不同的用户群进行推送,在将推荐信息发送给用户后根据用户实时的反馈效果来进行动态调整。在此,资源库中可以是视频或者是商城产品等信息。
本发明的系统中的用户数据获取模块101通常在IPTV终端处实现,而另外三个模块通常可在服务器端实现。
图2示出了本发明的面向IPTV终端应用的用户定制化服务推荐方法的流程图。该方法包括:
在步骤S201,获取用户原始数据。
通过在IPTV端用户界面进行埋点,采集用户的原始数据采集,并将原始用户数据处理成日志数据。为了提高运算效率同时减少数据清洗的复杂度,可在IPTV端应用页面上的各种事件独立埋点。
为了对用户和用户行为进行更好的分离,将对应的用户信息和用户操作事件信息分离开。
本发明的用户信息设计结构设计如下表1所示:
字段位置 | 字段说明 |
1 | 用户账号 |
2 | 用户注册时间 |
3 | 用户登录时间 |
4 | 用户会话标识Session ID |
5 | 用户基本信息 |
6 | 其他 |
本发明的事件信息设计结构如下表2所示:
字段位置 | 字段说明 |
1 | 用户账号 |
2 | 用户Session ID |
3 | 事件名称,如“视频播放”,“视频结束播放” |
4 | 事件触发时间 |
5 | 资源标识Source ID |
6 | 其他 |
本发明的对应资源ID信息设计结构如下表3所示:
字段位置 | 字段说明 |
1 | 资源Source ID |
2 | 资源类别 |
3 | 资源上线时间 |
4 | 资源出版时间 |
5 | 资源评分 |
6 | 其他 |
根据本发明的一个实施例,对于“视频播放”事件只有当用户点击操作时进行上传。该方案将用户、操作事件、资源这三个部分剥离,可以极大的降低数据的耦合性,用户一次登录周期内的上传一次用户数据,而且对应的Session ID也唯一。
这种设计既可以方便快速统计不同周期内的日活跃用户和月活跃用户,进行用户留存等分析,还可以将用户与其对应的操作关联起来。这样既可以提高运算效率同时也可以减少数据清洗的复杂度。
接着在步骤S202,进行用户行为数据清洗。
通过将对应的用户日志数据写入到Hive数据仓库中进行数据清洗。
由于用户数量庞大,平均用户操作量多,会导致用户操作日志数据的增多。为了更好地进行数据的清洗,提高数据处理速度,本发明采用Hive来建立数据仓库,并完成数据提取、数据转换、数据加载,整个ETL(Extract-Transform-Load)流程。
考虑到用户数据的原始特性,本发明采用了经典数据仓库分层架构,主要包含有3个层次,分别是原始数据的录入层ods层、数据转换层dwd层以及最终的应用展示层ads层。
(1)在原始数据的录入ods层,将原始的用户信息,用户操作事件信息,对应的资源信息分别录入不同的ods层数据表内,即ods_user、ods_event和ods_source这三个表内;
(2)在数据转换dwd层,可以将所需的信息从表内抽离,例如需要播放视频时长,可以通过将ods_event中的相同Session ID和Source ID来关联,然后取“播放结束”事件的发生时间减去“播放开始”事件的发生时间,即可获得。同时还可以将ods_user中的数据和ods_event中的数据通过Session ID来进行关联,获取对应的用户操作行为,将产生的数据录入到dwd_user_event等表格中;
(3)在应用展示ads层,对dwd层的数据进行进一步抽取,例如通过对dwd_user_event该表格进行进一步计算,并且与ods_source关联,可以获得不同的用户数据录入ads_user_videoplay,ads_user_videoplaynumbers等表格。可以精确的获取到用户的如下的完整信息:
[用户名,播放id,播放时间长,播放次数,登录时长…]
通过在Hive数据仓库中进行数据清洗,可以极大降低计算的复杂度,提高数据分析的效率。
在步骤S203,进行用户群划分。
采用了深度学习方法来对ads层获取的用户特征信息进行划分,降低人为划分中的人工干扰因素。
在深度学习中,针对数据分类划分通常可以分为有监督学习和无监督学习。通常有监督学习划分更为精准,因此在用户推荐环境中,有监督学习方法更为合适。因此本发明的具体过程采用有监督的深度方法来进行用户群的划分。具体如下:
(1)首先对Hive数据仓库中的ads层用户数据进行有监督分类,为了更好地进行用户分类,采用支持向量机SVM+K-Means聚类的方法。
首先是对原始进行邻近算法KNN(K-NearestNeighbor)监督分类,ads层中用户的特征数据进行归一化,然后使用欧式距离作为距离衡量,如以下公式1所示:
通过不同用户之间的欧式距离,KNN可以把用户群体进行划分。
(2)为了降低单一学习分类的局限性,进一步采用多重方法来进行有效的用户群体划分。
因此对上面的用户数据,进一步采用支持向量机SVM(Support Vector Machine)进行监督分类,SVM主要使用高斯核密度函数进行用户群体线性划分,对应样本的分类如下公式:
其中γ为高斯核函数中的超参数。
(3)由于深度学习中深度神经网络有优异的学习特征,可以进一步使用深度神经网络DNN(Deep Neural Networks),其具体有对应的卷积神经网络CNN+循环神经网络RNN相结合,对应一个ads层的用户行为数据,可以得到一个分类标签label,该标签对应着一个用户所属的群体。
(4)由于采用了SVM+KNN+DNN的方法进行用户群体的划分,在划分的过程中会存在误差,加上需要对群体进行动态调整,因此接着针对用户所划分出来的群体进行动态权重调整,结合规定的阈值完成群体划分:
Use_Label=W1LabelKNN+W2LabelSVM+W3LabelDNN 公式3
其中W1,W2,W3分别是三个分类器的权重。在实际过程中,由于三种分类器的效果会有较大差异,DNN的分析结果较为突出,SVM次之,KNN结果最差。因此针对(W1,W2,W3)个分类器的对应的权重为(0.2,0.3,0.5)。Use_Label等于对这三者结合的结果取整。
通过用户群体划分后,可以将用户划分成不同的用户群体,针对不同群体内的用户进行资源推送。
在步骤S204,向用户进行个性化推送,并实时进行动态调整,可实现符合用户需求的个性化推送。推送策略如下:
(1)在进行用户分群后,根据用户群内的用户类别,推送指定的资源类别。推送后,继续实时收集用户数据,如果发现用户播放数增加,则说明该推送成功;如果用户播放量反而下降,则说明推送并不成功,需要对该资源的分类进行实时调整;
(2)针对用户所查看的资源的发行时间和播放次数进行指定推送,如果观看的资源的发行时间早且播放次数多,则在预定时间间隔内可重复推送该资源;如果用户观看资源发行时间晚且无重复播放记录,则尽最大粒度推送最新的资源;
(3)针对划分到同一群体的用户,可以把同群体内其它用户播放过的资源可以推送给未观看过该资源的用户,实现群内的资源推送,增加用户粘度;
(4)在用户分群后,还可以根据用户播放时长法,次数来划分异常用户。如果某用户多天多次播放不同资源,且每个播放时长小于预定阈值,则该用户可能为异常用户,需要及时进行关注反馈,此时可发出异常提醒。如当前用户某天播放视频超过50次,且每次播放时长都小于既定的1分钟,那么该用户及判定为异常用户,需要对该用户的完整使用行为进行全量的分析。
以上以视频为例作了说明,该方法和系统还可以扩展到电视机端其他的应用中,完成除视频以外其它指定功能应用的用户服务推荐,例如,商城产品有针对性地售卖等。
同时可以结合Hive数仓中每层用户操作转化,进行用户漏斗分析,来对用户的操作转化进行分析。例如,在ods层获取用户的基本属性,通过分析dwd层进入主页的用户数据,然后根据该用户信息来查询ads层的订购会员用户数据,即可完成用户订购的漏斗分析,及完成“访问主页”到“订购会员”用户转化率的计算。
本发明的面向IPTV终端应用的用户个性化服务推荐方法及系统通过既定的埋点数据采集和Hive数据清洗划分,可以实现精准的用户分群,完成高精度的用户资源推送。并可在使用过程中不断实时收集用户行为数据,根据推送的结果反馈,动态地进行用户群体的调整,不断提高推送资源的精准度。
本发明提供了更加精细的用户画像,动态还原用户的行为习惯,从而可以对用户进行更加精准的推荐和有针对性的产品营销,满足用户视频观看或产品使用需求。
以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。
Claims (10)
1.一种个性化推荐系统,包括:
用户数据获取模块,用于通过在IPTV终端应用中进行数据埋点,采集用户原始行为数据,并处理成日志数据;
数据清洗模块,将所述日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载;
用户群划分模块,利用清洗后的数据通过深度学习将各用户按用户群体进行划分;以及
个性化推送模块,针对所划分的用户群体,将来自资源库的资源进行分类推送。
2.如权利要求1所述的个性化推荐系统,其特征在于:所述埋点包括在用户触发操作时向所述数据清洗模块上传事件日志。
3.如权利要求1所述的个性化推荐系统,其特征在于:所述用户数据获取模块将获取的用户信息、事件信息、资源信息分离,其中:
所述用户信息包括账号、注册时间、登录时间、会话标识中的一种或多种,
所述事件信息包括事件名称、事件触发事件、资源标识中的一种或多种,以及
所述资源信息包括资源类别、资源出版时间、资源上线时间、资源评分中的一种或多种。
4.如权利要求1所述的个性化推荐系统,其特征在于,所述数据清洗模块采用了数据仓库分层架构,包括原始数据的录入层、数据转换层、应用展示层。
5.一种个性化推荐方法,包括:
在用户终端应用中进行埋点,获取用户原始数据,并将所获取的用户原始数据整理成日志数据;
将所述日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载;
利用清洗后的数据通过深度学习进行用户群划分;以及
针对所划分的各用户群体,将来自资源库的资源进行分类并对用户进行个性化推送。
6.如权利要求5所述的个性化推荐方法,其特征在于,进一步包括在所述推送之后继续实时收集用户数据,并根据用户播放数变化,确定推送是否成功,在不成功的情况下,进行动态调整。
7.如权利要求5所述的个性化推荐方法,其特征在于,将所述日志数据录入Hive数据仓库,完成数据提取、数据转换、数据加载包括以下步骤:
在原始数据的录入层,将用户信息、事件信息、资源信息分别录入不同的原始数据的录入层的数据表内;
在数据转换层,将所需的信息从所述录入层的数据表内抽离,并进行数据关联,将产生的数据录入数据转换层的数据表内;以及
在应用展示层,进一步抽取所述数据转换层的数据表中的数据,获取完整信息。
8.如权利要求7所述的个性化推荐方法,其特征在于,进行用户群划分包括采用支持向量机SVM+K-Means聚类的方法进行分类,包括:
将所述完整信息中的特征数据进行归一化,使用邻近算法KNN监督分类,将各用户之间的欧式距离做完衡量进行用户群划分。
9.如权利要求8所述的个性化推荐方法,其特征在于,进一步包括使用深度神经网络DNN,由对应的卷积神经网络CNN和循环神经网络RNN相结合,获得分类标签,根据所述标签进行用户群划分。
10.如权利要求9所述的个性化推荐方法,其特征在于,进一步包括对已经划分出来的用户群体进行动态权重调整,结合规定的阈值完成群体划分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110671425.5A CN113852864A (zh) | 2021-06-17 | 2021-06-17 | 一种面向iptv终端应用的用户定制化服务推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110671425.5A CN113852864A (zh) | 2021-06-17 | 2021-06-17 | 一种面向iptv终端应用的用户定制化服务推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113852864A true CN113852864A (zh) | 2021-12-28 |
Family
ID=78973027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110671425.5A Pending CN113852864A (zh) | 2021-06-17 | 2021-06-17 | 一种面向iptv终端应用的用户定制化服务推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113852864A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117354356A (zh) * | 2023-12-04 | 2024-01-05 | 四川才子软件信息网络有限公司 | 一种app区域留存统计方法、系统及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107360465A (zh) * | 2017-08-22 | 2017-11-17 | 四川长虹电器股份有限公司 | 一种智能电视终端利用声纹生成用户画像的方法 |
CN110489453A (zh) * | 2019-07-02 | 2019-11-22 | 广东工业大学 | 基于大数据日志分析的用户游戏实时推荐方法及系统 |
CN111191122A (zh) * | 2019-12-20 | 2020-05-22 | 重庆邮电大学 | 一种基于用户画像的学习资源推荐系统 |
CN112528103A (zh) * | 2019-09-19 | 2021-03-19 | 北京京东尚科信息技术有限公司 | 一种推荐对象的方法和装置 |
CN112667714A (zh) * | 2021-03-17 | 2021-04-16 | 腾讯科技(深圳)有限公司 | 基于深度学习的用户画像优化方法、装置及存储介质 |
CN112749729A (zh) * | 2019-10-31 | 2021-05-04 | 辉达公司 | 基于比较模型参数的精度训练机器学习模型的处理器和系统 |
-
2021
- 2021-06-17 CN CN202110671425.5A patent/CN113852864A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107360465A (zh) * | 2017-08-22 | 2017-11-17 | 四川长虹电器股份有限公司 | 一种智能电视终端利用声纹生成用户画像的方法 |
CN110489453A (zh) * | 2019-07-02 | 2019-11-22 | 广东工业大学 | 基于大数据日志分析的用户游戏实时推荐方法及系统 |
CN112528103A (zh) * | 2019-09-19 | 2021-03-19 | 北京京东尚科信息技术有限公司 | 一种推荐对象的方法和装置 |
CN112749729A (zh) * | 2019-10-31 | 2021-05-04 | 辉达公司 | 基于比较模型参数的精度训练机器学习模型的处理器和系统 |
CN111191122A (zh) * | 2019-12-20 | 2020-05-22 | 重庆邮电大学 | 一种基于用户画像的学习资源推荐系统 |
CN112667714A (zh) * | 2021-03-17 | 2021-04-16 | 腾讯科技(深圳)有限公司 | 基于深度学习的用户画像优化方法、装置及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117354356A (zh) * | 2023-12-04 | 2024-01-05 | 四川才子软件信息网络有限公司 | 一种app区域留存统计方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7154334B2 (ja) | ライブストリームコンテンツを推奨するための機械学習の使用 | |
CN104035982B (zh) | 多媒体资源推荐方法及装置 | |
CN110543598B (zh) | 信息推荐方法、装置及终端 | |
CN108875022B (zh) | 一种视频推荐方法及装置 | |
CN107888950A (zh) | 一种推荐视频的方法和系统 | |
CN110430471A (zh) | 一种基于瞬时计算的电视推荐方法和系统 | |
CA2520117A1 (en) | Generating audience analytics | |
CN108028962A (zh) | 处理视频使用情况信息以投放广告 | |
CN101482884A (zh) | 一种基于用户偏好评分分布的协作推荐系统 | |
CN103686231A (zh) | 影片的集成管理、失效替换与续播的方法及系统 | |
CN109429103B (zh) | 推荐信息的方法、装置及计算机可读存储介质、终端设备 | |
CN103686382A (zh) | 一种节目推荐方法 | |
CN104504059A (zh) | 多媒体资源推荐方法 | |
CN111026906B (zh) | 一种用于车载场景下的流式收听音频内容的推荐系统 | |
Arantes et al. | Understanding video-ad consumption on YouTube: a measurement study on user behavior, popularity, and content properties | |
CN102890950A (zh) | 媒体自动剪辑装置、方法、媒体播送方法与其播送系统 | |
CN109508407A (zh) | 融合时间与兴趣相似度的电视产品推荐方法 | |
US20170199930A1 (en) | Systems Methods Devices Circuits and Associated Computer Executable Code for Taste Profiling of Internet Users | |
CN107105030A (zh) | 推广内容推送方法及装置 | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN109391829A (zh) | 视频打点位置分析系统、分析方法及储存媒体 | |
CN109640128B (zh) | 一种电视用户观看行为特征提取方法及系统 | |
CN113852864A (zh) | 一种面向iptv终端应用的用户定制化服务推荐方法及系统 | |
CN109063080B (zh) | 一种视频推荐方法及装置 | |
CN108874813B (zh) | 一种信息处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220126 Address after: Room 1423, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai 200072 Applicant after: Tianyi Digital Life Technology Co.,Ltd. Address before: 201702 3rd floor, 158 Shuanglian Road, Qingpu District, Shanghai Applicant before: Tianyi Smart Family Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211228 |
|
RJ01 | Rejection of invention patent application after publication |