CN112449240A - 一种基于互联网电视使用行为的用户流失预测方法及终端 - Google Patents

一种基于互联网电视使用行为的用户流失预测方法及终端 Download PDF

Info

Publication number
CN112449240A
CN112449240A CN202011247722.9A CN202011247722A CN112449240A CN 112449240 A CN112449240 A CN 112449240A CN 202011247722 A CN202011247722 A CN 202011247722A CN 112449240 A CN112449240 A CN 112449240A
Authority
CN
China
Prior art keywords
matrix
program
user
constructing
usage behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011247722.9A
Other languages
English (en)
Other versions
CN112449240B (zh
Inventor
程光剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Yifang Technology Co ltd
Original Assignee
Easy City Square Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Easy City Square Network Technology Co ltd filed Critical Easy City Square Network Technology Co ltd
Priority to CN202011247722.9A priority Critical patent/CN112449240B/zh
Publication of CN112449240A publication Critical patent/CN112449240A/zh
Application granted granted Critical
Publication of CN112449240B publication Critical patent/CN112449240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Social Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种基于互联网电视使用行为的用户流失预测方法及终端,所述方法包括:获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;获取用户的观影行为数据,构建节目偏好矩阵;将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。本发明通过采集预设周期内不同时段的节目信息提高了特征个数,可以获取丰富的用户行为特征数据,提高了电视用户流失预测的准确度。

Description

一种基于互联网电视使用行为的用户流失预测方法及终端
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于互联网电视使用行为的用户流失预测方法及终端。
背景技术
在现有的针对电视用户流失预测的模型方法中,大部分都是提取用户地域、性别、年龄等基础属性、以及观看节目的次数和时长与节目的类别属性作为预测模型中的特征,最后预测得到各个用户在未来一段时间不使用电视的概率,这种方法提取的特征较为基础,无法获取丰富的用户行为特征数据。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种基于互联网电视使用行为的用户流失预测方法及终端,旨在解决现有技术中无法准确预测电视用户流失的问题。
为实现上述目的,本发明提供一种基于互联网电视使用行为的用户流失预测方法,所述基于互联网电视使用行为的用户流失预测方法包括如下步骤:
获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;
获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;
获取用户的观影行为数据,构建节目偏好矩阵;
将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵,具体包括:
获取用户的基本属性特征,按预设周期统计用户在周期内的各时段是否处于开机的开机信息;
根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i
其中,m为用户数,i为用户维度提取的特征个数。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述基本属性特征包括:用户地域、年龄和性别。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵,具体包括:
基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理,得到节目矩阵a2m×j
其中,m为用户数,j为节目简介特征个数;
通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k
其中,m为用户数,k为用户维度提取的特征个数。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述通过聚类算法将所述节目矩阵a2m×j进行降维处理,具体包括:
随机从所述节目矩阵矩阵a2m×j选取k列特征作为初始聚类中心c1、c2、...、ck
计算所述节目矩阵a2m×j中一个特征与当前聚类中心的最短距离,将该特征归入最短距离所在的类中,将每个类别中心更新为隶属于该类别的所有特征的均值;
计算所述节目矩阵a2m×j中剩余特征与当前聚类中心的最短距离,直到类别中心的变化小于某个阈值,最后得到节目简介矩阵a3m×k,其中,k<j。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述获取用户的观影行为数据,构建节目偏好矩阵,具体包括:
统计预设周期内用户所有节目观看的日均时长和日均次数,提取用户的日均时长和日均次数;
根据所述日均时长和所述日均次数构建节目偏好矩阵a3m×l
其中,m为用户数,l用户节目偏好维度提取的特征个数。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率,具体包括:
将所述用户矩阵a1m×i、所述节目简介矩阵a3m×k和所述节目偏好矩阵a3m×l合并成计算矩阵am×n
其中,m为用户数,n为总特征个数,n=i+k+l;
根据所述计算矩阵,通过预测模型预测各个用户在未来一段时间的流失概率。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述预设周期为24小时。
此外,为实现上述目的,本发明还提供一种终端,其中,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于互联网电视使用行为的用户流失预测程序,所述基于互联网电视使用行为的用户流失预测程序被所述处理器执行时实现如上所述的基于互联网电视使用行为的用户流失预测方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,其中,所述存储介质存储有基于互联网电视使用行为的用户流失预测程序,所述基于互联网电视使用行为的用户流失预测程序被处理器执行时实现如上所述的基于互联网电视使用行为的用户流失预测方法的步骤。
本发明通过实时读取视屏像素亮度参数,所述视屏像素亮度参数为屏幕中每个像素的颜色和亮度参数;比对设定时间内视屏区域视屏像素亮度参数的变化,确定固定台标区域;调整所述固定台标区域的像素亮度,并对所述固定台标区域进行边缘化处理。本发明通过实时检测播放画面中的固定台标区域,降低确定后的固定台标区域的像素亮度,并对固定台标区域进行边缘化处理,弱化固定台标区域的边界,消除OLED屏幕电视由于长时间播放在固定台标区域产生的静态残影,提高画面播放质量。
附图说明
图1是本发明基于互联网电视使用行为的用户流失预测方法的较佳实施例的流程图;
图2是本发明基于互联网电视使用行为的用户流失预测方法的较佳实施例中构建各个矩阵的示意图;
图3为本发明终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的基于互联网电视使用行为的用户流失预测方法,如图1和图2所示,所述基于互联网电视使用行为的用户流失预测方法包括以下步骤:
步骤S10、获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵。
具体地,获取用户的基本属性特征,按预设周期(例如24小时,即本发明中的预设周期优选为24小时)统计用户在周期内的各时段是否处于开机(开机则对应时段加一)的开机信息;根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i;其中,m为用户数,i为用户维度提取的特征个数。
其中,所述基本属性特征包括:用户地域、年龄和性别,当然还可以包括其他相关信息。
步骤S20、获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵。
具体地,基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理(即进行TF-IDF分词向量化),得到节目矩阵a2m×j;其中,m为用户数,j为节目简介特征个数;通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k;其中,m为用户数,k为用户维度提取的特征个数。
首先将每个用户在预设周期内观看的所有节目合并,并关联该包含节目的演员、节目分类属性在内的简介组成一个单独的维度,接下来对该维度进行切分成一个个词语的形式,分词之后去除诸如“我们”、“是”、“的”之类的停用词,获取词频最多的j个词,使用如下公式进行特征选择:
Figure BDA0002770602420000061
最后得到节目矩阵a2m×j
例如,如:某个用户观看过《天行九歌》,则得到该节目的“赵路,吴磊,黄莺,谢添天,洪海天,翟巍,刘钦,陶典,动漫|地区|国漫,战国末年,七国最弱的韩国危若累卵,对外有强邻秦国步步紧逼,国内又有大将军姬无夜为首的“夜幕”几乎操控整个韩国;秦国大兵压境,韩国危在旦夕;此刻正是朝野上下一心、同仇敌忾之时,却发生了一件离奇诡谲的案件,大雨倾盆中军饷神秘消失,涉案之人先后死于非命;终案件落到了韩国相国之孙张良手中;韩非,这个别人眼中的纨绔子弟,竟自愿卷入这场权力的游戏之中;前路危险莫测,敌人强大而狡猾”构成的内容,将该内容切分成一个个词语并去除停用词后有“赵路、吴磊、黄莺、谢添天、洪海天、翟巍、刘钦、陶典、动漫、地区、国漫、战国末年、七国、最弱、韩国、危若累卵、强邻、秦国、步步紧逼、国内、大将军、姬无夜、夜幕、操控、整个、韩国、秦国、大兵压境、韩国、危在旦夕...”,按公式计算该用户在整体中各词频的特征向量[lable,,features]=[0.0,i1,i2,i3,...ij],i代表该用户序号,j代表提取的特征个数。
进一步地,由于通过TF-IDF方法提取的特征维度一般较大且为稀疏矩阵,特征数量太多,模型的训练时间大幅增加和模型的泛化能力下降,因此在进行模型训练之前使用聚类算法将矩阵a2m×j进行降维,方法如下:
步骤一:随机从矩阵a2m×j选取k列特征作为初始聚类中心c1、c2、...、ck
步骤二:计算节目矩阵a2m×j中每个特征与当前聚类中心的最短距离,将该特征归入最短距离所在的类中,将每个类别中心更新为隶属于该类别的所有特征的均值。
步骤三:重复步骤二,直到类别中心的变化小于某个阈值,最后得到节目简介矩阵a3m×k,其中,m为用户数,k为用户维度提取的特征个数,k<j。
步骤S30、获取用户的观影行为数据,构建节目偏好矩阵。
具体地,统计预设周期内用户所有节目观看的日均时长和日均次数,提取用户的日均时长和日均次数;根据所述日均时长和所述日均次数构建节目偏好矩阵a3m×l;其中,m为用户数,l用户节目偏好维度提取的特征个数。
步骤S40、将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。
具体地,将所述用户矩阵a1m×i、所述节目简介矩阵a3m×k和所述节目偏好矩阵a3m×l合并成计算矩阵am×n;其中,m为用户数,n为总特征个数,n=i+k+l;根据所述计算矩阵,通过预测模型(本发明选择随机森林算法,该算法是利用多个决策树对样本进行训练、分类并预测的一种算法,在对数据进行分类的同时,还可以给出各个变量的重要性评分,评估各个变量在分类中所起的作用)预测各个用户在未来一段时间的流失概率。
本发明相对已有的智能电视用户流失预测模型,采用提取用户24小时不同时段及节目补充信息以提高特征个数的方法,能够提取到丰富的特征提高模型的准确率、精确率和召回率;同时在提取特征的过程中使用聚类算法能有效的减少模型的计算时间和资源;进而提高流失用户预测精度。
进一步地,如图3所示,基于上述基于互联网电视使用行为的用户流失预测方法,本发明还相应提供了一种终端,所述终端包括处理器10、存储器20及显示器30。图3仅示出了终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述终端的内部存储单元,例如终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述终端的应用软件及各类数据,例如所述安装终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有基于互联网电视使用行为的用户流失预测程序40,该基于互联网电视使用行为的用户流失预测程序40可被处理器10所执行,从而实现本申请中基于互联网电视使用行为的用户流失预测方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述基于互联网电视使用行为的用户流失预测方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述终端的信息以及用于显示可视化的用户界面。所述终端的部件10-30通过系统总线相互通信。
在一实施例中,当处理器10执行所述存储器20中基于互联网电视使用行为的用户流失预测程序40时实现以下步骤:
获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;
获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;
获取用户的观影行为数据,构建节目偏好矩阵;
将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。
其中,所述获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵,具体包括:
获取用户的基本属性特征,按预设周期统计用户在周期内的各时段是否处于开机的开机信息;
根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i
其中,m为用户数,i为用户维度提取的特征个数。
其中,所述基本属性特征包括:用户地域、年龄和性别。
其中,所述获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵,具体包括:
基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理,得到节目矩阵a2m×j
其中,m为用户数,j为节目简介特征个数;
通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k
其中,m为用户数,k为用户维度提取的特征个数。
其中,所述通过聚类算法将所述节目矩阵a2m×j进行降维处理,具体包括:
随机从所述节目矩阵矩阵a2m×j选取k列特征作为初始聚类中心c1、c2、...、ck
计算所述节目矩阵a2m×j中一个特征与当前聚类中心的最短距离,将该特征归入最短距离所在的类中,将每个类别中心更新为隶属于该类别的所有特征的均值;
计算所述节目矩阵a2m×j中剩余特征与当前聚类中心的最短距离,直到类别中心的变化小于某个阈值,最后得到节目简介矩阵a3m×k,其中,k<j。
其中,所述获取用户的观影行为数据,构建节目偏好矩阵,具体包括:
统计预设周期内用户所有节目观看的日均时长和日均次数,提取用户的日均时长和日均次数;
根据所述日均时长和所述日均次数构建节目偏好矩阵a3m×l
其中,m为用户数,l用户节目偏好维度提取的特征个数。
其中,所述将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率,具体包括:
将所述用户矩阵a1m×i、所述节目简介矩阵a3m×k和所述节目偏好矩阵a3m×l合并成计算矩阵am×n
其中,m为用户数,n为总特征个数,n=i+k+l;
根据所述计算矩阵,通过预测模型预测各个用户在未来一段时间的流失概率。
其中,所述预设周期为24小时。
本发明还提供一种存储介质,其中,所述存储介质存储有基于互联网电视使用行为的用户流失预测程序,所述基于互联网电视使用行为的用户流失预测程序被处理器执行时实现如上所述的基于互联网电视使用行为的用户流失预测方法的步骤。
综上所述,本发明提供一种基于互联网电视使用行为的用户流失预测方法及终端,所述方法包括:实时读取视屏像素亮度参数,所述视屏像素亮度参数为屏幕中每个像素的颜色和亮度参数;比对设定时间内视屏区域视屏像素亮度参数的变化,确定固定台标区域;调整所述固定台标区域的像素亮度,并对所述固定台标区域进行边缘化处理。本发明通过实时检测播放画面中的固定台标区域,降低确定后的固定台标区域的像素亮度,并对固定台标区域进行边缘化处理,弱化固定台标区域的边界,消除OLED屏幕电视由于长时间播放在固定台标区域产生的静态残影,提高画面播放质量。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于互联网电视使用行为的用户流失预测方法,其特征在于,所述基于互联网电视使用行为的用户流失预测方法包括:
获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;
获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;
获取用户的观影行为数据,构建节目偏好矩阵;
将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。
2.根据权利要求1所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵,具体包括:
获取用户的基本属性特征,按预设周期统计用户在周期内的各时段是否处于开机的开机信息;
根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i
其中,m为用户数,i为用户维度提取的特征个数。
3.根据权利要求2所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述基本属性特征包括:用户地域、年龄和性别。
4.根据权利要求2所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵,具体包括:
基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理,得到节目矩阵a2m×j
其中,m为用户数,j为节目简介特征个数;
通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k
其中,m为用户数,k为用户维度提取的特征个数。
5.根据权利要求4所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述通过聚类算法将所述节目矩阵a2m×j进行降维处理,具体包括:
随机从所述节目矩阵矩阵a2m×j选取k列特征作为初始聚类中心c1、c2、...、ck
计算所述节目矩阵a2m×j中一个特征与当前聚类中心的最短距离,将该特征归入最短距离所在的类中,将每个类别中心更新为隶属于该类别的所有特征的均值;
计算所述节目矩阵a2m×j中剩余特征与当前聚类中心的最短距离,直到类别中心的变化小于某个阈值,最后得到节目简介矩阵a3m×k,其中,k<j。
6.根据权利要求4所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述获取用户的观影行为数据,构建节目偏好矩阵,具体包括:
统计预设周期内用户所有节目观看的日均时长和日均次数,提取用户的日均时长和日均次数;
根据所述日均时长和所述日均次数构建节目偏好矩阵a3m×l
其中,m为用户数,l用户节目偏好维度提取的特征个数。
7.根据权利要求6所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率,具体包括:
将所述用户矩阵a1m×i、所述节目简介矩阵a3m×k和所述节目偏好矩阵a3m×l合并成计算矩阵am×n
其中,m为用户数,n为总特征个数,n=i+k+l;
根据所述计算矩阵,通过预测模型预测各个用户在未来一段时间的流失概率。
8.根据权利要求1-7任一项所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述预设周期为24小时。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于互联网电视使用行为的用户流失预测程序,所述基于互联网电视使用行为的用户流失预测程序被所述处理器执行时实现如权利要求1-8任一项所述的基于互联网电视使用行为的用户流失预测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有基于互联网电视使用行为的用户流失预测程序,所述基于互联网电视使用行为的用户流失预测程序被处理器执行时实现如权利要求1-8任一项所述的基于互联网电视使用行为的用户流失预测方法的步骤。
CN202011247722.9A 2020-11-10 2020-11-10 一种基于互联网电视使用行为的用户流失预测方法及终端 Active CN112449240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011247722.9A CN112449240B (zh) 2020-11-10 2020-11-10 一种基于互联网电视使用行为的用户流失预测方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011247722.9A CN112449240B (zh) 2020-11-10 2020-11-10 一种基于互联网电视使用行为的用户流失预测方法及终端

Publications (2)

Publication Number Publication Date
CN112449240A true CN112449240A (zh) 2021-03-05
CN112449240B CN112449240B (zh) 2022-12-06

Family

ID=74736390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011247722.9A Active CN112449240B (zh) 2020-11-10 2020-11-10 一种基于互联网电视使用行为的用户流失预测方法及终端

Country Status (1)

Country Link
CN (1) CN112449240B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529714A (zh) * 2016-11-03 2017-03-22 大唐融合通信股份有限公司 一种用户流失的预测方法及系统
CN107894998A (zh) * 2017-10-24 2018-04-10 迅雷计算机(深圳)有限公司 视频推荐方法及装置
WO2018112696A1 (zh) * 2016-12-19 2018-06-28 深圳大学 一种内容推荐方法及内容推荐系统
CN111460251A (zh) * 2020-03-10 2020-07-28 平安科技(深圳)有限公司 数据内容个性化推送冷启动方法、装置、设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529714A (zh) * 2016-11-03 2017-03-22 大唐融合通信股份有限公司 一种用户流失的预测方法及系统
WO2018112696A1 (zh) * 2016-12-19 2018-06-28 深圳大学 一种内容推荐方法及内容推荐系统
CN107894998A (zh) * 2017-10-24 2018-04-10 迅雷计算机(深圳)有限公司 视频推荐方法及装置
CN111460251A (zh) * 2020-03-10 2020-07-28 平安科技(深圳)有限公司 数据内容个性化推送冷启动方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN112449240B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN111566646B (zh) 用于对数据进行混淆和解码的电子装置以及用于控制该电子装置的方法
US8605957B2 (en) Face clustering device, face clustering method, and program
CN112836120A (zh) 一种基于多模态知识图谱的电影推荐方法、系统及终端
US11451875B2 (en) Machine learning-based approach to demographic attribute inference using time-sensitive features
CN110365994B (zh) 直播推荐方法、装置、服务器及可读存储介质
CN112632403B (zh) 推荐模型的训练方法、推荐方法、装置、设备和介质
CN111143613B (zh) 选择视频封面的方法、系统、电子设备与存储介质
CN110288513B (zh) 用于改变人脸属性的方法、装置、设备和存储介质
CN111652378B (zh) 学习来选择类别特征的词汇
CN110008997B (zh) 图像纹理相似度识别方法、装置及计算机可读存储介质
CN111382605B (zh) 视频内容审核方法、装置、存储介质和计算机设备
JP2012208710A (ja) 属性推定装置
EP3905179A1 (en) Product recommendation method, product recommendation system and storage medium
KR20150066193A (ko) 디스플레이장치, 디스플레이시스템 및 그 검색결과 제공방법
CN103455741A (zh) 一种基于字符的在线笔迹认证的模板扩充方法
US10853417B2 (en) Generating a platform-based representative image for a digital video
CN112270384B (zh) 一种回环检测方法、装置及电子设备和存储介质
CN112449240A (zh) 一种基于互联网电视使用行为的用户流失预测方法及终端
CN115935049A (zh) 基于人工智能的推荐处理方法、装置及电子设备
CN110662117B (zh) 一种内容推荐方法、智能电视及存储介质
GB2576938A (en) System and method for improved content discovery
US9648112B2 (en) Electronic device and method for setting network model
CN112492397A (zh) 视频处理方法、计算机设备和存储介质
CN113395584A (zh) 一种视频数据处理方法、装置、设备以及介质
CN117633356A (zh) 基于大语言模型的资源处理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518057 area a, 21 / F, Konka R & D building, 28 Keji South 12 road, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Chongqing Yifang Technology Co.,Ltd.

Address before: 518057 area a, 21 / F, Konka R & D building, 28 Keji South 12 road, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: Easy city square network technology Co.,Ltd.