CN114707021A - 一种智能电视平台用户购买单点付费视频预测方法及系统 - Google Patents

一种智能电视平台用户购买单点付费视频预测方法及系统 Download PDF

Info

Publication number
CN114707021A
CN114707021A CN202210345066.9A CN202210345066A CN114707021A CN 114707021 A CN114707021 A CN 114707021A CN 202210345066 A CN202210345066 A CN 202210345066A CN 114707021 A CN114707021 A CN 114707021A
Authority
CN
China
Prior art keywords
video
watching
vector
purchase
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210345066.9A
Other languages
English (en)
Inventor
彭朝晖
王健
郝佳凝
郝振云
王雪
崔明宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202210345066.9A priority Critical patent/CN114707021A/zh
Publication of CN114707021A publication Critical patent/CN114707021A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开一种智能电视平台用户购买单点付费视频预测方法及系统,包括:对视频观看记录构建邻接图;对邻接图中每个视频节点构建视频嵌入向量;对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;根据观看兴趣特征和购买偏好特征对待推荐视频进行预测与推荐。对所有用户视频观看记录进行图的构建,解决单点付费视频记录较少而导致的嵌入向量表达不充分的问题。在视频嵌入向量和观看兴趣特征以及购买偏好特征的建模上均考虑了时间因素,使得预测结果更为精准。

Description

一种智能电视平台用户购买单点付费视频预测方法及系统
技术领域
本发明涉及视频推荐技术领域,特别是涉及一种智能电视平台用户购买单点付费视频预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
单点视频为用户需要单独购买并且需要在规定的时间范围内观看,如果过期需要再次进行购买的付费视频。无论对于服务提供商还是对用户来说,了解用户的购买意愿都是十分重要的。从服务提供商的角度来看,了解用户当前的购买兴趣可以增加平台的收益,根据用户的购买意愿,就能够通过各种优惠活动,比如发放限时优惠券等措施来促进用户消费,提升收益,同时提升用户粘性。从用户的角度来看,平台根据用户的观看意愿进行视频推荐可以极大地提高用户体验度。
受限于当前互联网智能电视在硬件设备和网络通信的限制,设备传输到后台的数据主要是带有时间戳的用户观看记录和购买记录,还有存储的视频元数据和用户元数据,在上述数据的支持下,对单点付费视频的购买概率预测,对用户感兴趣的视频推荐问题主要存在以下问题:
首先,在所有的可用数据中,用户的观看记录反映用户的观看兴趣,用户的购买记录反映用户的购买偏好;对于单点付费视频来说,相关观看记录的占比远小于非付费视频,导致在使用传统的视频嵌入表示方法中视频的嵌入表示不充分,预测不精确。
其次,现有的视频嵌入表示或用户观看兴趣和购买偏好的建模都忽略了时间因素。
最后,用户观看历史中反映的观看兴趣和用户购买历史中反映的购买偏好有时是不一致的,用户平时观看的视频反映一种兴趣,购买的单点付费视频反映另一种兴趣;而传统方法将其视为用户的一种兴趣,预测不精准。
发明内容
为了解决上述问题,本发明提出了一种智能电视平台用户购买单点付费视频预测方法及系统,对所有用户视频观看记录进行图的构建,解决单点付费视频记录较少而导致的嵌入向量表达不充分的问题。在视频嵌入向量和观看兴趣特征以及购买偏好特征的建模上均考虑了时间因素,使得预测结果更为精准。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种智能电视平台用户购买单点付费视频预测方法,包括:
基于视频观看记录中用户观看视频的时间顺序构建邻接图;
对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
本发明提供一种智能电视平台用户购买单点付费视频预测方法,同样是提供一种视频推荐方法,根据用户的观看记录和购买记录,更为准确的获知用户的观看兴趣。
作为可选择的实施方式,所述观看时刻的时间嵌入向量为:
Figure BDA0003580617300000031
其中,t2v(t)表示t时刻对应的时间嵌入向量,t2v(t)[i]表示时间嵌入向量中第i个元素,共k个元素;Φ表示周期函数,ωi
Figure BDA0003580617300000032
分别是周期函数的频率和相位偏移。
作为可选择的实施方式,所述邻接图以观看时刻的视频为节点,以具备时间先后顺序的两个视频之间做边,并根据两个视频之间的间隔时间对边赋权。
作为可选择的实施方式,视频嵌入向量的构建过程包括:对自身的特征拼接向量和其邻居节点的特征拼接向量采用多头注意力组件进行多头注意力特征提取,对提取的头部特征进行拼接,通过一次线性变换后,采用多层前馈神经网络得到视频嵌入向量。
作为可选择的实施方式,得到观看兴趣特征过程包括:对用户的视频观看记录,采用循环神经网络和注意力机制进行序列化建模与注意力加权,得到观看兴趣特征。
作为可选择的实施方式,得到购买偏好特征的过程包括:将购买视频的视频嵌入向量按时间顺序构成第一矩阵,将购买金额根据视频购买记录中的视频数量进行复制后构成第二矩阵;根据第一矩阵和第二矩阵得到融合购买偏好信息的向量表示矩阵,对向量表示矩阵采用多头注意力网络得到购买偏好特征。
作为可选择的实施方式,在对待推荐视频进行预测时,添加待推荐视频的视频嵌入向量和用户基础信息作为预测输入。
第二方面,本发明提供一种智能电视平台用户购买单点付费视频预测系统,包括:
图构建模块,被配置为基于视频观看记录中用户观看视频的时间顺序构建邻接图;
视频嵌入向量构建模块,被配置为对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
观看兴趣特征提取模块,被配置为对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
购买偏好特征提取模块,被配置为对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
预测模块,被配置为根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
第三方面,本发明提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果为:
本发明提出一种智能电视平台用户购买单点付费视频预测方法,或付费视频推荐方法,或视频推荐方法,对所有用户视频观看记录进行图的构建,然后计算每个视频的视频嵌入向量,解决单点付费视频记录较少而导致的嵌入向量表达不充分的问题。其次对用户的视频观看记录和视频购买记录分别进行建模,分别得到用户的观看兴趣特征和购买偏好特征,精确捕捉并区分用户的观看兴趣与购买偏好,且在视频嵌入向量和观看兴趣特征以及购买偏好特征的建模上,均考虑了时间因素,使得预测结果更为精准。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的智能电视平台用户购买单点付费视频预测方法框图;
图2为图1中视频嵌入表示阶段的邻接图放大图;
图3为本发明实施例1提供的视频嵌入向量构建示意图;
图4为本发明实施例1提供的购买偏好特征提取示意图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
如图1所示,本实施例提供一种智能电视平台用户购买单点付费视频预测方法,包括:
获取用户的视频观看记录和视频购买记录;
基于视频观看记录中用户观看视频的时间顺序构建邻接图;
对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
根据观看兴趣特征和购买偏好特征对待预测付费视频进行预测,根据得到的购买概率对目标用户进行视频推荐。
本实施例的方法还可用于对付费视频的兴趣推荐,根据目标用户的观看兴趣特征和购买偏好特征对待推荐的付费视频进行预测,根据概率的高低给目标用户推荐感兴趣的付费视频。
具体地,在更多实施例中,还提供一种智能电视平台单点付费视频推荐方法,包括:
获取用户的视频观看记录和视频购买记录;
基于视频观看记录中用户观看视频的时间顺序构建邻接图;
对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
根据观看兴趣特征和购买偏好特征对待推荐付费视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
可以理解的,上述方法除了针对付费视频外,也可用于对普通视频的兴趣推荐。
具体地,在更多实施例中,还提供一种智能电视平台视频推荐方法,包括:
获取用户的视频观看记录和视频购买记录;
基于视频观看记录中用户观看视频的时间顺序构建邻接图;
对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
下面对上述实施例提供的方法进行详细说明。
需要说明的是,本实施例中所有数据的获取都在符合法律法规和用户同意的基础上,对数据进行合法应用。
对于用户兴趣的表示或对于视频嵌入向量的表示,时间都是一个十分重要的因素。从用户的角度看,对于互联网智能电视的多人使用场景来说,在工作日或者休息日甚至在一天的不同时段都会有不同的观看模式。通过对大量的用户观看记录的分析,用户在工作日的观看行为相比于休息日更加稠密,在一天之中,早、中、晚三个时间段的观看偏好也有明显的区别。
从视频的角度来看,尤其是付费视频中,电影占很大一部分的比重,当这部分视频刚开始在平台上放映时,播放量和购买量会在较短的一段时间内达到顶峰,然后逐渐回落,随着时间表现出线性的变化。然而,像电视剧这种类型的视频,会在每周的固定时间进行更新,播放量和购买量会呈现周期性的变化。
所以,为了捕获用户的视频观看记录和视频购买记录的线性或周期性变化的时间特征,本实施例使用如下的时间嵌入方法,以获取观看时刻的时间嵌入向量:
Figure BDA0003580617300000091
其中,t2v(t)表示t时刻对应的时间嵌入向量,t2v(t)[i]表示时间嵌入向量中第i个元素,Φ表示周期性的激活函数,常用的周期性激活函数有sin或者cos函数,ωi
Figure BDA0003580617300000092
是可学习的参数,分别表示周期函数的频率和相位的偏移。
由于周期函数
Figure BDA0003580617300000096
的周期为
Figure BDA0003580617300000093
所以对于时间点t和
Figure BDA0003580617300000094
有相同的值。因此,不需要显式的特征工程而仅仅使用周期函数就能够捕获周期性;同时,使用
Figure BDA0003580617300000095
线性项来捕获依赖于时间变化的非周期性模式。
上述得到的时间嵌入向量用于视频嵌入向量表示和对用户的观看兴趣和购买偏好进行建模的过程中。
为了更好的学习在一个特定时刻ti视频vi的嵌入向量表示,本实施例将全体用户的视频观看记录基于图注意网络构建邻接图;其中,以ti时刻观看的视频vi为节点,以具备时间先后顺序的两个视频做边ei
例如,设置t0为当前时间,一个用户在时刻t1(t1<t0)观看视频v1,另一名用户在时刻t2(t2<t0)观看视频v2,第三名用户在时刻t3(t3<t0)观看视频v3,且这三名用户分别在t1-t0,t2-t0,t3-t0这三个时间段内看过视频v0,所以在视频v0和视频v1、v2、v3之间分别设置边e10、e20、e30,如图2所示。
其中,边eij用向量进行表示,向量中的每一位都有具体的含义,有的位可以表示为这条边连接的两个视频是否属于同一个一级分类,有的位可以表示为这条边连接的两个视频是否属于同一个二级分类;若两个视频的属性相同,则该位设置为1,否则设置为0,并将两个视频之间的间隔时间作为权重对该向量进行加权;eij的具体设置可以根据实验效果进行变动。
在本实施例中,对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量,如图3所示,对中心视频节点v0,根据邻居节点并结合特定的聚合操作对其进行视频嵌入向量的表示;对于在时刻t0观看的视频节点v0,它的邻居被定义为:
N0={v1(t1),v2(t2),…,vn(tn)}。
在邻接图中的每个视频节点vi,都要计算其视频嵌入向量。视频节点的特征拼接向量包括三部分,其中,一部分定义为
Figure BDA0003580617300000101
其中,
Figure BDA0003580617300000102
表示视频vi的一阶邻居节点在第l-1层的输出,既该邻居节点在上一次迭代中得到的嵌入向量,该嵌入向量也是由其一阶邻居通过ET-GAT方法获得。如果l为1,那么
Figure BDA0003580617300000103
就是视频vi的原始特征或者随机初始化的特征。
一部分是t′i时刻对应的时间嵌入向量t2v(t′i),t′i是视频观看行为发生的时间ti与时间原点torigin的时间间隔,时间原点torigin定义为系统中用户观看和购买记录中最早的时间点。
一部分是节点vi和vj之间的边eij,边eij包含的信息也可以被整合到目标视频节点的隐藏层表示中。
将上述三步通过拼接操作,得到视频节点vi第l层的特征拼接向量Hi(ti);
Figure BDA0003580617300000111
将邻居节点和该视频节点的特征拼接向量一起采用多头注意力组件进行多头注意力特征提取后,其中,多头注意力组件为:
Qi=HiWQ,Ki=HiWK,Vi=HiWV
Figure BDA0003580617300000112
其中,Q、K、V为多头注意力机制中的参数;dk表示Ki中向量的维度,用于防止出现梯度消失的现象。
计算矩阵Qi与Ki的向量相关性,从而得到每个key对应属性value的权重系数,并通过softmax进行归一化后,对权重和相应的value进行加权求和,得到head中的Attention分数。
MultiHead(Q,K,V)=Concat(head1,head2,…,headn)WO
Figure BDA0003580617300000113
以上两个公式表明多个head之间参数是不共享的,head内部对Q、K、V进行线性变换的参数W也是不一样的,因此可以从多个子空间进行建模。
对提取的头部特征head进行拼接后,再进行一次线性变换,然后采用多层前馈神经网络得到多头注意力机制结果
Figure BDA0003580617300000121
即视频节点vi在第l层的视频嵌入向量。
在这一阶段,本实施例设置连接预测任务来对模型的参数进行训练,从而获得更为精确的视频嵌入向量表示。
Figure BDA0003580617300000122
其中,损失函数L将用户的视频观看记录中存在的vi和vj看作是正样本集合Sp,vi和vj之间存在着一条边,根据正样本的数量随机生成等量的负样本集合Sn,在负样本集合中vi和vj之间不存在边;σ是sigmoid激活函数,当经过多次的迭代之后,得到的视频嵌入向量就可以在下游任务中进行使用。
由于可以单独进行训练,该阶段得到的视频嵌入向量作为下一阶段的输入,也可以在系统中单独完成一些功能,比如通过计算视频嵌入向量之间的相似度来完成相似视频推荐的功能。
在本实施例中,根据用户的视频观看记录和视频购买记录,采用不同的模型结构分别建模用户的观看兴趣和购买偏好,主要是根据两种序列的不同特点制定的。用户的视频观看记录比较稠密,观看视频之间的时间间隔较小,前后的依赖性较强,同时考虑到智能电视平台系统的性能,所以对于用户的视频观看记录使用循环神经网络和注意力机制相结合的方式进行建模。
采用固定数量的视频观看记录,使用GRU作为基本单元来避免“梯度消失”问题,同时GRU相对于LSTM来说在效果上相差不大,但是速度上略快一些。
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量进行序列化,建模如下:
v′t=vt||t2v(t′)
rt=σ(Wurvt+Whrht-1+br)
其中,v′t表示视频嵌入向量和观看时刻经过时间嵌入层处理后的时间嵌入向量拼接后的结果,rt为GRU单元中的重置门,ht-1表示上一个GRU单元的结果,σ为sigmoid函数,得到的结果充当门控信号,Wur、Whr、br都是可训练的参数。
在得到重置门控信号之后,来重置之前的隐层信号,相当于选择性的记忆了之前时刻的状态;
h′=tanh(Wuhvt+Whh(rt⊙ht-1)+bh)
其中,⊙表示Hadamard积,即矩阵元素相乘操作。
zt=σ(Wuzvt+Whzht-1+bz)
ht=(1-zt)⊙ht-1+zt⊙h′
其中,zt表示更新门控信号,数值范围在0到1之间,越接近1,代表“记忆”的数据越多。
最终得到当前GRU单元的结果ht,该结果不仅仅反映当前输入ut,同时是对当前序列的建模结果;
h=h1,h2,…,hn∈Rn×d
其中,n表示序列中的视频数量或者GRU单元的数量,d表示每个隐层向量的维度数量,并与视频嵌入向量维度相同。
进行序列化建模后得到观看序列,为了捕捉观看序列中的视频与待预测视频间的相关性,本实施例在GRU单元之上添加注意力单元,以计算序列中每个视频的注意力分数,再将注意力分数融合至观看序列中;
Figure BDA0003580617300000141
Figure BDA0003580617300000142
其中,vc表示待推荐视频的嵌入向量表示,ht表示第i个GRU单元的隐层输出,ai表示观看序列中每个视频的注意力分数,
Figure BDA0003580617300000143
就表示目标用户的观看兴趣特征。
相对于用户的视频观看记录,视频购买记录中包含在购买该视频的时候所支付的金额,对于同一个用户,支付的金额越多,可以说明该用户对这个视频越感兴趣,因此可以将金额作为视频的购买权重。
在本实施例中,首先对金额进行归一化处理,归一化操作的目的是,对于不同用户的消费能力可能不同,归一化操作可以消解不同用户之间的消费能力的偏差;
Figure BDA0003580617300000144
其中,x是由用户的视频购买记录中的金额组成的向量(另外,可以不只是金额,上映时间等多种属性也可以做权重),Min(x)表示每个用户的视频购买记录中消费金额的最小值,Max(x)表示每个用户的视频购买记录中消费金额的最大值。
如图4所示,将用户的视频购买记录中视频嵌入向量按时间先后顺序构成第一矩阵C,将归一化后的购买金额向量x复制n次,构成第二矩阵X,n表示该用户购买记录中的视频数量;
F=XTV
其中,F就是融合了用户购买偏好信息的视频嵌入向量表示矩阵。
然后,将该矩阵采用多头注意力网络,由于多头注意力网络的结构,使它能够建立多个子空间,也就是使用多个参数矩阵来建模用户的购买记录,就可以显式的区分用户的购买记录中包含的观看兴趣和购买偏好。最后,得到作为用户长期兴趣和消费偏好表示的购买偏好特征
Figure BDA0003580617300000151
由此,根据观看兴趣特征和购买偏好特征进行待推荐视频的预测;另外,还可在预测过程中添加待推荐视频的视频嵌入向量和用户基础信息,采用多层全连接层得到最终预测概率,如下述公式所示:
Figure BDA0003580617300000152
p(Z)=sigmoid(WzZ+b)
其中,p(Z)表示预测概率,uprofile,
Figure BDA0003580617300000153
vc分别表示用户基础信息、观看兴趣特征、购买偏好特征和待推荐视频的视频嵌入向量。
上述问题是一个二分类问题,损失函数可以定义为二元交叉熵损失函数:
Figure BDA0003580617300000154
其中,样本标签yi∈{0,1},1表明用户会在未来一周内购买该单点,0则相反;N表示所有训练样本的数量。
最终,对待推荐视频进行概率预测,根据概率的高低对目标用户进行视频推荐。
实施例2
本实施例提供一种智能电视平台用户购买单点付费视频预测系统,包括:
图构建模块,被配置为基于视频观看记录中用户观看视频的时间顺序构建邻接图;
视频嵌入向量构建模块,被配置为对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
观看兴趣特征提取模块,被配置为对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
购买偏好特征提取模块,被配置为对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
预测模块,被配置为根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
此处需要说明的是,上述模块对应于实施例1中所述的步骤,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1中所述的方法。
实施例1中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种智能电视平台用户购买单点付费视频预测方法,其特征在于,包括:
基于视频观看记录中用户观看视频的时间顺序构建邻接图;
对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
2.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,所述观看时刻的时间嵌入向量为:
Figure FDA0003580617290000011
其中,t2v(t)表示t时刻对应的时间嵌入向量,t2v(t)[i]表示时间嵌入向量中第i个元素,共k个元素;Φ表示周期函数,ωi
Figure FDA0003580617290000012
分别是周期函数的频率和相位偏移。
3.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,所述邻接图以观看时刻的视频为节点,以具备时间先后顺序的两个视频之间做边,并根据两个视频之间的间隔时间对边赋权。
4.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,视频嵌入向量的构建过程包括:对自身的特征拼接向量和其邻居节点的特征拼接向量采用多头注意力组件进行多头注意力特征提取,对提取的头部特征进行拼接,通过一次线性变换后,采用多层前馈神经网络得到视频嵌入向量。
5.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,得到观看兴趣特征过程包括:对用户的视频观看记录,采用循环神经网络和注意力机制进行序列化建模与注意力加权,得到观看兴趣特征。
6.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,得到购买偏好特征的过程包括:将购买视频的视频嵌入向量按时间顺序构成第一矩阵,将购买金额根据视频购买记录中的视频数量进行复制后构成第二矩阵;根据第一矩阵和第二矩阵得到融合购买偏好信息的向量表示矩阵,对向量表示矩阵采用多头注意力网络得到购买偏好特征。
7.如权利要求1所述的一种智能电视平台用户购买单点付费视频预测方法,其特征在于,在对待推荐视频进行预测时,添加待推荐视频的视频嵌入向量和用户基础信息作为预测输入。
8.一种智能电视平台用户购买单点付费视频预测系统,其特征在于,包括:
图构建模块,被配置为基于视频观看记录中用户观看视频的时间顺序构建邻接图;
视频嵌入向量构建模块,被配置为对邻接图中每个视频节点,根据自身的特征拼接向量和其邻居节点的特征拼接向量构建视频嵌入向量;所述特征拼接向量包括观看时刻的时间嵌入向量以及与相邻节点的边;
观看兴趣特征提取模块,被配置为对目标用户的视频观看记录,根据观看时刻的时间嵌入向量和视频嵌入向量得到观看序列,对观看序列中每个视频进行注意力加权,得到观看兴趣特征;
购买偏好特征提取模块,被配置为对目标用户的视频购买记录,根据购买视频的视频嵌入向量及其购买金额得到购买偏好特征;
预测模块,被配置为根据观看兴趣特征和购买偏好特征对待推荐视频进行预测,根据得到的推荐概率对目标用户进行视频推荐。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
CN202210345066.9A 2022-04-02 2022-04-02 一种智能电视平台用户购买单点付费视频预测方法及系统 Pending CN114707021A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210345066.9A CN114707021A (zh) 2022-04-02 2022-04-02 一种智能电视平台用户购买单点付费视频预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210345066.9A CN114707021A (zh) 2022-04-02 2022-04-02 一种智能电视平台用户购买单点付费视频预测方法及系统

Publications (1)

Publication Number Publication Date
CN114707021A true CN114707021A (zh) 2022-07-05

Family

ID=82172925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210345066.9A Pending CN114707021A (zh) 2022-04-02 2022-04-02 一种智能电视平台用户购买单点付费视频预测方法及系统

Country Status (1)

Country Link
CN (1) CN114707021A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934389A (zh) * 2023-06-12 2023-10-24 嘉兴华数广电网络有限公司 基于云计算与跨平台技术的数字电视有价券卡管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934389A (zh) * 2023-06-12 2023-10-24 嘉兴华数广电网络有限公司 基于云计算与跨平台技术的数字电视有价券卡管理系统
CN116934389B (zh) * 2023-06-12 2024-02-23 嘉兴华数广电网络有限公司 基于云计算与跨平台技术的数字电视有价券卡管理系统

Similar Documents

Publication Publication Date Title
Unger et al. Towards latent context-aware recommendation systems
You et al. Image-based appraisal of real estate properties
CN109544306B (zh) 一种基于用户行为序列特征的跨领域推荐方法及装置
CN110659742B (zh) 获取用户行为序列的序列表示向量的方法和装置
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
CN110689110B (zh) 处理交互事件的方法及装置
CN111274440A (zh) 一种基于视觉和音频内容相关度挖掘的视频推荐方法
CN111046298B (zh) 推送应用程序的方法、装置、计算机设备和存储介质
US20220156272A1 (en) Transition Regularized Matrix Factorization For Sequential Recommendation
CN113204655B (zh) 多媒体信息的推荐方法、相关装置及计算机存储介质
CN111667024B (zh) 内容推送方法、装置、计算机设备和存储介质
CN114707021A (zh) 一种智能电视平台用户购买单点付费视频预测方法及系统
CN115168721A (zh) 融合协同变换与时态感知的用户兴趣推荐方法及系统
CN114357201B (zh) 基于信息感知的视听推荐方法、系统
CN109086345A (zh) 一种内容识别方法、内容分发方法、装置及电子设备
CN114491255A (zh) 推荐方法、系统、电子设备和介质
CN117035914A (zh) 产品的推荐方法、装置、计算机设备及存储介质
CN115601098A (zh) 基于物品属性与时序模式耦合关系的序列推荐方法和系统
CN115564532A (zh) 序列推荐模型的训练方法及装置
CN116932862A (zh) 冷启动对象推荐方法、装置、计算机设备和存储介质
CN115878839A (zh) 一种视频推荐方法、装置、计算机设备和计算机程序产品
CN113888282A (zh) 一种物品推荐模型的训练方法、物品推荐方法和装置
CN117197613B (zh) 一种训练图像质量预测模型、图像质量预测的方法及装置
CN116881575B (zh) 内容推送方法、装置、计算机设备和存储介质
CN113888238B (zh) 一种广告点击率预测方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination