CN113779395A - 媒资推荐方法、装置、系统、电子装置和存储介质 - Google Patents

媒资推荐方法、装置、系统、电子装置和存储介质 Download PDF

Info

Publication number
CN113779395A
CN113779395A CN202111062331.4A CN202111062331A CN113779395A CN 113779395 A CN113779395 A CN 113779395A CN 202111062331 A CN202111062331 A CN 202111062331A CN 113779395 A CN113779395 A CN 113779395A
Authority
CN
China
Prior art keywords
user
user group
behavior data
media asset
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111062331.4A
Other languages
English (en)
Inventor
李良敏
马旭东
赵春波
毛国强
沈建展
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Particle Culture Technology Group Hangzhou Co ltd
Original Assignee
Particle Culture Technology Group Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Particle Culture Technology Group Hangzhou Co ltd filed Critical Particle Culture Technology Group Hangzhou Co ltd
Priority to CN202111062331.4A priority Critical patent/CN113779395A/zh
Publication of CN113779395A publication Critical patent/CN113779395A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Abstract

本申请涉及一种媒资推荐方法、装置、系统、电子装置和存储介质,其中,该媒资推荐方法应用于多媒体交互设备,包括:获取用户群体与该多媒体交互设备实时交互的用户行为数据;根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型;根据该用户画像模型生成该用户群体的媒资推荐结果。通过本申请,解决了媒资推荐的准确性低的问题,实现了基于用户群体画像的高精度媒资推荐。

Description

媒资推荐方法、装置、系统、电子装置和存储介质
技术领域
本申请涉及媒资推荐技术领域,特别是涉及媒资推荐方法、装置、系统、电子装置和存储介质。
背景技术
在交互式网络电视(Internet Protocol Television,简称为IPTV)飞速发展的今天,节目形式和内容也越来越丰富,如何将这些丰富的节目根据用户的喜好推荐给所观看的IPTV用户,成为目前研究的热门领域。在相关技术中,针对观看IPTV的用户群体,虽然存在对用户群体进行分群的方式,但仍需要用户手动搜索,导致用户操作繁琐且易出错;另外,现有的推荐方法中无法快速地划分用户群体画像,以便于快速精准地找到符合一定条件的用户群体推荐观看的媒资,导致媒资推荐的准确性较低,用户体验差。
目前针对相关技术中媒资推荐的准确性低的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种媒资推荐方法、装置、系统、电子装置和存储介质,以至少解决相关技术中媒资推荐的准确性低的问题。
第一方面,本申请实施例提供了一种媒资推荐方法,应用于多媒体交互设备,所述方法包括:
获取用户群体与所述多媒体交互设备实时交互的用户行为数据;
根据所述用户行为数据获取键值对样本,根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息,并根据所述分类信息得到所述用户群体的用户画像模型;
根据所述用户画像模型生成所述用户群体的媒资推荐结果。
在其中一些实施例中所述根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息包括:
将所述键值对样本转换为多维坐标,并获取所有所述多维坐标中至少两个预设的中心点;其中,所述多维坐标包括点播饱和度;
基于所述点播饱和度将所述多维坐标分配给所述中心点以生成第一聚类簇,计算所述第一聚类簇内所有所述多维坐标之间的第一坐标均值,并将计算所述坐标均值和所述中心点之间的第一距离信息;
在所述第一距离信息大于或等于预设的距离阈值的情况下,将基于所述点播饱和度将所述多维坐标分配给所述第一坐标均值以生成第二聚类簇,计算所述第二聚类簇内所有所述多维坐标之间的第二坐标均值,并将计算所述第二坐标均值和所述第一坐标均值之间的第二距离信息;
在所述第二距离信息小于所述距离阈值的情况下,根据所述坐标均值得到所述分类信息。
在其中一些实施例中,所述基于所述点播饱和度将所述多维坐标分配给所述第一坐标均值以生成第二聚类簇包括:
在所述点播饱和度小于预设的饱和度阈值的情况下,将所述点播饱和度对应的多维坐标作为剔除点;
在取出所述剔除点的情况下,基于所述点播饱和度重新分配所述多维坐标,生成所述第二聚类簇。
在其中一些实施例中,所述多维坐标还包括用户时间戳;所述基于所述点播饱和度将所述多维坐标分配给所述中心点以生成第一聚类簇包括:
获取预设的放大信息,并根据所述放大信息和所述用户时间戳获取目标时间戳;
基于所述目标时间戳和所述点播饱和度将所述多维坐标分配给所述中心点以生成所述第一聚类簇。
在其中一些实施例中,所述根据所述用户行为数据获取键值对样本包括:
根据不同时间点获取到的所述用户行为数据生成对应的用户时间戳;
对所有所述用户行为数据进行解析处理,得到每个所述用户行为数据对应的媒资观看信息;
根据所述用户时间戳和所述媒资观看信息获取所述键值对样本。
在其中一些实施例中,根据所述用户画像模型生成所述用户群体的媒资推荐结果包括:
将所述用户行为数据输入至训练完备的用户偏好模型,得到用户群体偏好类型,并根据所述用户群体偏好类型和所述用户画像模型生成所述用户群体的媒资推荐结果。
在其中一些实施例中,所述获取用户群体与所述多媒体交互设备交互的用户行为数据包括:
获取所述多媒体交互设备中视频页面服务,并获取所述视频页面服务上预设的埋点函数;
利用所述埋点函数,获取得到所述用户行为数据。
第二方面,本申请实施例提供了一种媒资推荐装置,应用于多媒体交互设备,所述装置包括:获取模块、分类模块和生成模块;
所述获取模块,用于获取用户群体与所述多媒体交互设备实时交互的用户行为数据;
所述分类模块,用于根据所述用户行为数据获取键值对样本,根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息,并根据所述分类信息得到所述用户群体的用户画像模型;
所述生成模块,用于根据所述用户画像模型生成所述用户群体的媒资推荐结果。
第三方面,本申请实施例提供了一种媒资推荐系统,所述系统包括:多媒体交互设备、传输设备以及服务器设备;其中,所述多媒体交互设备通过传输设备连接服务器设备;
所述多媒体交互设备用于生成与用户群体交互的用户行为数据;
所述传输设备用于从所述多媒体交互设备获取所述用户行为数据,并将所述用户行为数据发送至所述服务器设备;
所述服务器设备用于执行上述第一方面所述的媒资推荐方法。
第四方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的媒资推荐方法。
第五方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的媒资推荐方法。
相比于相关技术,本申请实施例提供的媒资推荐方法、装置、系统、电子装置和存储介质,应用于多媒体交互设备,通过获取用户群体与该多媒体交互设备实时交互的用户行为数据;根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型;根据该用户画像模型生成该用户群体的媒资推荐结果,解决了媒资推荐的准确性低的问题,实现了基于用户群体画像的高精度媒资推荐。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种媒资推荐方法的应用环境图;
图2是根据本申请实施例的一种媒资推荐方法的流程图;
图3是根据本申请实施例的另一种媒资推荐方法的流程图;
图4是根据本申请实施例的一种媒资推荐装置的结构框图;
图5是根据本申请实施例的一种媒资推荐系统的结构框图;
图6是根据本申请实施例的一种计算机设备内部的结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本实施例提供的媒资推荐方法,可以应用在如图1所示的应用场景中。其中,多媒体交互设备102通过网络与服务器设备104进行通信。服务器设备104根据用户群体与多媒体交互设备102实时交互的用户行为数据获取键值对样本,并根据聚类算法对该键值对样本聚类以得到用户群体在不同时间段的分类信息,进而根据分类信息得到用户群体的用户画像模型;最终该服务器设备104根据该用户画像模型生成该用户群体的媒资推荐结果。其中,该多媒体交互设备102可以但不限于是各种电视机、家庭影院等具有多媒体交互功能的大屏显示设备,该服务器设备104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本实施例提供了一种媒资推荐方法,应用于多媒体交互设备,图2是根据本申请实施例的一种媒资推荐方法的流程图,如图2所示,该流程包括如下步骤:
步骤S210,获取用户群体与该多媒体交互设备实时交互的用户行为数据。
其中,上述多媒体交互设备可以为电视机或家庭影院等,且该多媒体交互设备可以部署在家庭、老年活动中心等应用场景。上述用户群体是指在上述应用场景中与该多媒体交互设备进行交互并观影的多个用户。在该用户群体和该多媒体交互设备交互过程中,可以由处理器对用户点播产生的用户行为数据进行数据采集;需要说明的是,该用户行为数据应当包括用户账号、点播时间、资产名称、资产年代、以及点播时长等信息。
步骤S220,根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型。
在其中一些实施例中,上述根据该用户行为数据获取键值对样本包括如下步骤:根据不同时间点获取到的该用户行为数据生成对应的用户时间戳;对所有该用户行为数据进行解析处理,得到每个该用户行为数据对应的媒资观看信息;根据该用户时间戳和该媒资观看信息获取该键值对样本。其中,该用户时间戳是指该用户行为数据对应的交互时间点;该媒资观看信息包括用户观看的资产类型、资产标签等信息。具体地,可以将上述用户行为数据中用户账号所对应的唯一用户ID组成一系列的主键Key,并根据实际用户交互情况确定Key对应的Value值;例如,考虑到影视资产中的影视资产类别、影视资产年代与用户年龄通常存在强关系,因此可以将键值对的数据形式设置为(用户ID,(影视资产类别,影视资产年代));或者,针对影视资产的影视点播次数、点播时长与不同类型的用户也存在一定关系,因此可以将上述键值对样本的数据形式设置为(用户ID,(资产分类、资产年代、点播次数、点播时长))。
其中,基于上述键值对样本,可以利用聚类算法计算得到上述用户群体在不同时间段的分类信息。该聚类算法可以为k-means聚类算法,其步骤是随机选取K个键值对作为初始聚类中心,然后计算每个键值对样本与各个初始聚类中心之间的距离,把每个键值对样本分配给距离它最近的初始聚类中心;该初始聚类中心以及分配给它们的键值对样本就代表一个聚类,每分配一个样本,根据该聚类中现有的键值对重新计算该聚类的聚类中心;这个过程将不断重复直到没有(或最小数目)键值对样本被重新分配给不同的聚类,或者没有(或最小数目)聚类中心再发生变化,从而最终生成该目标簇,将每个目标簇作为一类,进而得到上述分类信息。或者,该聚类算法也可以为DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声的基于密度的聚类方法),DBSCAN是一个比较有代表性的基于密度的聚类算法;其步骤是任选一个键值对样本开始,找出与该键值对样本距离在扫描半径之内(包括扫描半径)的所有附近样本,如果附近样本的数量大于或等于最少数目,则该键值对样本与其附近样本形成一个簇,并且该键值对样本被标记为已访问;然后递归,以相同的方法处理该簇内所有未被标记为已访问的样本,从而对簇进行扩展;最终生成该目标簇,进而生成上述分类信息。
可以理解的是,由于在同一家庭或活动中心等应用场景中,用户群体通常是通过同一用户ID与多媒体交互设备进行交互的,因此本实施例基于不同时间段对用户群体进行划分得到分类信息;该分类信息是指利用聚类算法,根据各键值对样本得到的聚类数值,根据聚类数值大小可以对用户群体进行分类,例如聚类数值范围为0至10,则0至3代表少儿,4至7代表中年,8至10代表老年;则根据上述分类信息可以构建得到用户群体的用户画像模型,例如在分类信息指示当天7点至9点这一时间段对应的聚类数值范围是8至10,11点至13点这一时间段对应的聚类数值范围是4至7,17点至18点这一时间段对应的聚类数值范围是0至3,则基于该分类信息构建的用户画像模型为当天7点至9点面向老年这一用户群体,11点至13点面向中年,且17点至18点面向少儿。
步骤S230,根据该用户画像模型生成该用户群体的媒资推荐结果。
其中,在得到上述用户画像模型之后,可以由上述处理器基于该用户画像模型生成不同时间段对应的媒资推荐结果,以便基于该媒资推荐结果在不同的时间段在上述多媒体交互设备上推荐对应的影视资产,使得上述划分出来的不同时间段的用户可通过推荐算法获得各自的推荐资产,即不同时间段可获得多应时段用户特征的推荐资产。需要说明的是,在上述用户群体与多媒体交互设备实时交互的过程中,由于用户每次点播行为都会影响聚类算法的中心点,因此生成的用户画像模型也能够随之实时变化,最终在不同时间段所推荐的影视资产也会不断调整,从而提高用户交互体验。
通过上述步骤S210至步骤S230,通过聚类算法对用户群体的用户行为数据进行聚类,以便基于聚类结果丰富用户群体画像,从而将用户群体细分为相应的类别,能够基于划分类别对用户群体进行精细推荐,解决了媒资推荐的准确性低的问题,实现了基于用户群体画像的高精度媒资推荐方法。
在其中一些实施例中,提供了一种媒资推荐方法,图3是根据本申请实施例的另一种媒资推荐方法的流程图,如图3所示,该流程包括图2中的步骤S210和步骤S230,此外包括如下步骤:
步骤S310,根据该用户行为数据获取键值对样本,将该键值对样本转换为多维坐标,并获取所有该多维坐标中至少两个预设的中心点;其中,该多维坐标包括点播饱和度。
其中,在获取得到上述键值对样本之后,可以将该键值对样本作为多维坐标进行计算。例如,某用户ID有多两次点播行为,第一次6点观看了喜剧资产,资产年代为2008,点播饱和度70%,第二次12点观看了喜剧资产,资产年代为2021,点播饱和度为80%;则这两次用户行为数据对应的键值对样本可以分别转换为两个多维坐标,即(6,12008,0.7)和(12,12021,0.8)。需要说明的是,上述多维坐标中的12008和12021用于表示资产标签;该资产标签是指资产分类与资产年代的映射值,例如某资产的资产分类是喜剧,资产年代是2008,那么映射资产标签为12008;另外一部资产的资产分类也是喜剧,但资产年代是2021,那么映射资产标签为12021,依次类推。上述点播饱和度是指用户点播某部资产时,针对该资产的用户点播时长与资产总计时长的比值,例如一部电影的总计时长是40分钟,用户点播时长是30分钟,则点播饱和度为75%。在针对多维坐标进行聚类之前,可以预先设置K个中心点,并从各多维坐标中随机选取K个作为中心点,K为大于1的正整数。例如,可以由工作人员设定中心点有3个,即每个机顶盒对应的用户群体分为3类用户。
步骤S320,基于该点播饱和度将该多维坐标分配给该中心点以生成第一聚类簇,计算该第一聚类簇内所有该多维坐标之间的第一坐标均值,并将计算该坐标均值和该中心点之间的第一距离信息;在该第一距离信息大于或等于预设的距离阈值的情况下,将基于该点播饱和度将该多维坐标分配给该第一坐标均值以生成第二聚类簇,计算该第二聚类簇内所有该多维坐标之间的第二坐标均值,并将计算该第二坐标均值和该第一坐标均值之间的第二距离信息。
具体地,可以利用欧式距离计算公式依次计算包含点播饱和度的每个多维坐标与各中心点之间的距离,并利用上述聚类算法将各多维坐标分配给距离最小的中心点,生成聚类簇。然后比较聚类簇内的第一坐标均值与对应中心点之间的第一距离信息,若该第一距离信息大于或等于该距离阈值,说明新质心和原质心之间的距离较大,该算法仍需要重新循环进行计算,即根据该聚类簇中现有的多维坐标重新计算该聚类簇的聚类中心;该预设阈值可以设置为5。
步骤S330,在该第二距离信息小于该距离阈值的情况下,根据该坐标均值得到该分类信息,并根据该分类信息得到该用户群体的用户画像模型;其中,该坐标均值是指该聚类簇内的所有该多维坐标的平均值。
具体地,在上述第二距离消息小于上述距离阈值的情况下,说明新质心和原质心之间的距离较小,即重新计算的质点的位置变化不大,该聚类算法区域收敛,从而将最终形成的聚类簇的中心作为上述分类信息中的对应类别。
通过上述步骤S310至步骤S330,选取多个中心点作为初始聚类中心,并基于上述点播饱和度确定聚类得到的分类信息,从而使得点播时长占用的权重更高,避免了在点播次数多,但点播时间短的情况下无法准确判断用户群体的喜好程度,有效提高了媒资推荐的准确性。
在其中一些实施例中,上述多维坐标还包括用户时间戳;上述基于该点播饱和度将该多维坐标分配给该中心点以生成第一聚类簇还包括如下步骤:获取预设的放大信息,并根据该放大信息和该用户时间戳获取目标时间戳;基于该目标时间戳和该点播饱和度将该多维坐标分配给该中心点以生成该第一聚类簇。
其中,为了避免随机选取预设的中心点对聚类结果造成的影响,可以预先设置好需要放大的放大倍数作为上述放大信息进行存储;可以理解的是,该放大信息可以通过测试不断调试以提高准确性。上述处理器在聚类前可以利用该放大信息将上述用户时间戳放大至上述目标时间戳,进而生成上述第一聚类簇。例如,在一天当中该用户时间戳取值为0~23h,在上述放大信息指示放大1000倍的情况下,可以将该用户时间戳在时间轴上的各坐标值对应放大1000倍,则在多维坐标上,各个时间点的距离就差距大了,从而有利于提高聚类算法的准确性,并进一步提高媒资推荐的准确性。
在其中一些实施例中,上述基于该点播饱和度将该多维坐标分配给该中心点以生成第一聚类簇还包括如下步骤:
步骤S322,在该点播饱和度小于预设的饱和度阈值的情况下,将该点播饱和度对应的多维坐标作为剔除点;基于该点播饱和度重新分配该多维坐标,生成该第二聚类簇。其中,上述饱和度阈值可以预先进行设置,例如设置为0.3;则当某一多维坐标包括的点播饱和度低于该饱和度阈值的情况下,说明此时用户点播时间较短,所对应的多维坐标属于聚类过程中的离群值,因此可以针对异常的离群值做进一步过滤处理,将计算得到的点播饱和度低的多维坐标作为剔除点进行剔除;然后将剔除后剩余的多维坐标重新进行分配,生成新的聚类簇,从而实现了在聚类过程中对异常点的剔除和调整,进一步提高了媒体推荐的准确性。
在其中一些实施例中,上述根据该用户画像模型生成该用户群体的媒资推荐结果包括如下步骤:将该用户行为数据输入至训练完备的用户偏好模型,得到用户群体偏好类型,并根据该用户群体偏好类型和该用户画像模型生成该用户群体的媒资推荐结果。其中,上述用户偏好模型可以基于交替最小二乘(alternating least squares,简称为ALS)算法等推荐算法,根据历史时间段内获取到的历史用户行为数据训练得到。则将上述实时交互过程中的用户行为数据输入至该用户偏好模型,能够输出得到上述用户群体偏好类型,进而生成上述用户群体的媒资推荐结果。例如,若通过用户偏好模型计算得到用户群体偏好类型为动作片以及动画片,则综合分析该用户群体偏好类型和上述用户画像模型,生成7点至9点向用户群体自动推荐动作片,17点至18点向用户群体推荐动画片的媒资推荐结果。通过上述实施例,结合用户群体偏好类型和用户话像模型生成媒资推荐结果,使得媒体推荐处理的准确性和效率更高。
在其中一些实施例中,上述步骤S220还包括如下步骤:获取该多媒体交互设备中视频页面服务,并获取该视频页面服务上预设的埋点函数;利用该埋点函数,获取得到该用户行为数据。具体地,该埋点函数用于针对该多媒体交互设备的视频页面服务交互的用户行为数据进行捕获、处理和发送流通股埋点的方式可以将用户的行为通过日志形式发送到上述处理器,从而实现了针对用户行为数据的数据采集阶段。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种媒资推荐装置,应用于多媒体交互设备,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本申请实施例的一种媒资推荐装置的结构框图,如图4所示,该装置包括:获取模块42、分类模块44和生成模块46;该获取模块42,用于获取用户群体与该多媒体交互设备实时交互的用户行为数据;该分类模块44,用于根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型;该生成模块46,用于根据该用户画像模型生成该用户群体的媒资推荐结果。
通过上述实施例,上述分类模块44通过聚类算法对用户群体的用户行为数据进行聚类,以便基于聚类结果丰富用户群体画像,从而将用户群体细分为相应的类别,能够基于划分类别对用户群体进行精细推荐,解决了媒资推荐的准确性低的问题,实现了基于用户群体画像的高精度媒资推荐装置。
在其中一些实施例中,上述分类模块44还用于将该键值对样本转换为多维坐标,并获取所有该多维坐标中至少两个预设的中心点;其中,该多维坐标包括点播饱和度;该分类模块44基于该点播饱和度将该多维坐标分配给该中心点以生成第一聚类簇,计算该第一聚类簇内所有该多维坐标之间的第一坐标均值,并将计算该坐标均值和该中心点之间的第一距离信息;该分类模块44在该第一距离信息大于或等于预设的距离阈值的情况下,将基于该点播饱和度将该多维坐标分配给该第一坐标均值以生成第二聚类簇,计算该第二聚类簇内所有该多维坐标之间的第二坐标均值,并将计算该第二坐标均值和该第一坐标均值之间的第二距离信息;该分类模块44在该第二距离信息小于该距离阈值的情况下,根据该坐标均值得到该分类信息;其中,该坐标均值是指该聚类簇内的所有该多维坐标的平均值。
在其中一些实施例中,上述分类模块44还用于将在该点播饱和度小于预设的饱和度阈值的情况下,将该点播饱和度对应的多维坐标作为剔除点;该分类模块44在取出该剔除点的情况下,基于该点播饱和度重新分配该多维坐标,生成该第二聚类簇。
在其中一些实施例中,上述多维坐标还包括用户时间戳;上述分类模块44还用于获取预设的放大信息,并根据该放大信息和该用户时间戳获取目标时间戳;该分类模块44根据该目标时间戳和该点播饱和度将该多维坐标分配给该中心点以生成该第一聚类簇。
在其中一些实施例中,上述分类模块44还用于根据不同时间点获取到的该用户行为数据生成对应的用户时间戳;该分类模块44对所有该用户行为数据进行解析处理,得到每个该用户行为数据对应的媒资观看信息;该分类模块44根据该用户时间戳和该媒资观看信息获取该键值对样本。
在其中一些实施例中,上述生成模块46还用于将该用户行为数据输入至训练完备的用户偏好模型,得到用户群体偏好类型,并根据该用户群体偏好类型和该用户画像模型生成该用户群体的媒资推荐结果。
在其中一些实施例中,上述获取模块42还用于获取该多媒体交互设备中视频页面服务,并获取该视频页面服务上预设的埋点函数;该获取模块42利用该埋点函数,获取得到该用户行为数据。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种媒资推荐系统,图5是根据本申请实施例的一种媒资推荐系统的结构框图,如图5所示,该系统包括:多媒体交互设备102、传输设备52以及服务器设备104;其中,该多媒体交互设备104通过传输设备连接服务器设备;该多媒体交互设备104用于生成与用户群体交互的用户行为数据;该传输设备52用于从该多媒体交互设备获取该用户行为数据,并将该用户行为数据发送至该服务器设备;该服务器设备104用于获取该用户行为数据;该服务器设备104根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型;该服务器设备104根据该用户画像模型生成该用户群体的媒资推荐结果。
通过上述实施例,上述服务器设备104通过聚类算法对用户群体的用户行为数据进行聚类,以便基于聚类结果丰富用户群体画像,从而将用户群体细分为相应的类别,能够基于划分类别对用户群体进行精细推荐,解决了媒资推荐的准确性低的问题,实现了基于用户群体画像的高精度媒资推荐系统。
在其中一些实施例中,上述服务器设备104还用于将该键值对样本转换为多维坐标,并获取所有该多维坐标中至少两个预设的中心点;其中,该多维坐标包括点播饱和度;该服务器设备104基于该点播饱和度将该多维坐标分配给该中心点以生成第一聚类簇,计算该第一聚类簇内所有该多维坐标之间的第一坐标均值,并将计算该坐标均值和该中心点之间的第一距离信息;该服务器设备104在该第一距离信息大于或等于预设的距离阈值的情况下,将基于该点播饱和度将该多维坐标分配给该第一坐标均值以生成第二聚类簇,计算该第二聚类簇内所有该多维坐标之间的第二坐标均值,并将计算该第二坐标均值和该第一坐标均值之间的第二距离信息;该服务器设备104在该第二距离信息小于该距离阈值的情况下,根据该坐标均值得到该分类信息;其中,该坐标均值是指该聚类簇内的所有该多维坐标的平均值。
在其中一些实施例中,上述服务器设备104还用于将在该点播饱和度小于预设的饱和度阈值的情况下,将该点播饱和度对应的多维坐标作为剔除点;该服务器设备104在取出该剔除点的情况下,基于该点播饱和度重新分配该多维坐标,生成该第二聚类簇。
在其中一些实施例中,上述多维坐标还包括用户时间戳;上述服务器设备104还用于获取预设的放大信息,并根据该放大信息和该用户时间戳获取目标时间戳;该服务器设备104基于该目标时间戳和该点播饱和度将该多维坐标分配给该中心点以生成该第一聚类簇。
在其中一些实施例中,上述服务器设备104还用于根据不同时间点获取到的该用户行为数据生成对应的用户时间戳;该服务器设备104对所有该用户行为数据进行解析处理,得到每个该用户行为数据对应的媒资观看信息;该服务器设备104根据该用户时间戳和该媒资观看信息获取该键值对样本。
在其中一些实施例中,上述服务器设备104还用于将该用户行为数据输入至训练完备的用户偏好模型,得到用户群体偏好类型,并根据该用户群体偏好类型和该用户画像模型生成该用户群体的媒资推荐结果。
在其中一些实施例中,上述服务器设备104还用于获取该多媒体交互设备中视频页面服务,并获取该视频页面服务上预设的埋点函数;该服务器设备104利用该埋点函数,获取得到该用户行为数据。
在其中一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,图6是根据本申请实施例的一种计算机设备内部的结构图,如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户画像模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述媒资推荐方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取用户群体与该多媒体交互设备实时交互的用户行为数据。
S2,根据该用户行为数据获取键值对样本,根据聚类算法对该键值对样本进行聚类得到该用户群体在不同时间段的分类信息,并根据该分类信息得到该用户群体的用户画像模型。
S3,根据该用户画像模型生成该用户群体的媒资推荐结果。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的媒资推荐方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种媒资推荐方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种媒资推荐方法,其特征在于,应用于多媒体交互设备,所述方法包括:
获取用户群体与所述多媒体交互设备实时交互的用户行为数据;
根据所述用户行为数据获取键值对样本,根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息,并根据所述分类信息得到所述用户群体的用户画像模型;
根据所述用户画像模型生成所述用户群体的媒资推荐结果。
2.根据权利要求1所述的媒资推荐方法,其特征在于,所述根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息包括:
将所述键值对样本转换为多维坐标,并获取所有所述多维坐标中至少两个预设的中心点;其中,所述多维坐标包括点播饱和度;
基于所述点播饱和度将所述多维坐标分配给所述中心点以生成第一聚类簇,计算所述第一聚类簇内所有所述多维坐标之间的第一坐标均值,并将计算所述坐标均值和所述中心点之间的第一距离信息;
在所述第一距离信息大于或等于预设的距离阈值的情况下,基于所述点播饱和度将所述多维坐标分配给所述第一坐标均值以生成第二聚类簇,计算所述第二聚类簇内所有所述多维坐标之间的第二坐标均值,并将计算所述第二坐标均值和所述第一坐标均值之间的第二距离信息;
在所述第二距离信息小于所述距离阈值的情况下,根据所述坐标均值得到所述分类信息。
3.根据权利要求2所述的媒资推荐方法,其特征在于,所述基于所述点播饱和度将所述多维坐标分配给所述第一坐标均值以生成第二聚类簇包括:
在所述点播饱和度小于预设的饱和度阈值的情况下,将所述点播饱和度对应的多维坐标作为剔除点;
在取出所述剔除点的情况下,基于所述点播饱和度重新分配所述多维坐标,生成所述第二聚类簇。
4.根据权利要求2所述的媒资推荐方法,其特征在于,所述多维坐标还包括用户时间戳;所述基于所述点播饱和度将所述多维坐标分配给所述中心点以生成第一聚类簇包括:
获取预设的放大信息,并根据所述放大信息和所述用户时间戳获取目标时间戳;
基于所述目标时间戳和所述点播饱和度将所述多维坐标分配给所述中心点以生成所述第一聚类簇。
5.根据权利要求1所述的媒资推荐方法,其特征在于,所述根据所述用户行为数据获取键值对样本包括:
根据不同时间点获取到的所述用户行为数据生成对应的用户时间戳;
对所有所述用户行为数据进行解析处理,得到每个所述用户行为数据对应的媒资观看信息;
根据所述用户时间戳和所述媒资观看信息获取所述键值对样本。
6.根据权利要求1所述的媒资推荐方法,其特征在于,所述根据所述用户画像模型生成所述用户群体的媒资推荐结果包括:
将所述用户行为数据输入至训练完备的用户偏好模型,得到用户群体偏好类型,并根据所述用户群体偏好类型和所述用户画像模型生成所述用户群体的媒资推荐结果。
7.根据权利要求1至5任一项所述的媒资推荐方法,其特征在于,所述获取用户群体与所述多媒体交互设备交互的用户行为数据包括:
获取所述多媒体交互设备中视频页面服务,并获取所述视频页面服务上预设的埋点函数;
利用所述埋点函数,获取得到所述用户行为数据。
8.一种媒资推荐装置,其特征在于,应用于多媒体交互设备,所述装置包括:获取模块、分类模块和生成模块;
所述获取模块,用于获取用户群体与所述多媒体交互设备实时交互的用户行为数据;
所述分类模块,用于根据所述用户行为数据获取键值对样本,根据聚类算法对所述键值对样本进行聚类得到所述用户群体在不同时间段的分类信息,并根据所述分类信息得到所述用户群体的用户画像模型;
所述生成模块,用于根据所述用户画像模型生成所述用户群体的媒资推荐结果。
9.一种媒资推荐系统,其特征在于,所述系统包括:多媒体交互设备、传输设备以及服务器设备;其中,所述多媒体交互设备通过传输设备连接服务器设备;
所述多媒体交互设备用于生成与用户群体交互的用户行为数据;
所述传输设备用于从所述多媒体交互设备获取所述用户行为数据,并将所述用户行为数据发送至所述服务器设备;
所述服务器设备用于执行如权利要求1至7中任一项所述的媒资推荐方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项所述的媒资推荐方法。
11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项所述的媒资推荐方法。
CN202111062331.4A 2021-09-10 2021-09-10 媒资推荐方法、装置、系统、电子装置和存储介质 Pending CN113779395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111062331.4A CN113779395A (zh) 2021-09-10 2021-09-10 媒资推荐方法、装置、系统、电子装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111062331.4A CN113779395A (zh) 2021-09-10 2021-09-10 媒资推荐方法、装置、系统、电子装置和存储介质

Publications (1)

Publication Number Publication Date
CN113779395A true CN113779395A (zh) 2021-12-10

Family

ID=78842501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111062331.4A Pending CN113779395A (zh) 2021-09-10 2021-09-10 媒资推荐方法、装置、系统、电子装置和存储介质

Country Status (1)

Country Link
CN (1) CN113779395A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385913A (zh) * 2021-12-31 2022-04-22 深圳市元征科技股份有限公司 一种用户交互方法、用户维护装置及电子设备
CN116402249A (zh) * 2023-03-06 2023-07-07 贝壳找房(北京)科技有限公司 推荐系统溢出效应评估方法、设备、存储介质及程序产品
CN117853152A (zh) * 2024-03-07 2024-04-09 云南疆恒科技有限公司 一种基于多渠道的业务营销数据处理系统
CN117853152B (zh) * 2024-03-07 2024-05-17 云南疆恒科技有限公司 一种基于多渠道的业务营销数据处理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533393A (zh) * 2013-09-17 2014-01-22 上海交通大学 基于家庭收视纪录的家庭分析及节目推荐方法
CN107071578A (zh) * 2017-05-24 2017-08-18 中国科学技术大学 Iptv节目推荐方法
CN108737856A (zh) * 2018-04-26 2018-11-02 西北大学 社会关系感知的iptv用户行为建模与节目推荐方法
CN110225374A (zh) * 2019-06-13 2019-09-10 北京连屏科技有限公司 交互式网络电视的用户信息采集处理方法
CN111327955A (zh) * 2018-12-13 2020-06-23 Tcl集团股份有限公司 基于用户画像的点播方法、存储介质及智能电视
CN111382281A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 基于媒体对象的内容的推荐方法、装置、设备和存储介质
CN112468853A (zh) * 2020-11-26 2021-03-09 未来电视有限公司 电视资源推荐方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533393A (zh) * 2013-09-17 2014-01-22 上海交通大学 基于家庭收视纪录的家庭分析及节目推荐方法
CN107071578A (zh) * 2017-05-24 2017-08-18 中国科学技术大学 Iptv节目推荐方法
CN108737856A (zh) * 2018-04-26 2018-11-02 西北大学 社会关系感知的iptv用户行为建模与节目推荐方法
CN111327955A (zh) * 2018-12-13 2020-06-23 Tcl集团股份有限公司 基于用户画像的点播方法、存储介质及智能电视
CN110225374A (zh) * 2019-06-13 2019-09-10 北京连屏科技有限公司 交互式网络电视的用户信息采集处理方法
CN111382281A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 基于媒体对象的内容的推荐方法、装置、设备和存储介质
CN112468853A (zh) * 2020-11-26 2021-03-09 未来电视有限公司 电视资源推荐方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于洪涌;邱晨旭;闻剑峰;: "IPTV视频个性化推荐方案", 电信科学, no. 12 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385913A (zh) * 2021-12-31 2022-04-22 深圳市元征科技股份有限公司 一种用户交互方法、用户维护装置及电子设备
CN116402249A (zh) * 2023-03-06 2023-07-07 贝壳找房(北京)科技有限公司 推荐系统溢出效应评估方法、设备、存储介质及程序产品
CN116402249B (zh) * 2023-03-06 2024-02-23 贝壳找房(北京)科技有限公司 推荐系统溢出效应评估方法、设备及存储介质
CN117853152A (zh) * 2024-03-07 2024-04-09 云南疆恒科技有限公司 一种基于多渠道的业务营销数据处理系统
CN117853152B (zh) * 2024-03-07 2024-05-17 云南疆恒科技有限公司 一种基于多渠道的业务营销数据处理系统

Similar Documents

Publication Publication Date Title
US20190289349A1 (en) Generating customized video previews
US9510050B2 (en) Method and system for context-aware recommendation
US8605958B2 (en) Method and apparatus for generating meta data of content
US10362137B2 (en) Hebbian learning-based recommendations for social networks
CN113779395A (zh) 媒资推荐方法、装置、系统、电子装置和存储介质
WO2022037343A1 (zh) 一种视频信息处理方法、装置、电子设备及存储介质
JP6168996B2 (ja) コンテンツ制御方法、コンテンツ制御装置およびプログラム
US10097888B2 (en) Determining audience engagement
US20160078489A1 (en) Systems and Methods of Using Social Media Data to Personalize Media Content Recommendations
US10638135B1 (en) Confidence-based encoding
WO2013180704A1 (en) Determining a profile for a recommendation engine based on group interaction dynamics
US20140095413A1 (en) Associating a Web Session with a Household Member
WO2015196757A1 (zh) 电视节目的推荐方法及服务器
US10798399B1 (en) Adaptive video compression
US20160098602A1 (en) Method for computing a similarity measure for video segments
US20180084080A1 (en) Decomposing Media Content Accounts for Persona-based Experience Individualization
US10248864B2 (en) Systems and methods for contextual video shot aggregation
JP6158435B2 (ja) ソーシャル・メッセージの、関連するマルチメディア・フローとの関連付け
JP6570978B2 (ja) クラスタ選択装置
US11470370B2 (en) Crowdsourcing platform for on-demand media content creation and sharing
CN111026912B (zh) 基于iptv的协同推荐方法、装置、计算机设备以及存储介质
EP2741507B1 (en) Video processing system, method of determining viewer preference, video processing apparatus, and control method and control program therefor
WO2017162158A1 (en) Method and apparatus for recommending data
KR20210097432A (ko) 콘텐츠를 추천하기 위한 장치 및 방법
Vega et al. Towards a multi-screen interactive ad delivery platform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination