CN116257684A - 一种内容推荐方法和装置 - Google Patents

一种内容推荐方法和装置 Download PDF

Info

Publication number
CN116257684A
CN116257684A CN202310027375.6A CN202310027375A CN116257684A CN 116257684 A CN116257684 A CN 116257684A CN 202310027375 A CN202310027375 A CN 202310027375A CN 116257684 A CN116257684 A CN 116257684A
Authority
CN
China
Prior art keywords
content
classification
label
target
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310027375.6A
Other languages
English (en)
Inventor
焦飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimeng Chuangke Network Technology China Co Ltd
Original Assignee
Weimeng Chuangke Network Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimeng Chuangke Network Technology China Co Ltd filed Critical Weimeng Chuangke Network Technology China Co Ltd
Priority to CN202310027375.6A priority Critical patent/CN116257684A/zh
Publication of CN116257684A publication Critical patent/CN116257684A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种内容推荐方法和装置,用以提高内容推荐的灵活有效性。本申请提供的方案包括:获取目标用户在历史时段内点击的内容记录,内容记录包括被点击内容的所属类别的分类标签和点击时间戳;根据内容记录分别确定每个分类标签的推荐匹配度和最新点击时间戳;根据推荐匹配度和/或最新点击时间戳从多个分类标签中选出目标分类标签;向目标用户推荐目标分类标签对应的内容。

Description

一种内容推荐方法和装置
技术领域
本申请涉及信息处理领域,尤其涉及一种内容推荐方法和装置。
背景技术
对于海量网络信息,可以根据用户的喜好向用户推荐感兴趣的网络信息,使用户能看到喜欢的网络内容。在兴趣社交场景中,个性化推荐系统能将网络信息分发给感兴趣的用户,在提高用户对网络内容的点击和转化的同时,也能丰富用户体验。
如图1a所示,个性化推荐系统例如可以是一个级联漏斗,由召回和排序两个模块组成。其中,召回模块利用各类召回算法和策略规则,根据业务需求和用户兴趣,从百万级别的网络内容集合中,快速选出用户感兴趣的内容,组成待推荐内容的内容库,进而输入到下游排序环节进行排序并推荐给用户。
上述召回算法往往挖掘的是用户过去较长时间内的兴趣,并以此作为召回的依据。而对于用户短期内的兴趣则无法做出及时的反应,因此,无法向用户推荐近期感兴趣的内容,会导致用户体验的下降。
如何提高内容推荐的灵活有效性,是本申请所要解决的技术问题。
发明内容
本申请实施例的目的是提供一种内容推荐方法和装置,用以提高内容推荐的灵活有效性。
第一方面,提供了一种内容推荐方法,包括:
获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
向所述目标用户推荐所述目标分类标签对应的内容。
第二方面,提供了一种内容推荐装置,包括:
获取模块,获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
第一确定模块,根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
第二确定模块,根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
推荐模块,向所述目标用户推荐所述目标分类标签对应的内容。
第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面的方法的步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面的方法的步骤。
在本申请实施例中,用户在历史时段内的点击的内容记录能表现出用户在历史时段内感兴趣的内容。其中,分类标签能表达出用户对哪一类内容感兴趣,点击时间戳能表达出用户对点击内容的兴趣时效性。根据内容记录分别确定每个分类标签的推荐匹配度和最新点击时间戳,能确定出用户对分类标签所属分类的感兴趣程度和感兴趣的时效性。进而根据推荐匹配度和最新点击时间戳来确定目标分类标签,进而根据目标分类标签确定推荐内容,能提升内容推荐的有效性和灵活性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a是个性化推荐系统的结构示意图。
图1b是本申请一个实施例一种内容推荐方法的流程示意图之一;
图2是本申请一个实施例一种内容推荐方法的流程示意图之二;
图3是本申请一个实施例一种内容推荐方法的流程示意图之三;
图4是本申请一个实施例一种内容推荐方法的流程示意图之四;
图5是本申请一个实施例一种内容推荐方法的流程示意图之五;
图6是本申请一个实施例一种内容推荐方法的流程示意图之六;
图7是本申请一个实施例一种内容推荐方法的流程示意图之七;
图8是本申请一个实施例一种内容推荐装置的结构示意图;
图9是本申请一个实施例一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
随着互联网不断发展,网络信息的形式多样,为了向网络用户提供用户感兴趣的网络信息,可以应用推荐算法对海量网络信息进行筛选,以确定出最终向用户推荐展示的内容。
其中,网络信息的推荐算法多种多样,召回算法是一种高效的推荐算法,参见图1a,以海量的候选博文为例,对于千万或百万级别数量的网络博文,可以首先应用召回模块快速高效地筛选出用户感兴趣的博文,将数量降到万或千级别。然后再通过排序模块对用户感兴趣的博文进行排序,从而根据用户的兴趣得到排序结果,有序地向用户输出推荐的博文内容。
但是,上述召回模块应用的召回算法通常基于用户历史较长时间内的兴趣执行召回,这就使得用户近期感兴趣的内容无法被有效选出,进而导致推荐内容无法紧跟用户的兴趣变化,使推荐内容不够灵活。而且,用户在不同的社交场景中的行为往往有所不同,单一场景下的召回算法难以广泛应用于多种不同的场景中。
为了解决现有技术中存在的问题,本申请实施例提供一种内容推荐方法,如图1b所示,包括:
S11:获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳。
其中,历史时段可以是当前所在时刻之前的一段历史时间,例如最近一天、最近三小时等。目标用户点击的内容记录可以是多种形式的网络内容,例如可以是文字、图片、视频或多种表达形式相结合的网络内容。
内容记录中包括被点击内容所属类别的分类标签,该分类标签可以是生成网络内容时作者对网络内容添加的标签,也可以是根据网络内容的特征自动识别生成的。网络内容所属类别的分类标签可以有多个,多个分类标签可以具有不同的级别。例如分类标签可以是“科技”、“模型训练”、“召回算法”等,其中,“科技”标签所属的分类较大,“模型训练”标签和“召回算法”标签所属的分类较小。
为了提高内容推荐效率,对于任一被点击内容,可以预先设定分类标签的数量,例如对每个被点击内容确定三个分类标签。
内容记录中包括的被点击时间戳用于表示点击事件发生的时刻,通常而言,点击时间戳的数值越大则表明点击事件越靠近当前时刻。
在实际应用中,可以实时获取目标用户在不同的社交场景下点击的内容记录。其中,不同的社交场景具体可以指目标用户触发点击事件的执行方式。比如说,通过手机、平板电脑等不同的电子设备触发点击事件,或者,通过浏览器、社交应用程序等不同的软件触发点击事件,再或者,通过一个应用程序的首页、搜索栏、关注的人等不同入口触发点击事件等。
对于多社交场景的内容记录,可以预先对多种不同的场景设置业务编码,以便基于一定时间间隔周期性高效存储目标用户点击的内容记录。其中,一个时段周期的内容记录例如可以按照“社交场景业务编码-分类标签-点击时间戳”的格式逐条存储,以便高效查询调用。
S12:根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳。
在本步骤中,根据上述内容记录统计确定每个分类标签的推荐匹配度和最新点击时间戳。可选的,首先对内容记录去重,去除目标用户多次重复点击相同的内容,避免同一被点击内容多次被统计。然后遍历去重后的内容记录,统计每个分类标签所属类别的内容被点击的频次,以及记录分类标签所属类别的内容最近一次被点击的时间戳。
通过本步骤能得到每个分类标签的推荐匹配度和最新点击时间戳,其中,推荐匹配度可以表示目标用户对分类标签所属类别的内容的感兴趣程度,最新点击时间戳能表示目标用户对分类标签感兴趣的时效性。
可选的,将分类标签相对应的推荐匹配度和最新点击时间戳关联存储,以便后续步骤中高效调用。
S13:根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签。
在本步骤中,根据上述步骤中的推荐匹配度和/或最新点击时间戳对分类标签进行筛选,得到目标分类标签。实际应用中,被选中的目标分类标签具体可以是多个,选出的目标分类标签的数量可以根据实际需求预先设定,或者也可以根据预设推荐匹配度和/或预设最新点击时间戳等预设规则进行筛选。
具体而言,推荐匹配度能表示目标用户对分类标签所属内容感兴趣的程度,最新点击时间戳能表示目标用户对分类标签感兴趣的时效性。本步骤中基于感兴趣的程度与感兴趣的时效性这两个维度选择目标分类标签,有利于从多个分类标签中选出目标用户短期内感兴趣的目标分类标签。
其中,上述被点击内容的分类标签能表达出用户对哪一类内容感兴趣,点击时间戳能表达出用户对点击内容的兴趣时效性。根据内容记录分别确定每个分类标签的推荐匹配度和最新点击时间戳,能确定出用户对分类标签所属分类的感兴趣程度和感兴趣的时效性。进而根据推荐匹配度和最新点击时间戳来确定目标分类标签,能向用户推荐具有时效性的、用户感兴趣的内容,从而提升内容推荐的有效性和灵活性。
S14:向所述目标用户推荐所述目标分类标签对应的内容。
通过本方案选出的目标分类标签是目标用户感兴趣的、且具有一定时效性的分类标签。在本步骤中,将目标分类标签所属类别的内容作为推荐内容,能高效准确地向目标用户推荐短期时间内感性去的内容,使推荐内容灵活地跟随目标用户近期点击行为发生变化。本方案用于向用户推荐短期内感兴趣的内容,能适用于多种社交场景,可以用于弥补召回算法只能推荐用户过去较长时间感兴趣内容的缺陷,能及时随用户的行为变化相应变更推荐的内容。
基于上述实施例提供的方案,可选的,如图2所示,上述步骤S13,包括:
S21:根据所述推荐匹配度从多个分类标签中选出目标分类标签,其中,所述目标分类标签的推荐匹配度大于未被选中的分类标签的推荐匹配度;或者,
S22:根据所述最新点击时间戳从多个分类标签中选出目标分类标签,其中,所述目标分类标签的最新点击时间戳大于未被选中的分类标签的最新点击时间戳;或者,
S23:根据所述推荐匹配度和所述最新点击时间戳确定每个分类标签的兴趣得分,并基于所述兴趣得分从多个分类标签中选出目标分类标签,其中,所述目标分类标签的兴趣得分大于未被选中的分类标签的兴趣得分,所述兴趣得分表征所述目标用户对分类标签对应的内容的点击兴趣程度。
在本申请实施例中,可以根据推荐匹配度选出目标分类标签,或者,根据最新点击时间戳选出目标分类标签,或者,结合推荐匹配度和最新点击时间戳选出目标分类标签。
在上述步骤S21中,推荐匹配度可以表示目标用户对分类标签所属类别的内容的感兴趣程度,基于推荐匹配度对多个分类标签执行筛选,能从中选出目标用户感兴趣的目标分类标签。通过本步骤选出的目标分类标签能表示出目标用户对哪些分类标签感兴趣,有利于在随后步骤中向目标用户推荐感兴趣的内容,提升推荐内容对目标用户的吸引力。
在上述步骤S22中,最新点击时间戳能表示目标用户对分类标签感兴趣的时效性,基于最新点击时间戳对多个分类标签执行筛选,能从中选出目标用户最近点击的目标分类标签。选出的目标分类标签具有时效性,有利于在随后步骤中向目标用户推荐最近感兴趣的内容,使推荐内容跟随目标用户最近的兴趣相应变化,提升推荐内容的灵活性。
在上述步骤S23中,根据推荐匹配度和最新点击时间戳综合确定各个分类标签的兴趣得分。可选的,可以分别设置推荐匹配度和最新点击时间戳对应的权重,进而基于预设权重确定分类标签的兴趣得分,使确定的兴趣得分能综合表示目标用户对分类标签所属内容感兴趣的程度以及感兴趣的时效性。
其中,兴趣得分能综合表示目标用户对分类标签感兴趣的程度以及时效性,进而根据兴趣得分来确定目标分类标签能从感兴趣程度以及感兴趣时效性这两个维度上提高确定的目标分类标签的准确性,有利于向目标用户推荐最新的感兴趣的内容,有效提升推荐内容对目标用户的吸引力。
基于上述实施例提供的方案,可选的,如图3所示,上述步骤S23,包括:
S31:将待选分类标签的推荐匹配度与多个分类标签中的最大推荐匹配度的比值确定为匹配度兴趣得分,其中,所述待选分类标签为多个分类标签中任一分类标签。
本实例中,步骤S31与步骤S32可以同步进行。在本步骤S31中,基于多个分类标签中的最大推荐匹配度来确定待选分类标签的推荐匹配度。
其中,分类标签的推荐匹配度matchScore可以按下式(1-1)确定:
Figure BDA0004045667850000081
在实际应用中,遍历目标用户在历史时段内点击的内容记录,对于每一条被点击内容的内容记录,均按照上式(1-1)统计分类标签的推荐匹配度得分。如果目标用户重复点击待筛选分类标签所属的内容,则在遍历上述内容记录的过程中统计目标用户重复点击的次数,以确定待选分类标签对应的推荐匹配度matchScore。
在确定了推荐匹配度matchScore之后,根据多个分类标签中的最大推荐匹配度maxMatchScore,按照下式(1-2)来确定待选分类标签的匹配度兴趣得分matchScore′。
Figure BDA0004045667850000082
S32:将所述待选分类标签的最新点击时间戳与多个分类标签中时间最新的最新点击时间戳的差值与预设时间衰减权重的比值确定为时间戳兴趣得分。
本步骤S32中,遍历被点击内容的内容记录,并按照下式(2-1),更新待选分类标签的点击时间戳clickTime:
clickTime=max 当前的clickTime,历史存储的clickTime (2-1)
通过遍历内容记录,更新每个待选分类标签的点击时间戳。遍历完成后,每个待选分类标签的点击时间戳为最新点击时间戳,用以表示对应的待选分类标签所属的分类内容最新一次被目标用户点击的时刻,能表示出目标用户对待选分类标签所属内容感兴趣的时效性。
通过上述式(2-1)能分别确定各个待选分类标签的最新点击时间戳,随后,基于预设时间衰减权重timeWeight和多个分类标签中时间最新的最新点击时间戳maxClickTime,按下式(2-2)综合确定待选分类标签的时间戳兴趣得分clickTimeScore′。
Figure BDA0004045667850000091
S33:将所述匹配度兴趣得分与所述时间戳兴趣得分的加权之和确定为所述待选分类标签的兴趣得分。
在本步骤中,将上述待选分类标签的匹配度兴趣得分matchScore′和待选分类标签的时间戳兴趣得分clickTimeScore′的加权之和确定为待选分类标签的兴趣得分score,上式(1-1)、(1-2)、(2-1)和(2-2)可以综合表示为下式(3-1):
Figure BDA0004045667850000092
其中,匹配度兴趣得分的权重和时间戳兴趣得分的权重可以根据需求预先设定。
通过本申请实施例提供的方案,能根据待选分类标签在多个分类标签中的相对分值来确定待选分类标签的兴趣得分。实际应用中,可以分别对每个待选分类标签确定出兴趣得分,以便根据兴趣得分来比较目标用户对不同的待选分类标签感兴趣的程度,进而更准确地选出目标用户感兴趣的目标分类标签。
基于上述实施例提供的方案,可选的,如图4所示,上述步骤S23,包括:
S41:基于所述兴趣得分的大小对多个分类标签排序,基于排序结果确定排序靠前的设定数量的目标分类标签。
在确定各个分类标签的兴趣得分之后,基于兴趣得分从大到小的顺序对多个待选分类标签进行排序,排序结果能表明目标用户对多个待选分类标签感兴趣的程度。基于该排序结果从多个待选分类标签中选出排序靠前的设定数量的目标分类标签。
通过本申请实施例提供的方案,基于上述兴趣得分对多个分类标签进行排序,能高效准确地从多个待选分类标签中选出目标用户感兴趣的目标分类标签。在实际应用中,可以根据实际需求预先设定需要选出多少个目标分类标签,进而根据排序结果,将排序靠前的设定数量的待选分类标签选出,以得到预设数量个目标分类标签。
基于上述实施例提供的方案,可选的,如图5所示,所述被点击内容的所属类别的分类标签包括多个级别的分类标签。
在本申请实施例中,被点击内容的所属类别的分类标签分为多个级别,举例而言,假设被点击内容有三个级别的分类标签,分别是一级标签“科技”、二级标签“模型训练”和三级标签“召回模型”。
针对目标级别,多个分类标签中的最大推荐匹配度为所述待选分类标签所属的目标级别的多个分类标签中的最大推荐匹配度。
具体而言,在上述步骤S31中,多个分类标签中的最大推荐匹配度按照待选分类标签所属的目标级别来确定。举例而言,在确定上述一级标签“科技”的匹配度兴趣得分的步骤中,由于“科技”所属的目标级别是一级,因而确定出同属于一级的多个分类标签中的最大匹配度,并应用该最大匹配度来执行上述步骤S31,用以确定该标签“科技”的匹配度兴趣得分。相应的,二级标签“模型训练”则根据同属于二级的多个分类标签来确定最大匹配度,进而确定匹配度兴趣得分,以此类推。
多个分类标签中时间最新的最新点击时间戳为所述目标级别的多个分类标签中时间最新的最新点击时间戳,所述目标级别为所述多个级别中任一级别。
与上述确定多个分类标签中的最大推荐匹配度的方式类似,在上述步骤S32中,多个分类标签中时间最新的最新点击时间戳按照待选分类标签所属的目标级别来确定。举例而言,在确定上述一级标签“科技”的时间戳兴趣得分的步骤中,由于“科技”所属的目标级别是一级,因而确定出同属于一级的多个分类标签中时间最新的最新点击时间戳,并应用该最新点击时间戳执行上述步骤S32,用以确定该标签“科技”的时间戳兴趣得分。
其中,上述步骤S41,包括:
S51:基于所述兴趣得分对所述目标级别的多个分类标签进行排序,基于排序结果确定所述目标级别的所述目标分类标签。
在本实例中,分别对每个级别确定目标分类标签。其中,多个待选标签所属的级别可以是预先设定的,例如,一级标签可以包括“科技”、“历史”、“影视”、“生活”等多个待选标签。
举例而言,假设一级是目标级别,待选分类标签为“科技”,根据一级标签来确定“科技”标签的兴趣得分。具体而言,将“科技”标签的推荐匹配度与一级分类标签中的最大推荐匹配度的比值确定为“科技”标签的匹配度兴趣得分。将“科技”标签的最新点击时间戳与一级分类标签中的最新点击时间戳的差值与预设时间衰减权重的比值确定为“科技”标签的时间戳兴趣得分,然后将“科技”标签的匹配度兴趣得分和时间戳兴趣得分相加得到该科技”标签的兴趣得分。
相应的,对其他分类标签也按照所属级别来确定兴趣得分。通过本申请实施例提供的方案,能基于标签的级别来确定待选分类标签的兴趣得分,使确定的兴趣得分更准确。在选定目标分类标签时,基于兴趣得分在同一级别的多个待选分类标签中选择,能使选择结果包含多个不同级别的分类标签,进而能对目标用户实现不同分类级别的内容推荐。
基于上述实施例提供的方案,可选的,如图6所示,上述步骤S14,包括:
S61:构建包含多个级别的目标分类标签的兴趣标签集合。
在本申请实施例提供的方案中,分别对多个级别确定目标分类标签,每个级别确定出的目标分类标签可以预先设定,例如,从一级待选分类标签中确定第一数量的目标分类标签,从二级待选分类标签中确定第二数量的目标分类标签等。随后,将多个级别的目标分类标签汇总为兴趣标签集合,该兴趣标签集合包括多个不同级别的目标分类标签。
上述构建的兴趣标签集合中包含有多个目标分类标签,可选的,兴趣标签集合中的任一目标分类标签可以携带有所属级别的标识,该所属级别标识可以作为对应的目标分类标签的权重,从而使兴趣标签集合能表达出多个目标分类标签所属的级别,进而表示出目标用户感兴趣的大分类与小分类。在实际应用中,该兴趣标签集合能用于提高确定出的目标用户感兴趣的内容的准确性,另外,也可以用于围绕目标用户感兴趣的目标分类标签进行泛化推荐。
举例而言,假设构建的兴趣标签集合中包含有二级标签“模型训练”和三级标签“召回模型”,那么,可以将二级标签是“模型训练”且三级标签是“召回模型”的内容推荐给目标用户,从而向目标用户推荐感兴趣的内容。
可选的,基于上述例子,也可以将二级标签是“模型训练”且三级标签与“召回模型”相关的分类标签的内容推荐给目标用户,从而在目标用户感兴趣的“召回模型”的基础上进行泛化推荐。其中,推荐内容的二级标签是“模型训练”能确保推荐内容对目标用户具有一定的吸引力。选择的与“召回模型”相关的分类标签例如可以是“模型激活”、“召回算法”等,从而能围绕目标用户感兴趣的“召回模型”标签向目标用户进行泛化推荐,提升推荐内容的灵活性。
S62:基于所述兴趣标签集合构建多个组合标签,所述组合标签包括所述兴趣标签集合中抽选的多个目标分类标签。
在本步骤中,基于兴趣标签集合中的不同级别的目标分类标签,构建组合标签,该组合标签包括多个目标分类标签,且组合标签中的多个目标分类标签属于不同的级别。举例而言,首先抽选出一级目标分类标签,然后在选中的一级目标分类标签下继续抽选二级目标分类标签,进一步的,在二级目标分类标签下抽选三级目标分类标签,从而得到包含三个级别的目标分类标签的组合标签。
可选的,任一组合标签包括每个级别的目标分类标签。换言之,基于所述兴趣标签集合构建多个组合标签的步骤具体包括:对每个级别的分类标签均抽取至少一个目标分类标签,用以构成包含每个级别的目标分类标签的组合标签。假设分类标签共有三个级别,那么,分别从一级、二级和三级的分类标签中抽取目标分类标签,以构成包含这三个级别的目标分类标签的组合标签。
举例而言,选中的一级目标分类标签为“科技”。随后,在“科技”标签下的多个二级标签中选出二级目标分类标签,例如为“模型训练”。然后,再在“模型训练”下的多个三级标签中选出三级目标分类标签,例如为“召回模型”。从而得到包含三个级别的组合标签,为“科技”-“模型训练”-“召回模型”。
或者,也可以仅对部分级别执行抽取。例如,从一级和二级的分类标签中执行抽取,得到的组合标签为“科技”-“模型训练”。仅从部分级别抽取目标分类标签,构建出的组合标签能用于对目标用户进行泛化推荐。例如,除了向目标用户推荐“科技”-“模型训练”-“召回模型”的内容以外,还可以推荐“科技”-“模型训练”的内容,这部分内容能向用户推荐“召回模型”以外的相关内容,也可能引发目标用户的兴趣,从而达到吸引用户的目的。
另外,对于任一级别抽选的目标分类标签的数量可以有多个。例如,在二级待选分类标签中抽取“模型训练”和“模型优化”,从而向目标用户推荐“模型训练”与“模型优化”这两个分类标签均关联的内容,提升推荐内容对目标用户的吸引力。
S63:基于召回算法向所述目标用户推荐所述多个组合标签对应的内容。
将上述步骤中确定的组合标签作为召回算法的召回依据,提高确定推荐内容的准确性和有效性,灵活向目标用户推荐近期感兴趣的内容,弥补了召回算法往往以较长历史行为作为依据的缺陷。
基于上述实施例提供的方案,可选的,如图7所示,上述步骤S12,包括:
S71:遍历所述内容记录,以累计分类标签所属类别的内容被点击的频次,且更新分类标签所属类别的内容的最新点击时间戳;
S72:根据分类标签所属类别的内容被点击的频次确定分类标签的推荐匹配度。
在本申请实施例中,通过遍历内容记录来累计分类标签所属类别的内容被点击的频次。实际应用中,内容记录中可以包含目标用户点击的内容,可以按照目标用户点击内容的时间戳来顺序遍历内容记录,以累计分类标签所属内容被点击的频次。在遍历内容记录完成后,累计得到即是一个时间周期内分类标签所属内容被点击的频次。
可选的,基于预设时长,周期性统计分类标签的推荐匹配度和最新点击时间戳,从而以预设时长为间隔,跟随目标用户点击内容的变化相应变更推荐的内容,实现用户行为兴趣的及时反馈。
通过本申请实施例提供的方案,能实现对目标用户短期时间内行为兴趣的捕捉,能做出即时反馈推荐。能广泛应用于多种场景中,实现用户在多个社交场景下的兴趣融合,作为召回依据能有效丰富用户体验。
为了解决现有技术中存在的问题,本申请实施例提供一种内容推荐装置80,如图8所示,包括:
获取模块81,获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
第一确定模块82,根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
第二确定模块83,根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
推荐模块84,向所述目标用户推荐所述目标分类标签对应的内容。
通过本申请实施例提供的装置,用户在历史时段内的点击的内容记录能表现出用户在历史时段内感兴趣的内容。其中,分类标签能表达出用户对哪一类内容感兴趣,点击时间戳能表达出用户对点击内容的兴趣时效性。根据内容记录分别确定每个分类标签的推荐匹配度和最新点击时间戳,能确定出用户对分类标签所属分类的感兴趣程度和感兴趣的时效性。进而根据推荐匹配度和最新点击时间戳来确定目标分类标签,进而根据目标分类标签确定推荐内容,能提升内容推荐的有效性和灵活性。
其中,本申请实施例提供的装置中的上述模块还可以实现上述方法实施例提供的方法步骤。或者,本申请实施例提供的装置还可以包括除上述模块以外的其他模块,用以实现上述方法实施例提供的方法步骤。且本申请实施例提供的装置能够实现上述方法实施例所能达到的技术效果。
优选的,基于相同的技术构思,本申请实施例还提供了一种电子设备,该电子设备用于执行上述的一种内容推荐方法,图9为实现本申请各个实施例的一种电子设备的结构示意图。电子设备可因配置或性能不同而产生比较大的差异,可以包括处理器(processor)902、通信接口(Communications Interface)904、存储器(memory)906和通信总线908,其中,处理器902,通信接口904,存储器906通过通信总线908完成相互间的通信。处理器902可以调用存储在存储器906上并可在处理器902上运行的计算机程序,以执行下述步骤:
获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
向所述目标用户推荐所述目标分类标签对应的内容。
具体执行步骤可以参见上述一种内容推荐方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括:服务器、终端或除终端之外的其他设备。
以上电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,例如,输入单元,可以包括图形处理器(Graphics Processing Unit,GPU)和麦克风,显示单元可以采用液晶显示器、有机发光二极管等形式来配置显示面板。用户输入单元包括触控面板以及其他输入设备中的至少一种。触控面板也称为触摸屏。其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器可用于存储软件程序以及各种数据。存储器可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括易失性存储器或非易失性存储器,或者,存储器可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。
处理器可包括一个或多个处理单元;可选的,处理器集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述一种内容推荐方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述一种内容推荐方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种内容推荐方法,其特征在于,包括:
获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
向所述目标用户推荐所述目标分类标签对应的内容。
2.如权利要求1所述的方法,其特征在于,根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签,包括:
根据所述推荐匹配度从多个分类标签中选出目标分类标签,其中,所述目标分类标签的推荐匹配度大于未被选中的分类标签的推荐匹配度;或者,
根据所述最新点击时间戳从多个分类标签中选出目标分类标签,其中,所述目标分类标签的最新点击时间戳大于未被选中的分类标签的最新点击时间戳;或者,
根据所述推荐匹配度和所述最新点击时间戳确定每个分类标签的兴趣得分,并基于所述兴趣得分从多个分类标签中选出目标分类标签,其中,所述目标分类标签的兴趣得分大于未被选中的分类标签的兴趣得分,所述兴趣得分表征所述目标用户对分类标签对应的内容的点击兴趣程度。
3.如权利要求2所述的方法,其特征在于,根据所述推荐匹配度和所述最新点击时间戳确定每个分类标签的兴趣得分,包括:
将待选分类标签的推荐匹配度与多个分类标签中的最大推荐匹配度的比值确定为匹配度兴趣得分,其中,所述待选分类标签为多个分类标签中任一分类标签;
将所述待选分类标签的最新点击时间戳与多个分类标签中时间最新的最新点击时间戳的差值与预设时间衰减权重的比值确定为时间戳兴趣得分;
将所述匹配度兴趣得分与所述时间戳兴趣得分的加权之和确定为所述待选分类标签的兴趣得分。
4.如权利要求3所述的方法,其特征在于,基于所述兴趣得分从多个分类标签中选出目标分类标签,包括:
基于所述兴趣得分的大小对多个分类标签排序,基于排序结果确定排序靠前的设定数量的目标分类标签。
5.如权利要求4所述的方法,其特征在于,所述被点击内容的所属类别的分类标签包括多个级别的分类标签;针对目标级别,多个分类标签中的最大推荐匹配度为所述目标级别的多个分类标签中的最大推荐匹配度;多个分类标签中时间最新的最新点击时间戳为所述目标级别的多个分类标签中时间最新的最新点击时间戳,所述目标级别为所述多个级别中任一级别;
其中,基于所述兴趣得分的大小对多个分类标签排序,基于排序结果确定排序靠前的设定数量的目标分类标签,包括:
基于所述兴趣得分对所述目标级别的多个分类标签进行排序,基于排序结果确定所述目标级别的所述目标分类标签。
6.如权利要求5所述的方法,其特征在于,向所述目标用户推荐所述目标分类标签对应的内容,包括:
构建包含多个级别的目标分类标签的兴趣标签集合;
基于所述兴趣标签集合构建多个组合标签,所述组合标签包括所述兴趣标签集合中抽选的多个目标分类标签;
基于召回算法向所述目标用户推荐所述多个组合标签对应的内容。
7.如权利要求1~6任一项所述的方法,其特征在于,根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,包括:
遍历所述内容记录,以累计分类标签所属类别的内容被点击的频次,且更新分类标签所属类别的内容的最新点击时间戳;
根据分类标签所属类别的内容被点击的频次确定分类标签的推荐匹配度。
8.一种内容推荐装置,其特征在于,包括:
获取模块,获取目标用户在历史时段内点击的内容记录,所述内容记录包括被点击内容的所属类别的分类标签和被点击内容的点击时间戳;
第一确定模块,根据所述内容记录分别确定每个所述分类标签的推荐匹配度和最新点击时间戳,所述推荐匹配度表征分类标签所属类别的内容被点击的频次,所述最新点击时间戳为分类标签所属类别的内容最新一次被点击的时间戳;
第二确定模块,根据所述推荐匹配度和/或所述最新点击时间戳从多个分类标签中选出目标分类标签;
推荐模块,向所述目标用户推荐所述目标分类标签对应的内容。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
CN202310027375.6A 2023-01-09 2023-01-09 一种内容推荐方法和装置 Pending CN116257684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310027375.6A CN116257684A (zh) 2023-01-09 2023-01-09 一种内容推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310027375.6A CN116257684A (zh) 2023-01-09 2023-01-09 一种内容推荐方法和装置

Publications (1)

Publication Number Publication Date
CN116257684A true CN116257684A (zh) 2023-06-13

Family

ID=86683602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310027375.6A Pending CN116257684A (zh) 2023-01-09 2023-01-09 一种内容推荐方法和装置

Country Status (1)

Country Link
CN (1) CN116257684A (zh)

Similar Documents

Publication Publication Date Title
AU2014201827B2 (en) Scoring concept terms using a deep network
CN105447184B (zh) 信息抓取方法及装置
US9317613B2 (en) Large scale entity-specific resource classification
JP4524709B2 (ja) 情報処理装置および方法、並びに、プログラム
Weiler et al. Survey and experimental analysis of event detection techniques for twitter
CN110704674A (zh) 一种视频播放完整度预测方法及装置
US10255363B2 (en) Refining search query results
US12105765B2 (en) Combined wide and deep machine learning models for automated database element processing systems, methods and apparatuses
CN113609374A (zh) 基于内容推送的数据处理方法、装置、设备及存储介质
CN106528716A (zh) 一种多媒体搜索内容的推荐方法和装置
US11036817B2 (en) Filtering and scoring of web content
JP6728178B2 (ja) 検索データを処理するための方法及び装置
CN102955810A (zh) 一种网页分类方法和设备
CN103164423A (zh) 一种用于确定渲染网页的浏览器内核类型的方法与设备
CN102402563A (zh) 网络信息筛选方法和装置
CN110969501A (zh) 网络购物车页面的显示方法、系统、设备和存储介质
CN104077281B (zh) 一种生成推广语的方法和装置
CN108038739A (zh) 一种根据统计数据关联度确定扩展用户的方法和系统
CN106649374B (zh) 导航标签排序的方法及装置
CN108182600A (zh) 一种根据加权计算来确定扩展用户的方法和系统
WO2016206395A1 (zh) 周报信息处理方法及装置
CN116257684A (zh) 一种内容推荐方法和装置
CN115080824A (zh) 目标词的挖掘方法、装置、电子设备及存储介质
CN108053260A (zh) 一种根据统计数据兴趣度确定扩展用户的方法和系统
KR101997613B1 (ko) 인공지능을 활용한 기업과 이벤트 상호 매칭시스템 및 매칭방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination