CN110781341A - 一种融合多策略召回数据集的音频专辑推荐方法及系统 - Google Patents

一种融合多策略召回数据集的音频专辑推荐方法及系统 Download PDF

Info

Publication number
CN110781341A
CN110781341A CN201910952304.0A CN201910952304A CN110781341A CN 110781341 A CN110781341 A CN 110781341A CN 201910952304 A CN201910952304 A CN 201910952304A CN 110781341 A CN110781341 A CN 110781341A
Authority
CN
China
Prior art keywords
user
recall
data set
album
recall data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910952304.0A
Other languages
English (en)
Inventor
徐文铭
杨晶生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Microphone Culture Media Co Ltd
Original Assignee
Shanghai Microphone Culture Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Microphone Culture Media Co Ltd filed Critical Shanghai Microphone Culture Media Co Ltd
Priority to CN201910952304.0A priority Critical patent/CN110781341A/zh
Publication of CN110781341A publication Critical patent/CN110781341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合多策略召回数据集的音频专辑推荐方法及系统,方法包括判断用户操作是否满足推荐触发条件:若不满足,则基于用户操作给用户推荐预设的音频专辑;若满足,则基于用户操作和用户的离线历史行为数据生成离线召回数据集;基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;基于待推荐召回集对推荐给用户的音频专辑进行变更。本发明通过融合不同策略的召回数据集结果,使推荐内容更加合理。

Description

一种融合多策略召回数据集的音频专辑推荐方法及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种融合多策略召回数据集的音频专辑推荐方法及系统。
背景技术
在网络音乐平台中,通常通过音频专辑推荐系统为用户推荐用户感兴趣的音频专辑,而音频专辑推荐系统中最重要的一个环节是推荐算法,推荐算法包含了粗排序召回和精排序Ranking部分。现有的音频专辑推荐过程中,仅考虑用户离线数据或者用户实时数据,由于用户离线数据考虑到的是用户的离线长期爱好需求,数据可以从全局来考虑,但是更新速度慢,没有考虑到用户的实时兴趣倾向,用户实时数据考虑到的是用户的实时兴趣倾向,更新速度快,可以快速反映用户的实时兴趣偏好,但实时数据比较少,容易出现推荐千篇一律的现象,另外,由于音乐网络平台每天都有线上线的音频专辑,现有的音频专辑推荐过程中没有考虑到新上线的音频专辑的推广需求,因此现有的音频专辑推荐内容不能全面、真实反映用户的兴趣爱好,也无法满足推广新上线音频专辑的需求。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,特别创新地提出了一种融合多策略召回数据集的音频专辑推荐方法及系统,通过融合不同策略的召回数据集结果,提升了召回集的质量,兼顾用户实时兴趣和历史兴趣,使得频专辑推荐内容更全面,更能真实反映用户的兴趣爱好,且推荐内容考虑了新上线音频专辑,提升了新上线音频专辑的曝光度,保障了精排序结果的多样性,使推荐内容更加合理,有效提升用户体验。
为了实现本发明的上述目的,根据本发明的第一个方面,本发明提供了一种融合多策略召回数据集的音频专辑推荐方法,所述方法包括如下步骤:
S1,判断用户操作是否满足推荐触发条件:
当用户操作不满足所述推荐触发条件时,执行步骤S2;
当用户操作满足所述推荐触发条件时,执行步骤S3~S7;
S2,基于用户操作给用户推荐预设的音频专辑;
S3,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
S4,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
S5,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
S6,对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
S7,基于所述待推荐召回集对推荐给用户的音频专辑进行变更。
优选地,所述方法还包括:
定义所述推荐触发条件。
优选地,所述基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给所述用户。
优选地,所述基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID从数据库中提取与所述用户ID对应的离线历史行为数据;
基于所述离线历史行为数据调用召回模型生成所述离线召回数据集。
优选地,所述对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集包括:
将所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将所述组合召回数据集进行数据清洗去重处理;
将去重处理后的所述组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的所述组合召回数据集中排名TopN的音频专辑生成待推荐召回集,所述N为自然数。
根据本发明的第二个方面,本发明提供了一种融合多策略召回数据集的音频专辑推荐系统,所述系统包括:
判断模块,用于判断用户操作是否满足推荐触发条件;
第一推荐模块,用于当用户操作不满足所述推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;
第一召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
第二召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
第三召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
数据融合模块,用于对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
第二推荐模块,用于基于所述待推荐召回集对推荐给用户的音频专辑进行变更。
优选地,所述系统还包括:
定义模块,用于定义所述推荐触发条件。
优选地,所述基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给所述用户。
优选地,所述基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID从数据库中提取与所述用户ID对应的离线历史行为数据;
基于所述离线历史行为数据调用召回模型生成所述离线召回数据集。
优选地,所述数据融合模块具体用于:
将所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将所述组合召回数据集进行数据清洗去重处理;
将去重处理后的所述组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的所述组合召回数据集中排名TopN的音频专辑生成待推荐召回集,所述N为自然数。
由以上方案可知,本发明提供了一种融合多策略召回数据集的音频专辑推荐方法及系统,所述方法包括判断用户操作是否满足推荐触发条件:当用户操作不满足所述推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;当用户操作满足所述推荐触发条件时,基于用户操作和用户的离线历史行为数据生成离线召回数据集;基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;基于所述待推荐召回集对推荐给用户的音频专辑进行变更。本发明通过融合不同策略的召回数据集结果,提升了召回集的质量,兼顾用户实时兴趣和历史兴趣,使得频专辑推荐内容更全面,更能真实反映用户的兴趣爱好,且推荐内容考虑了新上线音频专辑,提升了新上线音频专辑的曝光度,保障了精排序结果的多样性,使推荐内容更加合理,有效提升用户体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明提供的一种优选实施方式中融合多策略召回数据集的音频专辑推荐方法的流程示意图;
图2是本发明提供的一种优选实施方式中融合多策略召回数据集的音频专辑推荐系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
根据本发明的第一个方面,本发明提供了一种融合多策略召回数据集的音频专辑推荐方法,如图1所示,该方法可以包括如下步骤:
S1,判断用户操作是否满足推荐触发条件:
当用户操作不满足推荐触发条件时,执行步骤S2;
当用户操作满足推荐触发条件时,执行步骤S3~S7;
为了能够能更好地为用户推荐用满足用户需求的音频专辑,提升用户体验,在网络音乐平台中,通过配置相应的推荐系统来召回用户感兴趣的相应音频专辑。当用户登录网络音乐平台后,需要通过推荐系统推荐相应的音频专辑,首先需要判断当前进行的用户操作是否满足预设的推荐触发条件,即判断当前的用户操作包含的操作信息是否与预设的推荐触发条件匹配。其中,用户操作包含的操作信息可以是用户在网络音乐平台的交互界面进行的点击操作,根据点击操作获取对应的操作信息,再根据获取到的操作信息与预设的推荐触发条件进行比对,根据比对得出的不同结果执行不同的推荐算法。
S2,基于用户操作给用户推荐预设的音频专辑;
当用户操作不满足推荐触发条件时,则根据用户操作给用户推荐预设的音频专辑,具体地,该预设的音频专辑可以是推荐系统在接收用户操作之前预先根据推荐系统的推荐算法召回的音频专辑,或者可以是用户上一次操作时系统推荐给用户的音频专辑,即在用户操作不满足推荐条件的时候,保持原有的推荐内容不变。
S3,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,根据用户操作和用户的离线历史行为数据通过预设的离线召回策略生成离线召回数据集。
S4,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,也根据用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集,其中,该实时/近实时触发的音频专辑集合为用户进行步骤1中的所述用户操作时触发的音频专辑的集合。
S5,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,也根据用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集,其中新上线的音频专辑为上一次为用户推荐时还未上线至网络音乐平台的音频专辑。
S6,对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
当通过步骤S3、S4和S5获取到各个对应的召回数据集后,则对获得的各个数据集进行数据融合,从而结合三种不同的推荐策略生成粗排召回的待推荐召回集。
S7,基于待推荐召回集对推荐给用户的音频专辑进行变更。
最后,将数据融合得到的待推荐召回集作为粗排召回结果传给推荐系统的精排序模块进行精排序处理后得到最终的推荐内容,将推荐系统用户上一次操作时推荐给用户的音频专辑或预设的音频专辑变更为上述处理得到的最终推荐内容推荐给用户。
具体地,在本实施方式中,上述步骤S3、S4和S5可以同时并列执行,也可以按上述三个步骤中的任意组合顺序执行。
在本实施方式中,所述方法还可以包括:
S0,定义推荐触发条件。
在为用户进行音频专辑的推荐前,首先算法工程师可以通过相应程序定义所述推荐触发条件,即满足该条件后才认为用户的推荐内容需要发生改变,否则,给用户的推荐内容维持原来的内容不变。推荐触发条件具体可以是用户操作的操作类型,用户执行给操作类型的操作时,才触发推荐系统进行推荐内容的变更。
在本实施方式中,基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取用户的用户ID;
基于用户ID在数据库中搜索与用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给用户。
在本实施方式中,基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取用户的用户ID;
基于用户ID从数据库中提取与用户ID对应的离线历史行为数据;
基于离线历史行为数据调用召回模型生成离线召回数据集。
在本实施方式中,对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集包括:
将离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将组合召回数据集进行数据清洗去重处理;
将去重处理后的组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的组合召回数据集中排名TopN的音频专辑生成待推荐召回集。上述N为自然数,根据用户需求具体设定,具体地,N可以为200或300。
由以上方案可知,本发明提供了一种融合多策略召回数据集的音频专辑推荐方法,首先判断用户操作是否满足推荐触发条件:当用户操作不满足推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;当用户操作满足推荐触发条件时,首先基于用户操作和用户的离线历史行为数据生成离线召回数据集;基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;接着对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;最后基于待推荐召回集对推荐给用户的音频专辑进行变更。本发明通过融合不同策略的召回数据集结果,提升了召回集的质量,兼顾用户实时兴趣和历史兴趣,使得频专辑推荐内容更全面,更能真实反映用户的兴趣爱好,且推荐内容考虑了新上线音频专辑,提升了新上线音频专辑的曝光度,保障了精排序结果的多样性,使推荐内容更加合理,有效提升用户体验。
根据本发明的第二个方面,本发明提供了一种融合多策略召回数据集的音频专辑推荐系统,如图2所示,所述系统可以包括:
判断模块201,用于判断用户操作是否满足推荐触发条件;
为了能够能更好地为用户推荐用满足用户需求的音频专辑,提升用户体验,在网络音乐平台中,通过配置相应的推荐系统来召回用户感兴趣的相应音频专辑。当用户登录网络音乐平台后,需要通过推荐系统推荐相应的音频专辑,首先需要判断当前进行的用户操作是否满足预设的推荐触发条件,即判断当前的用户操作包含的操作信息是否与预设的推荐触发条件匹配。其中,用户操作包含的操作信息可以是用户在网络音乐平台的交互界面进行的点击操作,根据点击操作获取对应的操作信息,再根据获取到的操作信息与预设的推荐触发条件进行比对,根据比对得出的不同结果执行不同的推荐算法。
第一推荐模块202,用于当用户操作不满足推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;
当用户操作不满足推荐触发条件时,则根据用户操作给用户推荐预设的音频专辑,具体地,该预设的音频专辑可以是推荐系统在接收用户操作之前预先根据推荐系统的推荐算法召回的音频专辑,或者可以是用户上一次操作时系统推荐给用户的音频专辑,即在用户操作不满足推荐条件的时候,保持原有的推荐内容不变。
第一召回模块203,用于当用户操作满足推荐触发条件时,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,根据用户操作和用户的离线历史行为数据通过预设的离线召回策略生成离线召回数据集。
第二召回模块204,用于当用户操作满足推荐触发条件时,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,也根据用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集,其中,该实时/近实时触发的音频专辑集合为用户进行步骤1中的所述用户操作时触发的音频专辑的集合。
第三召回模块205,用于当用户操作满足推荐触发条件时,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
当用户操作满足推荐触发条件时,则推荐系统认为用户的推荐内容需要发生变更,此时,也根据用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集,其中新上线的音频专辑为上一次为用户推荐时还未上线至网络音乐平台的音频专辑。
数据融合模块206,用于对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
当通过第一召回模块203、第二召回模块204和第三召回模块205获取到各个对应的召回数据集后,则对获得的各个数据集进行数据融合,从而结合三种不同的推荐策略生成粗排召回的待推荐召回集。
第二推荐模块207,用于基于待推荐召回集对推荐给用户的音频专辑进行变更。
最后,将数据融合得到的待推荐召回集作为粗排召回结果传给推荐系统的精排序模块进行精排序处理后得到最终的推荐内容,将推荐系统用户上一次操作时推荐给用户的音频专辑或预设的音频专辑变更为上述处理得到的最终推荐内容推荐给用户。
在本实施方式中,所述系统还可以包括:
定义模块200,用于定义推荐触发条件。
在为用户进行音频专辑的推荐前,首先算法工程师可以通过相应程序定义所述推荐触发条件,即满足该条件后才认为用户的推荐内容需要发生改变,否则,给用户的推荐内容维持原来的内容不变。推荐触发条件具体可以是用户操作的操作类型,用户执行给操作类型的操作时,才触发推荐系统进行推荐内容的变更。
在本实施方式中,所述基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取用户的用户ID;
基于用户ID在数据库中搜索与用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给用户。
在本实施方式中,所述基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取用户的用户ID;
基于用户ID从数据库中提取与用户ID对应的离线历史行为数据;
基于离线历史行为数据调用召回模型生成离线召回数据集。
在本实施方式中,数据融合模块206具体用于:
将离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将组合召回数据集进行数据清洗去重处理;
将去重处理后的组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的组合召回数据集中排名TopN的音频专辑生成待推荐召回集。上述N为自然数,根据用户需求具体设定,具体地,N可以为200或300。
由以上方案可知,本发明提供了一种融合多策略召回数据集的音频专辑推荐系统,通过判断用户操作是否满足推荐触发条件:当用户操作不满足推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;当用户操作满足推荐触发条件时,基于用户操作和用户的离线历史行为数据生成离线召回数据集;基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;对离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;基于待推荐召回集对推荐给用户的音频专辑进行变更,本发明通过融合不同策略的召回数据集结果,提升了召回集的质量,兼顾用户实时兴趣和历史兴趣,使得频专辑推荐内容更全面,更能真实反映用户的兴趣爱好,且推荐内容考虑了新上线音频专辑,提升了新上线音频专辑的曝光度,保障了精排序结果的多样性,使推荐内容更加合理,有效提升用户体验。
本实施例中,所述融合多策略召回数据集的音频专辑推荐系统集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种融合多策略召回数据集的音频专辑推荐方法,其特征在于,所述方法包括:
S1,判断用户操作是否满足推荐触发条件:
当用户操作不满足所述推荐触发条件时,执行步骤S2;
当用户操作满足所述推荐触发条件时,执行步骤S3~S7;
S2,基于用户操作给用户推荐预设的音频专辑;
S3,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
S4,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
S5,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
S6,对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
S7,基于所述待推荐召回集对推荐给用户的音频专辑进行变更。
2.根据权利要求1所述的融合多策略召回数据集的音频专辑推荐方法,其特征在于,所述方法还包括:
定义所述推荐触发条件。
3.根据权利要1或2所述的融合多策略召回数据集的音频专辑推荐方法,其特征在于,所述基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给所述用户。
4.根据权利要求1或2所述的融合多策略召回数据集的音频专辑推荐方法,其特征在于,所述基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID从数据库中提取与所述用户ID对应的离线历史行为数据;
基于所述离线历史行为数据调用召回模型生成所述离线召回数据集。
5.根据权利要4所述的融合多策略召回数据集的音频专辑推荐方法,其特征在于,所述对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集包括:
将所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将所述组合召回数据集进行数据清洗去重处理;
将去重处理后的所述组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的所述组合召回数据集中排名TopN的音频专辑生成待推荐召回集,所述N为自然数。
6.一种融合多策略召回数据集的音频专辑推荐系统,其特征在于,所述系统包括:
判断模块,用于判断用户操作是否满足推荐触发条件;
第一推荐模块,用于当用户操作不满足所述推荐触发条件时,基于用户操作给用户推荐预设的音频专辑;
第一召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作和用户的离线历史行为数据生成离线召回数据集;
第二召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作和用户的实时/近实时触发的音频专辑集合生成用户实时/近实时的实时召回数据集;
第三召回模块,用于当用户操作满足所述推荐触发条件时,基于用户操作在网络音乐平台上随机抽取若干数量新上线的音频专辑作为新上线专辑召回数据集;
数据融合模块,用于对所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行数据融合,生成待推荐召回集;
第二推荐模块,用于基于所述待推荐召回集对推荐给用户的音频专辑进行变更。
7.根据权利要求6所述的融合多策略召回数据集的音频专辑推荐系统,其特征在于,所述系统还包括:
定义模块,用于定义所述推荐触发条件。
8.根据权利要6或7所述的融合多策略召回数据集的音频专辑推荐系统,其特征在于,所述基于用户操作给用户推荐预设的音频专辑包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑推荐给所述用户。
9.根据权利要求6或7所述的融合多策略召回数据集的音频专辑推荐系统,其特征在于,所述基于用户操作和用户的离线历史行为数据生成离线召回数据集包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID从数据库中提取与所述用户ID对应的离线历史行为数据;
基于所述离线历史行为数据调用召回模型生成所述离线召回数据集。
10.根据权利要9所述的融合多策略召回数据集的音频专辑推荐系统,其特征在于,所述数据融合模块具体用于:
将所述离线召回数据集、实时召回数据集和新上线专辑召回数据集进行合并得到组合召回数据集;
将所述组合召回数据集进行数据清洗去重处理;
将去重处理后的所述组合召回数据集中的音频专辑按照召回的得分进行降序排序;
取降序排序后的所述组合召回数据集中排名TopN的音频专辑生成待推荐召回集,所述N为自然数。
CN201910952304.0A 2019-10-09 2019-10-09 一种融合多策略召回数据集的音频专辑推荐方法及系统 Pending CN110781341A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910952304.0A CN110781341A (zh) 2019-10-09 2019-10-09 一种融合多策略召回数据集的音频专辑推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910952304.0A CN110781341A (zh) 2019-10-09 2019-10-09 一种融合多策略召回数据集的音频专辑推荐方法及系统

Publications (1)

Publication Number Publication Date
CN110781341A true CN110781341A (zh) 2020-02-11

Family

ID=69385438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910952304.0A Pending CN110781341A (zh) 2019-10-09 2019-10-09 一种融合多策略召回数据集的音频专辑推荐方法及系统

Country Status (1)

Country Link
CN (1) CN110781341A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339422A (zh) * 2020-03-03 2020-06-26 广东小天才科技有限公司 推荐系统任务管理平台、推荐方法及系统
CN112115370A (zh) * 2020-09-29 2020-12-22 贝壳技术有限公司 推荐方法、装置、计算机可读存储介质及电子设备
CN112287167A (zh) * 2020-10-29 2021-01-29 四川长虹电器股份有限公司 视频推荐召回方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816858B1 (en) * 2000-03-31 2004-11-09 International Business Machines Corporation System, method and apparatus providing collateral information for a video/audio stream
CN108830689A (zh) * 2018-06-13 2018-11-16 深圳乐信软件技术有限公司 物品推荐方法、装置、服务器和存储介质
CN109190043A (zh) * 2018-09-07 2019-01-11 北京三快在线科技有限公司 推荐方法及装置,存储介质,电子设备及推荐系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816858B1 (en) * 2000-03-31 2004-11-09 International Business Machines Corporation System, method and apparatus providing collateral information for a video/audio stream
CN108830689A (zh) * 2018-06-13 2018-11-16 深圳乐信软件技术有限公司 物品推荐方法、装置、服务器和存储介质
CN109190043A (zh) * 2018-09-07 2019-01-11 北京三快在线科技有限公司 推荐方法及装置,存储介质,电子设备及推荐系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
郝胜男;赵领杰;: "一种基于ElasticSearch的推荐系统架构" *
郝胜男;赵领杰;: "一种基于ElasticSearch的推荐系统架构", 电脑知识与技术, no. 36, 25 December 2017 (2017-12-25) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339422A (zh) * 2020-03-03 2020-06-26 广东小天才科技有限公司 推荐系统任务管理平台、推荐方法及系统
CN112115370A (zh) * 2020-09-29 2020-12-22 贝壳技术有限公司 推荐方法、装置、计算机可读存储介质及电子设备
CN112287167A (zh) * 2020-10-29 2021-01-29 四川长虹电器股份有限公司 视频推荐召回方法及装置

Similar Documents

Publication Publication Date Title
US11128582B2 (en) Emoji recommendation method and apparatus
US11475244B2 (en) Method for training model and information recommendation system
US11481657B2 (en) Content recommendation method, apparatus and system
CN102567475B (zh) 用于交互式查询重构的用户接口
CN106685933B (zh) 一种授权策略推荐及装置
CN110781341A (zh) 一种融合多策略召回数据集的音频专辑推荐方法及系统
CN111259192B (zh) 音频推荐方法和装置
CN110442790A (zh) 推荐多媒体数据的方法、装置、服务器和存储介质
EP2933770A1 (en) Method and system for pushing mobile application
US20160147767A1 (en) Dynamic feedback in a recommendation system
CN110765310B (zh) 一种基于参数配置的音频专辑推荐方法及系统
CN107306355A (zh) 一种内容推荐方法及服务器
US20150242750A1 (en) Asymmetric Rankers for Vector-Based Recommendation
CN105512156B (zh) 点击模型生成方法和装置
KR20160113685A (ko) 콘텐츠 추천 방법, 장치 및 시스템
WO2024066253A1 (zh) 基于互动小说的产品推荐方法及相关装置
CN107592572B (zh) 视频推荐方法、装置及其设备
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
CN108319646A (zh) 基于用户历史行为的车源搜索方法及装置
CN108304426A (zh) 标识的获取方法及装置
WO2017023872A1 (en) Systems and methods of providing recommendations of content items
US10579752B2 (en) Generating a model based on input
CN105893515B (zh) 一种信息处理方法及服务器
CN106254908B (zh) 多媒体资源播放方法和装置
CN112449002A (zh) 一种待推送对象的推送方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination