CN106326277B

CN106326277B - 一种基于用户行为的音频个性化推荐方法和系统

Info

Publication number: CN106326277B
Application number: CN201510373689.7A
Authority: CN
Inventors: 吕亚召
Original assignee: SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Current assignee: Shanghai Himalaya Technology Co ltd
Priority date: 2015-06-30
Filing date: 2015-06-30
Publication date: 2019-07-16
Anticipated expiration: 2035-06-30
Also published as: CN106326277A

Abstract

本发明公开了一种基于用户行为的音频个性化推荐方法和系统，能把被海量音频淹没的优质内容呈现给听众，为听众提供更好的个性化推荐服务。其技术方案为：收集用户数据和音频内容的特征属性，其中用户数据包括用户的人口学特征和用户行为数据；对所收集的用户行为数据进行清洗和整合；基于整合后的用户行为数据，分析用户之间的关系以及音频内容之间的相关性，计算用户对音频内容的评分；基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户。

Description

一种基于用户行为的音频个性化推荐方法和系统

技术领域

本发明涉及互联网尤其是移动互联网音频媒体领域，涉及数据收集、存储、处理和算法使用等技术。特别是涉及一种对用户行为进行多维度分析，进而可以探索用户与其他用户的协同交互，用户和音频内容的特征提取，综合各种行为特征，计算用户对音频内容的评分，从而可以向用户进行个性化推荐的一种方法和系统。

背景技术

近些年来，随着互联网技术和移动通讯的迅猛发展，移动互联网为人们的生活提供了前所未有的高效和便利。人们可以用过具有上网功能移动设备迅速获取所需生活，娱乐，学习等方方面面的信息。由于现代人工作繁忙，生活节奏快，“没有时间”去读报纸，看新闻，欣赏音乐等的现象已经变得越来越常见。而移动音频为人们提供一种最佳的利用如上下班路途，排队等候，运动健身等零碎时间的媒介。但是，随着数据技术的发展和用户需求的提高，音频的累积数据日益剧增,面对海量音频内容，要找到用户真正感兴趣的内容成为提高用户体验的关键。

业界亟待开发一种系统，能够为准确高效地从不同的角度为用户推荐用户所需要的音频内容。

发明内容

以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览，并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。

本发明的目的在于解决上述问题，提供了一种基于用户行为的音频个性化推荐方法和系统，能把被海量音频淹没的优质内容呈现给听众，为听众提供更好的个性化推荐服务。

本发明的技术方案为：本发明揭示了一种基于用户行为的音频个性化推荐方法，包括：

步骤1：收集用户数据和音频内容的特征属性，其中用户数据包括用户的人口学特征和用户行为数据；

步骤2：对所收集的用户行为数据进行清洗和整合；

步骤3：基于整合后的用户行为数据，分析用户之间的关系以及音频内容之间的相关性，计算用户对音频内容的评分；

步骤4：基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户。

根据本发明的基于用户行为的音频个性化推荐方法的一实施例，步骤1中，用户的人口学特征包括用户的性别、年龄和地域，用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容，音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。

根据本发明的基于用户行为的音频个性化推荐方法的一实施例，步骤2进一步包括：

对用户登录时间低于预设值且收听比例小于预设值的收听行为标记为误点击，从用户收听记录中删除；

用户对特定音频内容的收听间隔进行划分，小于指定间隔的将两次收听整合在一起，用于描述用户特定时段的收听新区，对用户特定时段收听的类别和标签进行统计，取出出现频率最高的标记为用户时段偏好；

进行时段划分，统计用户收听时段和时段偏好并做相应的标记；

考察音频内容被收听的时段，统计其出现频率在前的时段并做相应的标记，补充为音频内容的标签；

将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总，按照天数进行衰减，整合后的数据平衡考虑用户长短期的兴趣；

剔除用户远期订阅行为数据。

根据本发明的基于用户行为的音频个性化推荐方法的一实施例，步骤3进一步包括：

指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容；

对用户收听历史进行分析，根据收听时间的长短，进行预评分；

将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合；

根据用户收听历史音频内容评分，结合音频内容之间的相关性，计算对优选音频内容的评分。

根据本发明的基于用户行为的音频个性化推荐方法的一实施例，步骤4进一步包括：

基于每一音频内容的评分，将评分达到预定阈值的音频内容进行排序，并过滤掉用户最近收听和订阅的音频内容后，取得排名高于预设值的音频内容后，推送给用户。

本发明还揭示了一种基于用户行为的音频个性化推荐系统，包括：

数据收集模块，收集用户数据和音频内容的特征属性，其中用户数据包括用户的人口学特征和用户行为数据；

数据处理模块，对所收集的用户行为数据进行清洗和整合；

特征分析模块，基于整合后的用户行为数据，分析用户之间的关系以及音频内容之间的相关性，计算用户对音频内容的评分；

混合推荐模块，基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户。

根据本发明的基于用户行为的音频个性化推荐系统的一实施例，数据收集模块包括：

用户注册数据收集单元，收集用户注册时的用户性别、兴趣偏好、年龄、用户标签；

用户收听行为收集单元，收集用户的收听时长、收听类别、收听时段、登录时间；

用户社交行为收集单元，收集用户的社交行为，包括订阅、关注、私信、点赞、评论；

音频特征收集单元，收集音频和主播的特征、简介和标签。

根据本发明的基于用户行为的音频个性化推荐系统的一实施例，数据处理模块包括：

数据清洗单元，统计用户在线以剔除异常用户，剔除用户单次收听时间小于预设值的收听记录，剔除用户远期的订阅和关注记录；

数据整合单元，将一天内单个用户对单个内容的多次收听进行整合，同时将用户的订阅、点赞、评论行为分别进行整合，然后对用户中长期的行为关于时间进行衰减。

根据本发明的基于用户行为的音频个性化推荐系统的一实施例，特征分析模块包括：

特征提取单元，进行用户特征分析和音频内容特征分析，用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好，建立用户特征，音频内容特征分析包括对音频内容的简介、标签进行分析，并基于标签建立音频内容之间的相关性；

相关性分析单元，计算用户之间的关系以及音频内容之间的关系；

评分计算单元，计算用户对各个音频内容的偏好度评分，当音频内容的评分达到预设阈值时，作为候选推荐集合进入混合推荐模块。

根据本发明的基于用户行为的音频个性化推荐系统的一实施例，混合推荐模块进一步包括：

用户冷启动单元，通过收集用户的人口学数据，推荐符合特点的热播音频内容为猜你喜欢的音频；

评分综合排序单元，将各种场景下的推荐候选音频内容进行综合排序；

音频内容过滤单元，提出用户不喜欢的音频内容以及最近收听或订阅的音频内容；

推荐展示单元，进行四个场景的推荐展示，包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。

本发明对比现有技术有如下的有益效果：本发明是从用户的人口学特征和对音频内容的收听、订阅、点赞、评论等行为中挖掘用户对音频内容的潜在兴趣，并通过对音配内容被收听、订阅中挖掘音频内容的关系，结合音频内容间基于简介和标签建立的相关性，把被海量音频淹没的优质内容呈现给听众，为听众提供更好的个性化推荐服务。基于从用户数据和音频内容中提取的特征，计算用户对音频内容的评分，结合各种算法得出候选推荐项，并通过融合方法对推荐项进行重新排序，并对用户近期行为进行过滤，提高了用户对音频内容偏好度量的准确性。

附图说明

图1示出了本发明的基于用户行为的音频个性化推荐方法的较佳实施例的流程图。

图2示出了本发明的基于用户行为的音频个性化推荐系统的较佳实施例的流程图。

图3示出了计算音频内容的综合相关系数需要综合考虑的四种相关系数和相应的流程的示意图。

图4示出了融合各场景的推荐结果，产生最终推荐结果的流程的示意图。

具体实施方式

在结合以下附图阅读本公开的实施例的详细描述之后，能够更好地理解本发明的上述特征和优点。在附图中，各组件不一定是按比例绘制，并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。

图1示出了本发明的基于用户行为的音频个性化推荐方法的较佳实施例的流程。请参见图1，本实施例的基于用户行为的音频个性化推荐方法的详细实现如下。

步骤S1：收集用户数据和音频内容的特征属性，其中用户数据包括用户的人口学特征和用户行为数据。

通过用户授权收集用户的人口学特征，包括用户的性别、年龄和地域。收集用户行为数据，包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容。收集音频内容的特征属性，包括音频内容的类别、简介、标签、发布规律和初始评分。

步骤S2：对所收集的用户行为数据进行清洗和整合。

在这一步骤的清洗和整合，具体包括：

统计用户在线时间，剔除异常用户。

对用户登录时间低于预设值(比如小于30秒)且收听比例小于预设值(比如10％)的收听行为标记为误点击，从用户收听记录中删除。

用户对特定音频内容的收听间隔进行划分，小于指定间隔(例如1小时)的将两次收听整合在一起，用于描述用户特定时段的收听兴趣，对用户特定时段收听的类别和标签进行统计，取出出现频率最高的标记为用户时段偏好。

进行时段划分，具体可以分为6个时段：如早上、上下班地铁、工作时间、午休、睡前、凌晨等时间段，统计用户收听时段和时段偏好并做相应的标记。

考察音频内容被收听的时段，统计其出现频率在前的时段并做相应的标记，补充为音频内容的标签。

将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总，按照天数进行衰减，整合后的数据平衡考虑用户长短期的兴趣。

订阅数据的整合：剔除用户远期订阅行为数据，特别是很早订阅近期没有更新或没有收听的数据。

步骤S3：基于整合后的用户行为数据，分析用户之间的关系以及音频内容之间的相关性，计算用户对音频内容的评分。

在这一步骤中，具体包括：指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容，社交关系推荐是标准的机器学习算法，这里不再赘述。

对用户收听历史进行分析，根据收听时间的长短，进行预评分。

将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合。

根据用户收听历史音频内容评分，结合音频内容之间的相关性，计算对优选音频内容的评分，对评分达到预定阈值的音频内容，进入推荐模块。

如图3所示，音频内容之间的相关性计算考虑了用户收听、订阅行为、点赞和评论行为，以及基于音频内容简介和标签的信息，具体两个音频内容的相关系数的混合机制可参考图3。

考虑两个音频内容的被收听数据，基于收听数据可以构建音频内容之间的相关系数ρListen；考虑两个音频内容被订阅的数据，基于订阅数据可以构建音频内容之间的相关系数ρSub；考虑两个音频内容被点赞、评论和转发数据，基于点赞、评论转发数据可以得出两个音频内容的相关系数ρComment；考虑两个音频内容简介中关键词的匹配度和标签的匹配度，标准化到0-1之间，作为音频内容基于标签的相关系数ρTag。

将上述4个相似度融合为两个音频内容之间的相似度，此相似度和两个音频内容被收听，被收藏，被点赞、评论、转发的人数有关，如果用户行为较少，会自动增加基于标签和简介的相似度，这样可以自动优化相似度的计算。

步骤S4：基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户。

在这一步骤中，具体包括：基于每一音频内容的评分，将评分达到预定阈值的音频内容进行排序，并过滤掉用户最近收听和订阅的音频内容后，取得排名高于预设值的音频内容后，推送给用户。

音频内容的订阅历史评分是对用户订阅音频内容的历史按照音频内容订阅时间进行衰减。根据用户订阅历史音频内容，找出每个订阅音频内容最相关的音频内容，根据用户订阅历史音频内容的评分和前述音频内容相关性，计算用户对候选音频内容评分，评分达到预定预置的进入推荐模块。

统计用户的时段偏好和类别偏好，统计音频内容的时段分布。剔除候选音频内容中用户近期收听和订阅的音频内容。根据用户时段和类别偏好，取相应类别的评分高的音频内容在选定时段推荐给用户。

个性化推荐展示：当用户打开应用时单独页面展示该时段类别中评分较高的音频内容为猜你喜欢音频内容。

相关推荐展示：当用户浏览，收听音频内容时展示与当前音频内容相关的其他音频内容，其中音频内容相关性来源于音频内容综合相关系数。

某用户收听音频内容"英语口语"(时段:早上),"糗事播报"(时段:上下班)，"罗辑思维"(时段:睡前)，"最后一个道士"(时段:睡前)，"今晚80后脱口秀"(时段:睡前)，其中"罗辑思维"有点赞，"今晚80后脱口秀"有评论。

通过用户时段分析，分析该用户"上下班"时段的类别偏好为"娱乐","睡前"时段偏好为"有声小说和娱乐",早上时段偏好为"外语"。

在相应的时段，分别推荐满足类别的音频内容展示给用户。

图4示出了融合各场景的推荐结果，产生最终推荐结果的流程。

图2示出了本发明的基于用户行为的音频个性化推荐系统的较佳实施例的原理。请参见图2，本实施例的基于用户行为的音频个性化推荐系统的详细实现如下。

本实施例的基于用户行为的音频个性化推荐系统包括：数据收集模块1、数据处理模块2、特征分析模块3、混合推荐模块4。

数据收集模块1收集用户数据和音频内容的特征属性，其中用户数据包括用户的人口学特征和用户行为数据。

数据收集模块1包括用户注册数据收集单元11、用户收听行为收集单元12、用户社交行为收集单元13、音频特征收集单元14。

用户注册数据收集单元11收集用户注册时的用户性别、兴趣偏好、年龄、用户标签。用户收听行为收集单元12收集用户的收听时长、收听类别、收听时段、登录时间。用户社交行为收集单元13收集用户的社交行为，包括订阅、关注、私信、点赞、评论。音频特征收集单元14收集专辑和主播的特征、简介和标签。

数据处理模块2对所收集的用户行为数据进行清洗和整合。

数据处理模块2包括：数据清洗单元21和数据整合单元22。

数据清洗单元21统计用户在线以剔除异常用户，剔除用户单次收听时间小于预设值的收听记录，剔除用户远期的订阅和关注记录。

数据整合单元22将一天内单个用户对单个内容的多次收听进行整合，同时将用户的订阅、点赞、评论行为分别进行整合，然后对用户中长期的行为关于时间进行衰减。

特征分析模块3基于整合后的用户行为数据，分析用户之间的关系以及音频内容之间的相关性，计算用户对音频内容的评分。

特征分析模块3包括：特征提取单元31、相关性分析单元32、评分计算单元33。

特征提取单元31进行用户特征分析和音频内容特征分析，用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好，建立用户特征，音频内容特征分析包括对音频内容的简介、标签进行分析，并基于标签建立音频内容之间的相关性。

相关性分析单元32计算用户之间的关系以及音频内容之间的关系。

评分计算单元33计算用户对各个音频内容的偏好度评分，当音频内容的评分达到预设阈值时，作为候选推荐集合进入混合推荐模块。

混合推荐模块4基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户。

混合推荐模块4包括：用户冷启动单元41、评分综合排序单元42、音频内容过滤单元43、推荐展示单元44。

用户冷启动单元41通过收集用户的人口学数据，推荐符合特点的热播音频内容为猜你喜欢的音频。

评分综合排序单元42将各种场景下的推荐候选音频内容进行综合排序。

音频内容过滤单元43提出用户不喜欢的音频内容以及最近收听或订阅的音频内容。

推荐展示单元44进行四个场景的推荐展示，包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。

尽管为使解释简单化将上述方法图示并描述为一系列动作，但是应理解并领会，这些方法不受动作的次序所限，因为根据一个或多个实施例，一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。

本领域技术人员将进一步领会，结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性，各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性，但这样的实现决策不应被解读成导致脱离了本发明的范围。

结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器，但在替换方案中，该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中，存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中，处理器和存储介质可作为分立组件驻留在用户终端中。

在一个或多个示例性实施例中，所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品，则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者，其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定，这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如，如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来，则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟，其中盘(disk)往往以磁的方式再现数据，而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。

提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的，且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此，本公开并非旨在被限定于本文中所描述的示例和设计，而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims

1.一种基于用户行为的音频个性化推荐方法，包括：

步骤2：对所收集的用户行为数据进行清洗和整合；

步骤4：基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户；

其中步骤2进一步包括：

剔除用户远期订阅行为数据。

2.根据权利要求1所述的基于用户行为的音频个性化推荐方法，其特征在于，步骤1中，用户的人口学特征包括用户的性别、年龄和地域，用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容，音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。

3.根据权利要求1所述的基于用户行为的音频个性化推荐方法，其特征在于，步骤3进一步包括：

根据用户收听历史音频内容评分，结合音频内容之间的相关性，计算对候选音频内容的评分。

4.根据权利要求1所述的基于用户行为的音频个性化推荐方法，其特征在于，步骤4进一步包括：

5.一种基于用户行为的音频个性化推荐系统，包括：

数据处理模块，对所收集的用户行为数据进行清洗和整合；

混合推荐模块，基于音频内容的评分进行重新排序，将排序结果靠前的音频内容呈现给用户；

其中特征分析模块包括：

6.根据权利要求5所述的基于用户行为的音频个性化推荐系统，其特征在于，数据收集模块包括：

音频特征收集单元，收集音频和主播的特征、简介和标签。

7.根据权利要求5所述的基于用户行为的音频个性化推荐系统，其特征在于，数据处理模块包括：

8.根据权利要求5所述的基于用户行为的音频个性化推荐系统，其特征在于，混合推荐模块进一步包括：