CN106326277B - 一种基于用户行为的音频个性化推荐方法和系统 - Google Patents

一种基于用户行为的音频个性化推荐方法和系统 Download PDF

Info

Publication number
CN106326277B
CN106326277B CN201510373689.7A CN201510373689A CN106326277B CN 106326277 B CN106326277 B CN 106326277B CN 201510373689 A CN201510373689 A CN 201510373689A CN 106326277 B CN106326277 B CN 106326277B
Authority
CN
China
Prior art keywords
user
audio content
audio
data
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510373689.7A
Other languages
English (en)
Other versions
CN106326277A (zh
Inventor
吕亚召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Himalaya Technology Co ltd
Original Assignee
SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd filed Critical SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Priority to CN201510373689.7A priority Critical patent/CN106326277B/zh
Publication of CN106326277A publication Critical patent/CN106326277A/zh
Application granted granted Critical
Publication of CN106326277B publication Critical patent/CN106326277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户行为的音频个性化推荐方法和系统,能把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。其技术方案为:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;对所收集的用户行为数据进行清洗和整合;基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。

Description

一种基于用户行为的音频个性化推荐方法和系统
技术领域
本发明涉及互联网尤其是移动互联网音频媒体领域,涉及数据收集、存储、处理和算法使用等技术。特别是涉及一种对用户行为进行多维度分析,进而可以探索用户与其他用户的协同交互,用户和音频内容的特征提取,综合各种行为特征,计算用户对音频内容的评分,从而可以向用户进行个性化推荐的一种方法和系统。
背景技术
近些年来,随着互联网技术和移动通讯的迅猛发展,移动互联网为人们的生活提供了前所未有的高效和便利。人们可以用过具有上网功能移动设备迅速获取所需生活,娱乐,学习等方方面面的信息。由于现代人工作繁忙,生活节奏快,“没有时间”去读报纸,看新闻,欣赏音乐等的现象已经变得越来越常见。而移动音频为人们提供一种最佳的利用如上下班路途,排队等候,运动健身等零碎时间的媒介。但是,随着数据技术的发展和用户需求的提高,音频的累积数据日益剧增,面对海量音频内容,要找到用户真正感兴趣的内容成为提高用户体验的关键。
业界亟待开发一种系统,能够为准确高效地从不同的角度为用户推荐用户所需要的音频内容。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
本发明的目的在于解决上述问题,提供了一种基于用户行为的音频个性化推荐方法和系统,能把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。
本发明的技术方案为:本发明揭示了一种基于用户行为的音频个性化推荐方法,包括:
步骤1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;
步骤2:对所收集的用户行为数据进行清洗和整合;
步骤3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;
步骤4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。
根据本发明的基于用户行为的音频个性化推荐方法的一实施例,步骤1中,用户的人口学特征包括用户的性别、年龄和地域,用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容,音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。
根据本发明的基于用户行为的音频个性化推荐方法的一实施例,步骤2进一步包括:
对用户登录时间低于预设值且收听比例小于预设值的收听行为标记为误点击,从用户收听记录中删除;
用户对特定音频内容的收听间隔进行划分,小于指定间隔的将两次收听整合在一起,用于描述用户特定时段的收听新区,对用户特定时段收听的类别和标签进行统计,取出出现频率最高的标记为用户时段偏好;
进行时段划分,统计用户收听时段和时段偏好并做相应的标记;
考察音频内容被收听的时段,统计其出现频率在前的时段并做相应的标记,补充为音频内容的标签;
将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总,按照天数进行衰减,整合后的数据平衡考虑用户长短期的兴趣;
剔除用户远期订阅行为数据。
根据本发明的基于用户行为的音频个性化推荐方法的一实施例,步骤3进一步包括:
指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容;
对用户收听历史进行分析,根据收听时间的长短,进行预评分;
将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合;
根据用户收听历史音频内容评分,结合音频内容之间的相关性,计算对优选音频内容的评分。
根据本发明的基于用户行为的音频个性化推荐方法的一实施例,步骤4进一步包括:
基于每一音频内容的评分,将评分达到预定阈值的音频内容进行排序,并过滤掉用户最近收听和订阅的音频内容后,取得排名高于预设值的音频内容后,推送给用户。
本发明还揭示了一种基于用户行为的音频个性化推荐系统,包括:
数据收集模块,收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;
数据处理模块,对所收集的用户行为数据进行清洗和整合;
特征分析模块,基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;
混合推荐模块,基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。
根据本发明的基于用户行为的音频个性化推荐系统的一实施例,数据收集模块包括:
用户注册数据收集单元,收集用户注册时的用户性别、兴趣偏好、年龄、用户标签;
用户收听行为收集单元,收集用户的收听时长、收听类别、收听时段、登录时间;
用户社交行为收集单元,收集用户的社交行为,包括订阅、关注、私信、点赞、评论;
音频特征收集单元,收集音频和主播的特征、简介和标签。
根据本发明的基于用户行为的音频个性化推荐系统的一实施例,数据处理模块包括:
数据清洗单元,统计用户在线以剔除异常用户,剔除用户单次收听时间小于预设值的收听记录,剔除用户远期的订阅和关注记录;
数据整合单元,将一天内单个用户对单个内容的多次收听进行整合,同时将用户的订阅、点赞、评论行为分别进行整合,然后对用户中长期的行为关于时间进行衰减。
根据本发明的基于用户行为的音频个性化推荐系统的一实施例,特征分析模块包括:
特征提取单元,进行用户特征分析和音频内容特征分析,用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好,建立用户特征,音频内容特征分析包括对音频内容的简介、标签进行分析,并基于标签建立音频内容之间的相关性;
相关性分析单元,计算用户之间的关系以及音频内容之间的关系;
评分计算单元,计算用户对各个音频内容的偏好度评分,当音频内容的评分达到预设阈值时,作为候选推荐集合进入混合推荐模块。
根据本发明的基于用户行为的音频个性化推荐系统的一实施例,混合推荐模块进一步包括:
用户冷启动单元,通过收集用户的人口学数据,推荐符合特点的热播音频内容为猜你喜欢的音频;
评分综合排序单元,将各种场景下的推荐候选音频内容进行综合排序;
音频内容过滤单元,提出用户不喜欢的音频内容以及最近收听或订阅的音频内容;
推荐展示单元,进行四个场景的推荐展示,包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。
本发明对比现有技术有如下的有益效果:本发明是从用户的人口学特征和对音频内容的收听、订阅、点赞、评论等行为中挖掘用户对音频内容的潜在兴趣,并通过对音配内容被收听、订阅中挖掘音频内容的关系,结合音频内容间基于简介和标签建立的相关性,把被海量音频淹没的优质内容呈现给听众,为听众提供更好的个性化推荐服务。基于从用户数据和音频内容中提取的特征,计算用户对音频内容的评分,结合各种算法得出候选推荐项,并通过融合方法对推荐项进行重新排序,并对用户近期行为进行过滤,提高了用户对音频内容偏好度量的准确性。
附图说明
图1示出了本发明的基于用户行为的音频个性化推荐方法的较佳实施例的流程图。
图2示出了本发明的基于用户行为的音频个性化推荐系统的较佳实施例的流程图。
图3示出了计算音频内容的综合相关系数需要综合考虑的四种相关系数和相应的流程的示意图。
图4示出了融合各场景的推荐结果,产生最终推荐结果的流程的示意图。
具体实施方式
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了本发明的基于用户行为的音频个性化推荐方法的较佳实施例的流程。请参见图1,本实施例的基于用户行为的音频个性化推荐方法的详细实现如下。
步骤S1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据。
通过用户授权收集用户的人口学特征,包括用户的性别、年龄和地域。收集用户行为数据,包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容。收集音频内容的特征属性,包括音频内容的类别、简介、标签、发布规律和初始评分。
步骤S2:对所收集的用户行为数据进行清洗和整合。
在这一步骤的清洗和整合,具体包括:
统计用户在线时间,剔除异常用户。
对用户登录时间低于预设值(比如小于30秒)且收听比例小于预设值(比如10%)的收听行为标记为误点击,从用户收听记录中删除。
用户对特定音频内容的收听间隔进行划分,小于指定间隔(例如1小时)的将两次收听整合在一起,用于描述用户特定时段的收听兴趣,对用户特定时段收听的类别和标签进行统计,取出出现频率最高的标记为用户时段偏好。
进行时段划分,具体可以分为6个时段:如早上、上下班地铁、工作时间、午休、睡前、凌晨等时间段,统计用户收听时段和时段偏好并做相应的标记。
考察音频内容被收听的时段,统计其出现频率在前的时段并做相应的标记,补充为音频内容的标签。
将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总,按照天数进行衰减,整合后的数据平衡考虑用户长短期的兴趣。
订阅数据的整合:剔除用户远期订阅行为数据,特别是很早订阅近期没有更新或没有收听的数据。
步骤S3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分。
在这一步骤中,具体包括:指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容,社交关系推荐是标准的机器学习算法,这里不再赘述。
对用户收听历史进行分析,根据收听时间的长短,进行预评分。
将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合。
根据用户收听历史音频内容评分,结合音频内容之间的相关性,计算对优选音频内容的评分,对评分达到预定阈值的音频内容,进入推荐模块。
如图3所示,音频内容之间的相关性计算考虑了用户收听、订阅行为、点赞和评论行为,以及基于音频内容简介和标签的信息,具体两个音频内容的相关系数的混合机制可参考图3。
考虑两个音频内容的被收听数据,基于收听数据可以构建音频内容之间的相关系数ρListen;考虑两个音频内容被订阅的数据,基于订阅数据可以构建音频内容之间的相关系数ρSub;考虑两个音频内容被点赞、评论和转发数据,基于点赞、评论转发数据可以得出两个音频内容的相关系数ρComment;考虑两个音频内容简介中关键词的匹配度和标签的匹配度,标准化到0-1之间,作为音频内容基于标签的相关系数ρTag。
将上述4个相似度融合为两个音频内容之间的相似度,此相似度和两个音频内容被收听,被收藏,被点赞、评论、转发的人数有关,如果用户行为较少,会自动增加基于标签和简介的相似度,这样可以自动优化相似度的计算。
步骤S4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。
在这一步骤中,具体包括:基于每一音频内容的评分,将评分达到预定阈值的音频内容进行排序,并过滤掉用户最近收听和订阅的音频内容后,取得排名高于预设值的音频内容后,推送给用户。
音频内容的订阅历史评分是对用户订阅音频内容的历史按照音频内容订阅时间进行衰减。根据用户订阅历史音频内容,找出每个订阅音频内容最相关的音频内容,根据用户订阅历史音频内容的评分和前述音频内容相关性,计算用户对候选音频内容评分,评分达到预定预置的进入推荐模块。
统计用户的时段偏好和类别偏好,统计音频内容的时段分布。剔除候选音频内容中用户近期收听和订阅的音频内容。根据用户时段和类别偏好,取相应类别的评分高的音频内容在选定时段推荐给用户。
个性化推荐展示:当用户打开应用时单独页面展示该时段类别中评分较高的音频内容为猜你喜欢音频内容。
相关推荐展示:当用户浏览,收听音频内容时展示与当前音频内容相关的其他音频内容,其中音频内容相关性来源于音频内容综合相关系数。
某用户收听音频内容"英语口语"(时段:早上),"糗事播报"(时段:上下班),"罗辑思维"(时段:睡前),"最后一个道士"(时段:睡前),"今晚80后脱口秀"(时段:睡前),其中"罗辑思维"有点赞,"今晚80后脱口秀"有评论。
通过用户时段分析,分析该用户"上下班"时段的类别偏好为"娱乐","睡前"时段偏好为"有声小说和娱乐",早上时段偏好为"外语"。
在相应的时段,分别推荐满足类别的音频内容展示给用户。
图4示出了融合各场景的推荐结果,产生最终推荐结果的流程。
图2示出了本发明的基于用户行为的音频个性化推荐系统的较佳实施例的原理。请参见图2,本实施例的基于用户行为的音频个性化推荐系统的详细实现如下。
本实施例的基于用户行为的音频个性化推荐系统包括:数据收集模块1、数据处理模块2、特征分析模块3、混合推荐模块4。
数据收集模块1收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据。
数据收集模块1包括用户注册数据收集单元11、用户收听行为收集单元12、用户社交行为收集单元13、音频特征收集单元14。
用户注册数据收集单元11收集用户注册时的用户性别、兴趣偏好、年龄、用户标签。用户收听行为收集单元12收集用户的收听时长、收听类别、收听时段、登录时间。用户社交行为收集单元13收集用户的社交行为,包括订阅、关注、私信、点赞、评论。音频特征收集单元14收集专辑和主播的特征、简介和标签。
数据处理模块2对所收集的用户行为数据进行清洗和整合。
数据处理模块2包括:数据清洗单元21和数据整合单元22。
数据清洗单元21统计用户在线以剔除异常用户,剔除用户单次收听时间小于预设值的收听记录,剔除用户远期的订阅和关注记录。
数据整合单元22将一天内单个用户对单个内容的多次收听进行整合,同时将用户的订阅、点赞、评论行为分别进行整合,然后对用户中长期的行为关于时间进行衰减。
特征分析模块3基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分。
特征分析模块3包括:特征提取单元31、相关性分析单元32、评分计算单元33。
特征提取单元31进行用户特征分析和音频内容特征分析,用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好,建立用户特征,音频内容特征分析包括对音频内容的简介、标签进行分析,并基于标签建立音频内容之间的相关性。
相关性分析单元32计算用户之间的关系以及音频内容之间的关系。
评分计算单元33计算用户对各个音频内容的偏好度评分,当音频内容的评分达到预设阈值时,作为候选推荐集合进入混合推荐模块。
混合推荐模块4基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户。
混合推荐模块4包括:用户冷启动单元41、评分综合排序单元42、音频内容过滤单元43、推荐展示单元44。
用户冷启动单元41通过收集用户的人口学数据,推荐符合特点的热播音频内容为猜你喜欢的音频。
评分综合排序单元42将各种场景下的推荐候选音频内容进行综合排序。
音频内容过滤单元43提出用户不喜欢的音频内容以及最近收听或订阅的音频内容。
推荐展示单元44进行四个场景的推荐展示,包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (8)

1.一种基于用户行为的音频个性化推荐方法,包括:
步骤1:收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;
步骤2:对所收集的用户行为数据进行清洗和整合;
步骤3:基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;
步骤4:基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户;
其中步骤2进一步包括:
对用户登录时间低于预设值且收听比例小于预设值的收听行为标记为误点击,从用户收听记录中删除;
用户对特定音频内容的收听间隔进行划分,小于指定间隔的将两次收听整合在一起,用于描述用户特定时段的收听新区,对用户特定时段收听的类别和标签进行统计,取出出现频率最高的标记为用户时段偏好;
进行时段划分,统计用户收听时段和时段偏好并做相应的标记;
考察音频内容被收听的时段,统计其出现频率在前的时段并做相应的标记,补充为音频内容的标签;
将用户当天对音频内容的收听行为按照收听时间和完播比例进行汇总,按照天数进行衰减,整合后的数据平衡考虑用户长短期的兴趣;
剔除用户远期订阅行为数据。
2.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤1中,用户的人口学特征包括用户的性别、年龄和地域,用户行为数据包括用户的登录行为数据、用户收听音频内容的时长和播放比例、用户订阅的音频内容、用户评论的音频内容,音频内容的特征属性包括音频内容的类别、简介、标签、发布规律和初始评分。
3.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤3进一步包括:
指定用户间互动较多的多个用户最近收听的音频内容作为给定用户基于社交关系的推荐候选音频内容;
对用户收听历史进行分析,根据收听时间的长短,进行预评分;
将用户收听历史相关性最大的多个音频内容选取为基于收听行为的候选音频内容集合;
根据用户收听历史音频内容评分,结合音频内容之间的相关性,计算对候选音频内容的评分。
4.根据权利要求1所述的基于用户行为的音频个性化推荐方法,其特征在于,步骤4进一步包括:
基于每一音频内容的评分,将评分达到预定阈值的音频内容进行排序,并过滤掉用户最近收听和订阅的音频内容后,取得排名高于预设值的音频内容后,推送给用户。
5.一种基于用户行为的音频个性化推荐系统,包括:
数据收集模块,收集用户数据和音频内容的特征属性,其中用户数据包括用户的人口学特征和用户行为数据;
数据处理模块,对所收集的用户行为数据进行清洗和整合;
特征分析模块,基于整合后的用户行为数据,分析用户之间的关系以及音频内容之间的相关性,计算用户对音频内容的评分;
混合推荐模块,基于音频内容的评分进行重新排序,将排序结果靠前的音频内容呈现给用户;
其中特征分析模块包括:
特征提取单元,进行用户特征分析和音频内容特征分析,用户特征分析包括分析用户的性别、年龄、时段偏好、类别偏好,建立用户特征,音频内容特征分析包括对音频内容的简介、标签进行分析,并基于标签建立音频内容之间的相关性;
相关性分析单元,计算用户之间的关系以及音频内容之间的关系;
评分计算单元,计算用户对各个音频内容的偏好度评分,当音频内容的评分达到预设阈值时,作为候选推荐集合进入混合推荐模块。
6.根据权利要求5所述的基于用户行为的音频个性化推荐系统,其特征在于,数据收集模块包括:
用户注册数据收集单元,收集用户注册时的用户性别、兴趣偏好、年龄、用户标签;
用户收听行为收集单元,收集用户的收听时长、收听类别、收听时段、登录时间;
用户社交行为收集单元,收集用户的社交行为,包括订阅、关注、私信、点赞、评论;
音频特征收集单元,收集音频和主播的特征、简介和标签。
7.根据权利要求5所述的基于用户行为的音频个性化推荐系统,其特征在于,数据处理模块包括:
数据清洗单元,统计用户在线以剔除异常用户,剔除用户单次收听时间小于预设值的收听记录,剔除用户远期的订阅和关注记录;
数据整合单元,将一天内单个用户对单个内容的多次收听进行整合,同时将用户的订阅、点赞、评论行为分别进行整合,然后对用户中长期的行为关于时间进行衰减。
8.根据权利要求5所述的基于用户行为的音频个性化推荐系统,其特征在于,混合推荐模块进一步包括:
用户冷启动单元,通过收集用户的人口学数据,推荐符合特点的热播音频内容为猜你喜欢的音频;
评分综合排序单元,将各种场景下的推荐候选音频内容进行综合排序;
音频内容过滤单元,提出用户不喜欢的音频内容以及最近收听或订阅的音频内容;
推荐展示单元,进行四个场景的推荐展示,包括猜你喜欢综合推荐、收听完成推荐、订阅成功推荐、找听友推荐。
CN201510373689.7A 2015-06-30 2015-06-30 一种基于用户行为的音频个性化推荐方法和系统 Active CN106326277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510373689.7A CN106326277B (zh) 2015-06-30 2015-06-30 一种基于用户行为的音频个性化推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510373689.7A CN106326277B (zh) 2015-06-30 2015-06-30 一种基于用户行为的音频个性化推荐方法和系统

Publications (2)

Publication Number Publication Date
CN106326277A CN106326277A (zh) 2017-01-11
CN106326277B true CN106326277B (zh) 2019-07-16

Family

ID=57722869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510373689.7A Active CN106326277B (zh) 2015-06-30 2015-06-30 一种基于用户行为的音频个性化推荐方法和系统

Country Status (1)

Country Link
CN (1) CN106326277B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108628886B (zh) * 2017-03-20 2020-12-22 中移(杭州)信息技术有限公司 一种音频文件推荐方法及装置
CN106959865B (zh) * 2017-04-25 2021-03-09 北京奇虎科技有限公司 数据获取和信息推送方法、装置及电子设备
CN107247743A (zh) * 2017-05-17 2017-10-13 安徽富驰信息技术有限公司 一种司法类案检索方法及系统
CN107241621A (zh) * 2017-05-26 2017-10-10 北京小米移动软件有限公司 主播评分方法及装置
CN109947957A (zh) * 2017-07-27 2019-06-28 环球智达科技(北京)有限公司 一种实现媒体文件综合排序的方法和装置
CN107832437B (zh) * 2017-11-16 2021-03-02 北京小米移动软件有限公司 音/视频推送方法、装置、设备及存储介质
CN108600818B (zh) * 2018-03-16 2021-02-26 阿里巴巴(中国)有限公司 展示多媒体资源的方法及装置
CN110797001B (zh) * 2018-07-17 2022-04-12 阿里巴巴(中国)有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN108989935A (zh) * 2018-08-02 2018-12-11 肇庆市高新区甜慕新能源技术有限公司 一种可用于控制媒体文件播放的线控耳机
CN109085980A (zh) * 2018-08-02 2018-12-25 肇庆市高新区甜慕新能源技术有限公司 一种控制媒体文件播放的设备及方法
CN110008369A (zh) * 2018-12-26 2019-07-12 阿里巴巴集团控股有限公司 信息处理方法及其装置、电子设备、计算机可读介质
CN110059249B (zh) 2019-04-03 2022-11-25 华为技术有限公司 个性化推荐的方法、终端设备和系统
CN110502684B (zh) * 2019-07-03 2020-12-04 特斯联(北京)科技有限公司 一种基于互联网的智慧数据推荐方法、装置及系统
CN110717064B (zh) * 2019-08-19 2022-11-22 广州荔支网络技术有限公司 个性化音频播单生成方法、装置及可读存储介质
CN110795575A (zh) * 2019-10-25 2020-02-14 武汉惠利德科技有限公司 一种基于智能计算器的多媒体推送方法及系统
CN111026906B (zh) * 2019-12-05 2023-12-08 央广智能网联汽车数字媒体(上海)有限公司 一种用于车载场景下的流式收听音频内容的推荐系统
CN113139122A (zh) * 2020-01-20 2021-07-20 阿里巴巴集团控股有限公司 信息推荐方法、系统及设备
CN111294620A (zh) * 2020-01-22 2020-06-16 北京达佳互联信息技术有限公司 视频的推荐方法及装置
CN111506803B (zh) * 2020-03-17 2023-10-31 阿波罗智联(北京)科技有限公司 内容推荐方法、装置、电子设备及存储介质
CN112069352B (zh) * 2020-09-18 2022-05-17 四川长虹电器股份有限公司 一种基于改进的content-based的电视音乐推荐方法
CN112163909B (zh) * 2020-10-29 2021-05-18 杭州次元岛科技有限公司 一种基于大数据的广告投放系统
CN112418935B (zh) * 2020-11-24 2021-08-20 上海东方财富金融数据服务有限公司 基于大数据和广告推送的数据处理方法及大数据平台
CN113869933A (zh) * 2021-08-26 2021-12-31 秝时资讯有限公司 具广告推播功能的声音社群媒体平台

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及系统
CN103514239A (zh) * 2012-11-26 2014-01-15 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及系统
CN103514239A (zh) * 2012-11-26 2014-01-15 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统

Also Published As

Publication number Publication date
CN106326277A (zh) 2017-01-11

Similar Documents

Publication Publication Date Title
CN106326277B (zh) 一种基于用户行为的音频个性化推荐方法和系统
Rieder et al. From ranking algorithms to ‘ranking cultures’ Investigating the modulation of visibility in YouTube search results
Seaver Captivating algorithms: Recommender systems as traps
US10650861B2 (en) Video summarization and collaboration systems and methods
CN104317959B (zh) 基于社交平台的数据挖掘方法及装置
KR101552147B1 (ko) 방송 컨텐츠를 추천하는 방법과 그 장치
CN104486649B (zh) 视频内容评级方法及装置
CN103718166A (zh) 信息处理设备、信息处理方法和计算机程序产品
CN105849763A (zh) 使用加权分析动态确定社交数据网络中影响者的系统和方法
US20140068676A1 (en) Method and system for video collection management, invalid video replacement and continuous video replay
CN106789543A (zh) 会话中实现表情图像发送的方法和装置
CN109710841A (zh) 评论推荐方法和装置
CN102084645B (zh) 关联场景赋予装置以及关联场景赋予方法
CN102857471A (zh) 多媒体交互方法及系统
EP3690674A1 (en) Method for recommending video content
KR20070007290A (ko) 지침서 생성 유닛
CN107071525A (zh) 媒体文件的输出处理方法、客户端及系统
CN113709527B (zh) 多主播场景中关注主播的方法及装置
CN106802913A (zh) 一种播放内容推荐方法及其装置
CN106407287A (zh) 一种推送多媒体资源的方法及系统
CN103942247B (zh) 多媒体资源的信息提供方法及装置
Au Yeung et al. Capturing implicit user influence in online social sharing
Wang et al. Overview of content-based click-through rate prediction challenge for video recommendation
Renoust et al. When face-tracking meets social networks: a story of politics in news videos
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 201203 Shanghai city Pudong New Area Zuchongzhi Road Lane 899 Building No. 11

Patentee after: Shanghai Himalaya Technology Co.,Ltd.

Address before: 201203 Shanghai city Pudong New Area Zuchongzhi Road Lane 899 Building No. 11

Patentee before: SHANGHAI ZHENGDA XIMALAYA NETWORK TECHNOLOGY CO.,LTD.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A User Behavior Based Audio Personalized Recommendation Method and System

Granted publication date: 20190716

Pledgee: China Construction Bank Corporation Shanghai Pilot Free Trade Zone Branch

Pledgor: Shanghai Himalaya Technology Co.,Ltd.

Registration number: Y2024980013197