CN110532419B - 一种音频的处理方法及装置 - Google Patents

一种音频的处理方法及装置 Download PDF

Info

Publication number
CN110532419B
CN110532419B CN201910808849.4A CN201910808849A CN110532419B CN 110532419 B CN110532419 B CN 110532419B CN 201910808849 A CN201910808849 A CN 201910808849A CN 110532419 B CN110532419 B CN 110532419B
Authority
CN
China
Prior art keywords
audio
click
search
target
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910808849.4A
Other languages
English (en)
Other versions
CN110532419A (zh
Inventor
康战辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910808849.4A priority Critical patent/CN110532419B/zh
Publication of CN110532419A publication Critical patent/CN110532419A/zh
Application granted granted Critical
Publication of CN110532419B publication Critical patent/CN110532419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种音频的处理方法、装置、电子设备及存储介质,音频的处理方法包括:检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击音频名对应的音频的总点击次数;基于以搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数,其中,搜索字段包括音频名和表演者;基于目标搜索次数、总点击次数和目标点击次数,确定音频名和表演者对应的音频的热门程度得分;基于音频的热门程度得分识别热门音频。本发明通过计算预设时间段内的音频的热门程度的得分,实现对预设时间段内的热门音频的识别。

Description

一种音频的处理方法及装置
技术领域
本发明涉及数据挖掘领域,尤其涉及一种音频的处理方法及装置。
背景技术
在搜索音频时,需要根据音频的热门程度显示搜索结果,例如,在搜索歌曲时,优先显示热门程度高的歌曲。相关的音频的处理方法通过歌曲的总播放总次数识别热门音频,这种处理方法无法识别不同时间段内的热门音频。
发明内容
本发明实施例提供了一种音频的处理方法、装置、电子设备及存储介质,能够识别不同时间段内的热门音乐。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种音频的处理方法,包括:
检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击所述音频名对应的音频的总点击次数;
基于以搜索字段进行搜索得到的搜索结果,确定点击所述音频名和所述表演者对应的音频的目标点击次数,其中,所述搜索字段包括所述音频名和所述表演者;
基于所述目标搜索次数、所述总点击次数和所述目标点击次数,确定所述音频名和所述表演者对应的音频的热门程度得分;
基于音频的热门程度得分识别热门音频。
本发明实施例还提供一种音频的处理装置,包括:
检索模块,用于检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击所述音频名对应的音频的总点击次数;
确定模块,用于基于以搜索字段进行搜索得到的搜索结果,确定点击所述音频名和所述表演者对应的音频的目标点击次数,其中,所述搜索字段包括所述音频名和所述表演者;基于所述目标搜索次数、所述总点击次数和所述目标点击次数,确定所述音频名和所述表演者对应的音频的热门程度得分;
识别模块,用于基于音频的热门程度得分识别热门音频。
在上述方案中,所述装置还包括:
获取模块,用于获取预设时间段内的音频搜索数据和音频点击数据。
汇总模块,用于对所述音频搜索数据和所述音频点击数据进行汇总,得到包括搜索字段、搜索次数、点击字段和点击次数的搜索点击记录;其中,所述搜索次数为以所述搜索字段进行搜索的次数。
在上述方案中,所述检索模块,还用于检索包括所述搜索字段的所述音频搜索数据;
所述确定模块,还用于将包括所述搜索字段的所述音频搜索数据的个数确定为所述搜索次数;基于所述音频点击数据中的播放时长字段中记录的播放时长大,确定播放时长大于预设时长的音频点击数据为有效音频点击数据;
所述检索模块,还用于检索包括所述点击字段的所述有效音频点击数据;
所述确定模块,还用于将包括所述点击字段的所述有效音频点击数据的个数确定为所述点击次数。
在上述方案中,所述检索模块,还用于检索预设时间段内的所述搜索点击记录,得到N个不同版本的音频的目标搜索次数,各版本的所述音频名均相同,各版本的所述音频的表演者均不相同,其中,N为大于等于2的整数。
在上述方案中,所述检索模块,还用于检索预设时间段内的所述搜索点击记录,得到第n目标搜索次数,所述第n目标搜索次数以获取以所述音频名和第n个版本的音频的表演者为搜索字段进行搜索得到,其中,n为1至N之间的整数。
在上述方案中,所述确定模块,还用于基于以搜索字段进行搜索得到的搜索结果,确定N个不同版本对应的目标点击次数。
在上述方案中,所述确定模块,还用于基于N个不同版本的目标点击次数在所述总点击次数中的占比,确定N个不同版本的音频的点击率;将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的热门程度得分。
在上述方案中,所述确定模块,还用于基于第n目标点击次数在所述总点击次数中的占比,确定第n个版本的音频的第n点击率;将第n目标搜索次数乘以所述第n点击率得到第n个版本的音频的热门程度得分。
在上述方案中,所述检索模块,还用于检索预设时长内的搜索点击记录,得到以所述音频名为搜索字段进行初次搜索的次数以及二次搜索的次数,其中,所述二次搜索的次数为在所述初次搜索得到的搜索结果中以所述音频名和表演者为搜索字段进行搜索的次数;
所述确认模块,还用于基于所述二次搜索的次数在所述初次搜索的次数中的占比,确定切换率;基于目标点击次数在所述总点击次数中的占比,确定点击率;将目标搜索次数、所述点击率和所述切换率相乘,得到音频的热门程度得分。
本发明实施例提供一种音频的处理装置,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的方法。
本发明实施例提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的音频的处理方法。
本发明实施例具有以下有益效果:
通过搜索预设时间段内的搜索点击记录,获取目标搜索次数、目标点击次数和总点击次数,得到该时间段内的音频的热门程度得分,并通过该时间段内的音频的热门程度得分识别该时间段内的热门音频,实现了对预设时间段内的热门音频的识别。
附图说明
图1是本发明实施例提供的音频播放平台的一种可选的构架示意图;
图2是本发明实施例提供的服务器200的结构示意图;
图3为本发明实施例提供的一种音频的处理方法的流程示意图;
图4为本发明实施例提供的一种音频的处理方法的流程示意图;
图5为本发明实施例提供的一种音频的处理方法的流程示意图;
图6为本发明实施例提供的一种音频的处理方法的流程示意图;
图7为本发明实施例提供的一种音频的处理方法的流程示意图;
图8为本发明实施例提供的一种音频的处理方法的流程示意图;
图9为本发明实施例提供的一种音频的处理方法的流程示意图;
图10为本发明实施例提供的热门音乐版本的识别方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
本发明实施例提供一种音频的处理方法、装置、设备及存储介质,下面首先说明本发明实施例提供的终端设备的示例性应用。
如图1所示,图1为音频播放平台的一种可选的构架示意图,以下结合图1对音频播放平台获取搜索记录和点击记录的过程进行示例性说明。
第一多媒体播放设备100-1,第二多媒体播放设备100-2和第三多媒体播放设备100-3分别通过网络300与音频播放平台的服务器200连接。在第一多媒体播放设备100-1,第二多媒体播放设备100-2和第三多媒体播放设备100-3中均安装有音频播放客户端101。
用户在第一多媒体播放设备100-1的音频播放客户端101中输入搜索字段,并将包括该搜索字段的搜索请求发送给服务器200。服务器200的处理器210 接收到搜索请求后,基于该搜索字段在音频库中检索与所述搜索字段对应的音频,并将搜索结果发送给第一多媒体播放设备100-1,同时,服务器200将包括该搜索字段的音频搜索数据存储至存储器250中。
用于在接收到搜索结果后,第一多媒体播放设备100-1在显示界面中显示包括多首符合搜索条件的检索结果的音频。当第一多媒体播放设备100-1检测到用户对检索结果中的音频的选取操作时播放用户选取的音频,同时,第一多媒体播放设备100-1将包括该音频名和表演者的音频点击数据发送给服务器 200。服务器200接收到该音频点击数据后,将所述音频点击数据存入存储器 250中。
存储器250接收到该音频点击数据后,将该音频点击数据与对应音频搜索数据进行关联,其中,音频点击数据为响应于用户在对应的搜索结果选取音频的操作而生成的日志,对应的搜索结果是指,以对应的音频搜索数据中的搜索字段进行搜索得到的搜索结果。
例如,第二多媒体播放设备100-2的音频播放客户端向服务器200发送包括搜索字段的搜索请求发送给服务器200,其中,搜索字段包括音频名A和表演者B。服务器200以音频名A和表演者B在音频库中检索具有音频名A和表演者B的字段的音频,并将搜索结果发送给第二多媒体播放设备100-2,同时,将包括音频名A和表演者B的音频搜索数据存入存储器250中。第二多媒体播放设备100-2在接收到检索结果后,在显示界面显示该检索结果。用户在检索结果中选取音频名为音频名A,表演者为表演者B的音频,第二多媒体播放设备100-2响应于用户选取的操作,播放该音频,同时将包括音频名A和表演者 B的音频点击数据发送给服务器200。服务器200接收该音频点击数据后,将该音频点击数据存入存储器250中。历史日志数据220将该包括音频名A和表演者B的音频搜索数据和该包括音频名A和表演者B的音频点击数据进行关联。
在一些实施例中,音频可以为音乐,例如,音频可以为歌曲,表演者为演唱该歌曲的演唱者,音频还可以为纯音乐,表演者为演奏该纯音乐的演奏者;音频还可以为非音乐,例如,音频可以为有声小说,表演者为播讲该有声小说的播讲者,音频还可以为网络广播的录音,表演者为该网络广播的主播。
在一些实施例中,多媒体播放设备100可以是任何可以播放多媒体数据的设备,例如智能手机、智能电视或个人电脑。
在一些实施例中,服务器200从存储器250中获取音频搜索数据和音频点击数据,并对音频搜索数据和音频点击数据进行汇总得到搜索点击记录,并基于搜索点击记录识别音频的热门程度。
请参阅图2,图2是本发明实施例提供的服务器200的结构示意图,图2 所示的客户终端设备200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可以理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现服务器状态的一个或多个输出装置231,包括服务器状态指示灯。用户接口230还包括一个或多个输入装置232,包括有助于控制服务器的运行状态的部件,例如,服务器的开关或服务器的重启按钮。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Me mory),易失性存储器可以是随机存取存储器(RAM,Random Access Memor y)。本发明实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等。
呈现单元253,用于经由一个或多个与用户接口230相关联的输出装置23 1(例如,服务器状态指示灯)使得能够呈现信息(例如,服务器是否过热)。
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本发明实施例提供的音频的处理装置255可以采用软件方式实现,图2示出了存储在存储器250中的音频的处理装置255,包括以下检索模块2551、确定模块2552和识别模块2553三个模块,其可以是程序和插件等形式的软件,并可以嵌入各种服务器中,例如在线视频服务器,移动服务通信的数据统计服务器中。检索模块2551,用于检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击音频名对应的音频的总点击次数。确定模块2552,用于基于以搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数,其中,搜索字段包括音频名和表演者。确定模块2552,还用于基于音频名和表演者为搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数。确定模块2553,还用于基于目标搜索次数、总点击次数和目标点击次数,确定音频名和表演者对应的音频的热门程度得分。识别模块2553,用于基于音频的热门程度得分识别热门音频。
本发明实施例提供的音频的处理方法可以由服务器执行,下面将结合上文记载的服务器的示例性应用和结构,说明服务器中通过嵌入的音频的处理装置而在服务器中实现音频的处理方法的过程,服务器的类型可以是多样化的,例如可以是数据库专用的服务器、视频播放平台的服务器和社交网络平台的服务器等;也可以是通过虚拟化技术构建的网络云端服务器等。在一个实施例中,客户端可以通过虚拟化技术将多个物理计算节点虚拟化为一个网络云端服务器,将多个物理计算节点的计算资源、网络资源和存储资源抽象为计算资源池、网络资源池和存储资源池,通过调用计算资源池、网络资源池和存储资源池实现音频的方法。
请参阅图3,图3为本发明实施例提供的一种音频的处理方法的流程示意图,如图3所示,该处理方法的流程包括:
步骤S201、检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击音频名对应的音频的总点击次数。
在一些实施例中,搜索点击记录中包括搜索字段、搜索字段对应的搜索次数、点击字段和点击字段对应的点击次数。
在一些实施例中,预设的时间段根据实际需求确定,例如,当需要识别九十年代的音乐时,则将预设的时间段确定为1990年1月1日至1999年12月 31日,当需要识别最近的热门有声小说时,则将预设的时间段确定为当前日期的前一个月至当前日期。
在一些实施例中,总点击次数为点击搜索点击记录中所有包括相同的音频名的点击字段对应的点击次数的总和,例如,检索搜索点击记录中所有包括音频名A的点击字段及对应的点击次数,检索结果得到第一点击字段为音频名A,第一点击字段对应的第一点击次数为1000;第二点击字段为音频名A、表演者B,第二点击字段对应的第二点击次数为200;第三点击字段为音频名A、表演者C,第三点击字段对应的第三点击次数为500,则音频名A对应的音频的总点击次数为第一点击次数、第二点击次数和第三点击次数的总和为1700。
步骤S202,基于以搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数,其中,搜索字段包括音频名和表演者。
在一些实施例中,检索结果包括完全满足搜索条件的音频还包括部分满足搜索条件的音频,在检索结果中优先显示完全满足搜索条件的音频。例如,检索字段为音频名A和表演者B,则检索结果中包括音频名为音频名A,表演者为表演者B的音频,检索结果中还包括音频名为音频名A,表演者为表演者C 的音频以及音频名为音频名D,表演者为表演者B的音频。在以检索列表的形式检索结果,在检索列表的前部显示音频名为音频名A,表演者为表演者B的音频,然后再检索列表中显示音频名为音频名A,表演者为表演者C的音频,最后显示音频名为音频名D,表演者为表演者B的音频。
在一些实施例中,在同一条搜索点击记录中包括一个搜索字段和以该搜索字段进行搜索的次数,还包括至少一个点击字段及点击字段对应的点击次数,其中目标点击次数为,与搜索字段具有相同内容的点击字段对应的点击次数。
例如,一条搜索点击记录包括搜索字段为音频名A,表演者B,对应的搜索次数为1000。该搜索点击记录还包括第一点击字段为音频名A,表演者B,对应的第一点击次数为500;第二点击字段为音频名A,表演者C,对应的第二点击次数为300;第三点击字段为音频名A,表演者D,对应的第三点击次数为300,则目标点击次数为第一点击次数500。
步骤S203,基于目标搜索次数、总点击次数和目标点击次数,确定音频名和表演者对应的音频的热门程度得分。
在一些实施例中,将目标点击次数除以总点击次数得到目标点击率,将目标搜索次数乘以目标点击率得到音频名和表演者对应的音频的热门程度得分,热门程度得到越高表明该音频的热门程度越高,在预设的时间段内越受用户的欢迎。
在一些实施例中,将目标点击次数和总点击次数进行归一化后,将归一化的目标点击次数除以归一化后的总点击次数得到归一化后的目标点击率,将目标搜索次数乘以归一化后的目标点击率得到音频名和表演者对应的音频的热门程度得分,通过将目标点击次数和总点击次数进行归一化处理,能够消除目标点击次数和总点击次数的绝对大小对目标点击率的影响,使热门程度得分更加准确。
在一些实施例中,将目标点击次数除以总点击次数得到目标点击率,将目标搜索次数乘以目标点击率,并将目标搜索次数和目标点击率的乘积的对数作为音频名和表演者对应的音频的热门程度得分。通过将对数化后的目标搜索次数和目标点击率的乘积作为音频名和表演者对应的音频的热门程度得分,可以放大热门程度得分差异较小的音频之间的热门程度的差异,同时缩小热门程度得分差异较大的音频之间的热门程度的差异,进而使分布较为集中的热门程度得分分布地更加均匀,有利于通过热门程度得分识别热门音频。
在一些实施例中,通过计算具有相同音乐名和不同表演者对应的音频的热门程度得分,可以得到同一音频的不同版本的热门程度。例如,音频为歌曲,该歌曲有三个版本,这三个版本的歌曲的歌名、歌词完全相同,但由不同的演唱者演唱,分别计算这三个版本的歌曲的热门程度得分,可以得到这三个不同版本的歌曲热门程度。例如,音频为纯音乐,该纯音乐有两个版本,这两个版本的曲名相同,且具有相同的主题、动机和走向,但由两个不同的演奏者演奏,且演奏时的配器不同,分别计算这两个版本的纯音乐的热门程度得分,可以得到这两个不同版本的纯音乐的热门程度。例如,音频为有声小说,该有声小说有两个版本,这两个版本播讲的是同一本小说,但由两个不同的播讲者播讲,分别计算这两个版本的有声小说的热门程度得分,可以得到这两个不同版本的有声小说的热门程度。
步骤S204,基于音频的热门程度得分识别热门音频。
在一些实施例中,当音频的热门程度得分高于预设的阈值时,则将该音频确定为热门音频。在另一些实施例中,将搜索音频由热门程度得分由高至低进行排列,将预设序号之前的音频确定为热门音频。
在一些实施例中,将具有相同表演者的不同音频的热门程度得分进行由高至低进行排列,得到该表演者的所有音频的热门程度排名,并将预设序号之前的音频识别为热门音频。
在一些实施例中,将具有相同的音频的不同版本的音频的热门程度得分由高至低进行排列,得到相同音频的不同版本的排行,将预设序号之前的音频版本确定为该音频的热门版本。
通过搜索预设时间段内的搜索点击记录,获取目标搜索次数、目标点击次数和总点击次数,得到该时间段内的音频的热门程度得分,并通过该时间段内的音频的热门程度得分识别该时间段内的热门音频。
如图4所示,图4为本发明实施例提供的一种音频的处理方法的流程示意图,基于图3,该方法还包括:
步骤S205,获取预设时间段内的音频搜索数据和音频点击数据。
在一些实施例中,音频搜索数据和音频点击数据中均携带有存入服务器的日期的时间戳。通过该时间戳服务器可以获取预设时间段内的音频搜索数据和音频点击数据。
步骤S206、对音频搜索数据和音频点击数据进行汇总,得到包括搜索字段、搜索次数、点击字段和点击次数的搜索点击记录。
通过将音频搜索数据和音频点击数据进行汇总,得到若干条搜索点击记录,各搜索点击记录均包括搜索字段、搜索次数、点击字段和点击次数。其中,搜索次数为以搜索字段进行搜索的次数,点击字段为,播放点击字段对应的音频的次数。
通过将预设时间段内的音频搜索数据和音频点击数据进行汇总可以得到预设时间段内的搜索点击记录。
如图5所示,图5为本发明实施例提供的一种音频的处理方法的流程示意图,基于图4,步骤S206包括:
步骤S2061,检索包括搜索字段的音频搜索数据,将包括搜索字段的音频搜索数据的个数确定为搜索次数。
以音频名和表演者为关键词,搜索音频搜索数据中同时包括该音频名和表演者的音频搜索数据,得到的音频搜索数据的条数即为该搜索字段对应的搜索次数。以相同的音频名和不同的表演者为搜索字段,搜索同时包括该音频名和表演者,且与前述搜索到的音频搜索数据具有关联关系的音频点击数据,将音频名和表演者为点击字段,搜索得到的音频点击数据的条数为点击字段对应的点击次数。
例如,以音频名A和表演者B为关键词,搜索音频搜索数据中同时包括音频名A和表演者B的音频搜索数据,搜索得到199条音频搜索数据,则搜索字段为音频名A,表演者B,对应的搜索次数为199。
步骤S2062,基于音频点击数据中的播放时长字段中记录的播放时长,确定播放时长大于预设时长的音频点击数据为有效音频点击数据。
在一些实施例中,音频点击数据还包括播放时长字段,用于点击该音频后,连续播放该音频的时长,以点击该音频并进行播放时为计时起点,以用户切换歌曲或停止播放时为计时终点得到该连续播放该音频的时长。当音频点击数据中的播放时长字段记录的连续播放该音频的时长超过预设时长时,例如,连续播放时长超过30秒时,确定该音频点数据为有效音频点击数据。
用户在搜索音频时,往往无法确切获知想要搜索的音频的具体信息,需要通过试听才能确定想要收听的音频,识别出哪些音频点击数据是用户点击了想要收听的音频对应的音频点击数据,哪些音频点击数据仅是用户试听音频时对应的音频点击数据,而只有用户点击想要收听的音频时产生音频点击数据才能反映出音频的热门程度,通过将用户点击了想要收听的音频时产生的音频点击数据确定为有效音频点击数据,提高了得到的音频的热门程度得分更加准确。
步骤S2063,检索包括点击字段的有效音频点击数据,将包括点击字段的有效音频点击数据的个数确定为点击次数。
以音频名A和表演者B为关键词,搜索音频点击数据中同时包括音频名A 和表演者B,且与前述搜索得到的100条音频搜索数据具有关联关系的音频点击数据,搜索得到180条音频点击数据,则点击字段为音频名A,表演者B,对应的点击次数为180;以音频名A和表演者C为关键词,搜索音频点击数据中同时包括音频名A和表演者C,且与前述搜索得到的100条音频搜索数据具有关联关系的音频点击数据,搜索得到180条音频点击数据,则点击字段为音频名A,表演者C,对应的点击次数为180。
在计算音频的热门程度得分前,先把音频搜索记录和音频点击记录进行汇总,得到包括搜索字段、搜索次数、点击字段和点击次数的搜索点击记录,在计算音频的热门程度得分时,无需反复搜索所需的数据,缩短了识别热门音频所需的时间。
如图6所示,图6为本发明实施例提供的一种音频的处理方法的流程示意图,基于图3,步骤S201包括:
步骤S2011,检索预设时间段内的搜索点击记录,得到N个不同版本的音频的目标搜索次数,各版本的音频名均相同,各版本的音频表演者均不相同,其中,N为大于等于2的整数。
在一些实施例中,检索预设时间段内的搜索点击记录,得到第n目标搜索次数,第n搜索次数以获取音频名和第n个版本的音频的表演者为搜索字段进行搜索得到,其中,n为1至N之间的整数。
例如,音频名为A的音频具有N个版本,其中,第n个版本的表演者为表演者B,则以获取音频名A和表演者B为关键词进行搜索,得到搜索字段为音频名A,表演者B对应的搜索次数,该搜索次数为该音频的第n个版本的第n 目标搜索次数。
如图7所示,图7为本发明实施例提供的一种音频的处理方法的流程示意图,基于图3,步骤S202包括:
步骤S2021,基于N个不同版本的音频名和表演者,对应形成N个不同的搜索字段。
步骤S2022,基于以搜索字段进行搜索得到的搜索结果,确定N个不同版本对应的目标点击次数。
在一些实施例中,基于第n个版本的音频名和表演者为搜索字段进行搜索得到的搜索结果,确定该第n各版本对应的目标点击次数。
例如,第n个版本的音频名为音频名A,表演者为表演者B,基于音频名 A和表演者B为搜索字段得到的搜索结果中,点击音频名为音频名A,表演者为表演者B对应的音频的次数,得到第n个版本的第n目标点击数。
如图8所示,图8为本发明实施例提供的一种音频的处理方法的流程示意图,基于图3,步骤S203包括:
步骤S2031A,基于N个不同版本的音频的目标点击次数在总点击次数中的占比,确定N个不同版本的音频的点击率。
在一些实施例中,基于第n目标点击次数在总点击次数中的占比,确定第 n个版本的音频的第n点击几率。
步骤S2032A,将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的热门程度得分。
在一些实施例中,将第n目标搜索次数乘以第n点击率得到第n版本的音频热门程度得分。
如图9所示,图9为本发明实施例提供的一种音频的处理方法的流程示意图,基于图8,步骤S203包括:
步骤S2031B,检索预设时长内的搜索点击记录,得到以音频名为搜索字段进行初次搜索的次数以及二次搜索的次数,其中,二次搜索的次数为在初次搜索得到的搜索结果中以音频名和表演者为搜索字段进行搜索的次数。
在一些实施例中,该音频名对应的音频具有N个版本,各版本的音频名均相同,且各版本的表演者均不相同,分别以音频名和各版本的表演者为搜索字段,在以音频名为搜索字段进行初次搜索得到的搜索结果中,进行二次搜索的次数。
步骤S2032B,基于二次搜索的次数在初次搜索的次数中的占比,确定切换率。
在一些实施例中,将各版本的二次搜索次数在初次搜索次数中的占比,确定各版本的音频的切换率。
步骤S2033B,基于目标点击次数在总点击次数中的占比,确定点击率。
在一些实施例中,将各版本目标点击次数在总点击次数中的占比,确定为对应版本的点击率。
步骤S2034B,将目标搜索次数、点击率和切换率相乘,得到音频的热门程度得分。
在一些实施例中,将各版本对应的搜索次数、点击率和切换率相乘,得到音频的不同版本的热门程度得分。
通过将用户进行初次搜索和二次搜索之间的音频版本切换率作为算子引入音频的不同版本的热门程度得分的计算中,能够使音频的不同版本的热门程度得分更准确地体现各版本的热门程度。
为了更清楚地说明本发明实施例提供的音频的处理方法,以下音频播放平台的服务器在预设的时间段内识别热门音乐版本的过程进行示例性说明。
如图10所示,图10为本发明实施例提供的热门音乐版本的识别方法的流程示意图,如图9所示,该识别方法包括:
步骤S101,歌曲搜索点击日志收集和处理。
在一些实施例中,通过音乐平台的搜索引擎搜索收集用户在预设时间段内的搜索点击日志,该搜索点击日志包括:搜索字段、搜索次数、点击字段和点击次数。
将演唱者B演唱的歌曲名为A的歌曲发行日后的一个月确定为该预设时间段。歌曲名为A的歌曲还存在另一版本,该版本由演唱者C演唱。
则收集在歌曲搜索点击日志中以歌曲名A为关键词,检索搜索字段包括歌曲名A的歌曲搜索点击日志,得到如下三个歌曲搜索点击日志。
<歌曲名A>,1567897,歌曲名A,演唱者B,1496978歌曲名A,演唱者 C,10000;
<歌曲名A,演唱者B>,985890,歌曲名A,演唱者B,984797,歌曲名 A,演唱者C,1200;
<歌曲名A,演唱者C>,349768,歌曲名A,演唱者C,308945,歌曲名 A,演唱者B,10000。
步骤S102,歌曲名和演唱者共搜索次数统计。
在一些实施例中,在歌曲搜索点击日志中搜索以歌曲名和演唱者共同作为搜索字段的歌曲搜索点击日志,并获取该歌曲搜索点击日志中的搜索次数。
例如,在歌曲搜索点击日志中搜索以歌曲名A和演唱者B共同作为搜索字段的歌曲搜索点击日志,获取该歌曲搜索点击日志中的搜索次数,该搜索次数为985890。
在一些实施例中,获取对应的歌曲搜索点击日志中的点击次数,得到各音乐版本的点击次数。例如,获取以歌曲名A和演唱者B为搜索字段中,以歌曲名A和演唱者B为点击字段的点击次数,该点击次数为984797。
在一些实施例中,获取歌曲名A的总点击次数,搜索歌曲搜索点击日志中包括的包括歌曲名A的点击字段的点击次数,并将点击次数的总数确定为总点击次数,其中,
该总点击次数为:985890+984797+1200+349768+308945+10000=2640600。
步骤S103、计算各版本的热门程度得分。
在一些实施例中,版本热门程度得分的计算公式为:
Pop-Score(song,singer)=co-currency(song,singer)×click-rate(song,currency) 式中,Pop-Score(song,singer)表示以与歌曲名和演唱者对应的版本的热门程度得分,co-currency(song,singer)表示歌曲名和演唱者共搜索次数,click-rate(song,currency)表示歌曲名和演唱者对应的歌曲版本的点击率,其中,歌曲名和演唱者对应的歌曲版本的点击率为对应版本的点击次数在总点击次数中的占比。
例如,歌曲名A和演唱者B的歌曲版本的热门程度得分为:
985890×(984797/(985890+984797+1200+349768+308945+10000))=367682
歌曲名A和演唱者C的歌曲版本的热门程度得分为:
349768×(308945/(985890+984797+1200+349768+308945+10000))=40922
显然,歌曲名A和演唱者B的歌曲版本的热门程度高于歌曲名A和演唱者C的歌曲版本。
用户在通过音乐平台的搜索引擎搜索以歌曲名A为搜索关键词进行搜索时,优先显示歌曲名A和演唱者B的歌曲版本。
下面继续说明本发明实施例提供的音频的处理装置实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器240的音频的处理装置 255中的软件模块可以包括:2551、确定模块2552和识别模块2553 。
检索模块2551,用于检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击音频名对应的音频的总点击次数。
确定模块2552,用于以搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数,其中,搜索字段包括音频名和表演者;基于音频名和表演者为搜索字段进行搜索得到的搜索结果,确定点击音频名和表演者对应的音频的目标点击次数;基于目标搜索次数、总点击次数和目标点击次数,确定音频名和表演者对应的音频的热门程度得分。
识别模块2553,用于基于音频的热门程度得分识别热门音频。
在一些实施例中,所述装置还包括:
获取模块2554,用于获取预设时间段内的音频搜索数据和音频点击数据。
汇总模块2555,用于对音频搜索数据和音频点击数据进行汇总,得到包括搜索字段、搜索次数、点击字段和点击次数的搜索点击记录,其中,搜索次数为以搜索字段进行搜索的次数。
在一些实施例中,检索模块2551,还用于检索包括搜索字段的音频搜索数据,将包括搜索字段的音频搜索数据的个数确定为搜索次数。
确定模块2552,还用于基于音频点击数据中的播放时长字段中记录的播放时长,确定播放时长大于预设时长的音频点击数据为有效音频点击数据。
检索模块2551,还用于检索包括点击字段的有效音频点击数据;
确定模块2552,还用于将包括点击字段的有效音频点击数据的个数确定为点击次数。
在一些实施例中,检索模块2551,还用于检索预设时间段内的搜索点击记录,得到N个不同版本的音频的目标搜索次数,各版本的音频名均相同,各版本的音频的表演者均不相同,其中,N为大于等于2的整数。
在一些实施例中,检索模块2551,还用于检索预设时间段内的搜索点击记录,得到第n目标搜索次数,第n目标搜索次数以获取以音频名和第n个版本的音频的表演者为搜索字段进行搜索得到,其中,n为1至N之间的整数。
在一些实施例中,确定模块2552,还用于基于N个不同版本的音频名和表演者,对应形成N个不同的搜索字段;基于以搜索字段进行搜索得到的搜索结果,确定N个不同版本对应的目标点击次数。
在一些实施例中,确定模块2552,还用于基于N个不同版本的目标点击次数在总点击次数中的占比,确定N个不同版本的音频的点击率;将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的热门程度得分。
在一些实施例中,确定模块2552,还用于基于第n目标点击次数在所述总点击次数中的占比,确定第n个版本的音频的第n点击率;将第n目标搜索次数乘以所述第n点击率得到第n个版本的音频的热门程度得分。
在一些实施例中,检索模块2551,还用于检索预设时长内的搜索点击记录,得到以音频名为搜索字段进行初次搜索的次数以及二次搜索的次数,其中,二次搜索次数为在初次搜索得到的搜索结果中以音频名和表演者为搜索字段进行搜索的次数。
确定模块2552,还用于基于二次搜索的次数在初次搜索的次数中的占比,确定切换率;基于目标点击次数在总点击次数中的占比,确定点击率;将目标搜索次数、点击率和切换率相乘,得到音频的热门程度得分。
本发明实施例提供一种存储有可执行指令的存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本发明实施例提供的方法,例如,如图3至图10中任一附图示出的音频的处理方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本发明实施例具有以下有益效果:
1)通过搜索预设时间段内的搜索点击记录,获取目标搜索次数、目标点击次数和总点击次数,得到该时间段内的音频的热门程度得分,并通过该时间段内的音频的热门程度得分识别该时间段内的热门音频,实现了对预设时间段内的热门音频的识别。
2)通过分别计算不同版本的音频的热门程度得分,可以识别出在预设时间段内音频的不同版本中的热门版本。
3)通过播放时长字段中记录的播放时长对音频点击数据进行筛选,得到有效音频点击数据,通过有效音频点击数据计算得到的音频的热门程度得得分能够更加准确地反映出音频的热门程度。
4)通过将用户进行初次搜索和二次搜索之间的音频版本切换率作为算子引入音频的不同版本的热门程度得分的计算中,能够使音频的不同版本的热门程度得分更准确地体现各版本的热门程度。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种音频的处理方法,其特征在于,包括:
检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击所述音频名对应的音频的总点击次数;
基于以搜索字段进行搜索得到的搜索结果,确定点击所述音频名和所述表演者对应的音频的目标点击次数,其中,所述搜索字段包括所述音频名和所述表演者;
基于N个不同版本的音频的目标点击次数在所述总点击次数中的占比,确定N个不同版本的音频的点击率,N为大于等于2的整数;
将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的热门程度得分;
基于所述音频的所述热门程度得分识别热门音频。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预设时间段内的音频搜索数据和音频点击数据;
对所述音频搜索数据和所述音频点击数据进行汇总,得到包括搜索字段、搜索次数、点击字段和点击次数的所述搜索点击记录;
其中,所述搜索次数为以所述搜索字段进行搜索的次数。
3.根据所述权利要求2所述的方法,其特征在于,所述对所述音频搜索数据和所述音频点击数据进行汇总,得到搜索次数和点击次数包括:
检索包括所述搜索字段的所述音频搜索数据,将包括所述搜索字段的所述音频搜索数据的个数确定为所述搜索次数;
基于所述音频点击数据中的播放时长字段记录的播放时长,确定播放时长大于预设时长的音频点击数据为有效音频点击数据;
检索包括所述点击字段的所述有效音频点击数据,将包括所述点击字段的所述有效音频点击数据的个数确定为所述点击次数。
4.根据权利要求1或2所述的方法,其特征在于,所述检索预设时间段内的搜索点击记录,得到以音频名和表演者为搜索字段进行搜索的目标搜索次数,包括:
检索预设时间段内的所述搜索点击记录,得到N个不同版本的音频的目标搜索次数,各版本的所述音频名均相同,各版本的所述音频的表演者均不相同。
5.根据权利要求4所述的方法,其特征在于,所述检索预设时间段内的所述搜索点击记录,得到N个不同版本的音频的目标搜索次数,包括:
检索预设时间段内的所述搜索点击记录,得到第n目标搜索次数,所述第n目标搜索次数以所述音频名和第n个版本的音频的表演者为搜索字段进行搜索得到,其中,n为1至N之间的整数。
6.根据权利要求1或2所述的方法,其特征在于,所述基于以搜索字段进行搜索得到的搜索结果,确定点击所述音频名和所述表演者对应的音频的目标点击次数,包括:
基于N个不同版本的音频名和表演者,对应形成N个不同的搜索字段;
基于以搜索字段进行搜索得到的搜索结果,确定N个不同版本对应的目标点击次数。
7.根据权利要求1所述的方法,其特征在于,
所述基于N个不同版本的音频的目标点击次数在所述总点击次数中的占比,确定N个不同版本的音频的点击率,包括:
基于第n目标点击次数在所述总点击次数中的占比,确定第n个版本的音频的第n点击率;
所述将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的音频的热门程度得分,包括:
将第n目标搜索次数乘以所述第n点击率得到第n个版本的音频的热门程度得分。
8.一种音频的处理装置,其特征在于,包括:
检索模块,用于检索预设时间段内的搜索点击记录,以获取以音频名和表演者为搜索字段进行搜索的目标搜索次数、以及点击所述音频名对应的音频的总点击次数;
确定模块,用于基于以所述音频名和所述表演者为搜索字段进行搜索得到的搜索结果,确定点击所述音频名和所述表演者对应的音频的目标点击次数;基于N个不同版本的音频的目标点击次数在所述总点击次数中的占比,确定N个不同版本的音频的点击率,N为大于等于2的整数;将N个不同版本的音频的目标搜索次数乘以对应版本的音频的点击率,得到N个不同版本的热门程度得分;
识别模块,用于基于所述音频的所述热门程度得分识别热门音频。
9.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至7任一项所述的音频的处理方法。
10.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的所述计算机可执行指令时,实现权利要求1至7任一项所述的音频的处理方法。
CN201910808849.4A 2019-08-29 2019-08-29 一种音频的处理方法及装置 Active CN110532419B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910808849.4A CN110532419B (zh) 2019-08-29 2019-08-29 一种音频的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910808849.4A CN110532419B (zh) 2019-08-29 2019-08-29 一种音频的处理方法及装置

Publications (2)

Publication Number Publication Date
CN110532419A CN110532419A (zh) 2019-12-03
CN110532419B true CN110532419B (zh) 2023-01-06

Family

ID=68665219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910808849.4A Active CN110532419B (zh) 2019-08-29 2019-08-29 一种音频的处理方法及装置

Country Status (1)

Country Link
CN (1) CN110532419B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125028B (zh) * 2019-12-25 2023-10-24 腾讯音乐娱乐科技(深圳)有限公司 识别音频文件的方法、装置、服务器及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11210338B2 (en) * 2014-05-29 2021-12-28 Sirius Xm Radio Inc. Systems, methods and apparatus for generating music recommendations based on combining song and user influencers with channel rule characterizations
US20160055242A1 (en) * 2014-08-20 2016-02-25 Luceo Social, Inc. Systems and methods for analyzing content from digital content sources
CN104573105B (zh) * 2015-01-30 2017-10-20 福州大学 一种音乐点播网络中热门歌曲、歌星的推荐方法
CN107239497B (zh) * 2017-05-02 2020-11-03 广东万丈金数信息技术股份有限公司 热门内容搜索方法和系统
CN108319635A (zh) * 2017-12-15 2018-07-24 海南智媒云图科技股份有限公司 一种多平台音乐资源整合播放的方法、电子设备及存储介质
CN109299314B (zh) * 2018-11-13 2019-12-27 百度在线网络技术(北京)有限公司 音乐检索与推荐的方法、装置、存储介质和终端设备

Also Published As

Publication number Publication date
CN110532419A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
KR101086197B1 (ko) 미디어 플레이백 디바이스에 의한 미디어 인기도 결정을 위한 방법
US8280889B2 (en) Automatically acquiring acoustic information about music
CN101256811B (zh) 用于产生播放列表的设备和方法
US8761575B2 (en) Method and apparatus for searching replay data
US11151190B2 (en) Generating playlists using calendar, location and event data
KR20080035617A (ko) 단일 액션 미디어 재생 리스트 생성
CN103137167A (zh) 播放音乐的方法及音乐播放器
US20200162769A1 (en) Identifying media content for simultaneous playback
CN109857901B (zh) 信息展示方法和装置、以及用于信息搜索的方法和装置
CN110010159B (zh) 声音相似度确定方法及装置
CN112987996B (zh) 信息显示方法、装置、电子设备以及计算机可读存储介质
CN110532419B (zh) 一种音频的处理方法及装置
JP2003084783A (ja) 音楽データ再生装置、音楽データ再生方法、音楽データ再生プログラム、並びに音楽データ再生プログラムを記録した記録媒体
CN106775567B (zh) 一种音效匹配方法及系统
KR101336846B1 (ko) 콘텐츠 검색 서비스를 제공하는 방법, 검색 서버 및 이를 포함하는 검색 시스템
KR20210130069A (ko) 사용자 선호 기반 음악 정렬 장치 및 이에 적용되는 단말기
JP4824055B2 (ja) 類似プレイリスト検索方法、プログラム及び装置
JP7428182B2 (ja) 情報処理装置および方法、並びにプログラム
CN112989102A (zh) 音频播放控制方法、装置、存储介质及终端设备
CN113868445A (zh) 续播位置确定方法、续播系统
US7797300B2 (en) Systems and methods for conducting searches of multiple music libraries
Cai et al. Design and implementation of karaoke system based on Android platform
JP2002157255A (ja) 楽曲検索装置及び方法
US20100120531A1 (en) Audio content management for video game systems
JP2010156986A (ja) 音楽データ再生装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant