CN110647654A

CN110647654A - 基于音频内容画像的音频主播评级方法、系统及存储介质

Info

Publication number: CN110647654A
Application number: CN201910765775.0A
Authority: CN
Inventors: 朱玉婷; 杜睿
Original assignee: Guangzhou Li Zhi Network Technology Co Ltd
Current assignee: Guangzhou Li Zhi Network Technology Co Ltd
Priority date: 2019-08-19
Filing date: 2019-08-19
Publication date: 2020-01-03

Abstract

本发明提供一种基于音频内容画像的音频主播评级方法、系统及存储介质，构建主播画像系统，用以描述主播历史行为，及主播与音频内容之间的关系；基于主播画像系统，通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法，完成音频内容价值评估。本发明能客观的评价主播的价值，自动的完成音频价值的评估。

Description

基于音频内容画像的音频主播评级方法、系统及存储介质

技术领域

本发明属于大数据领域，为AI人工智能方向，具体涉及一种基于音频内容画像的音频主播评级方法、系统及存储介质。

背景技术

随着互联网及移动互联网的高速发展，人们从互联网上获取信息的方式，逐渐从文字，转变为音频、视频。声音作为人类获取信息的主要方式之一，互联网上的音频内容越来越多，怎么从海量的音频信息中找到高价值的音频，以及对于音频价值的定义越来越重要。

现阶段，对于各个音频的价值，主要是通过人们的口碑传播，带有很大的主观性，不能很好的客观的反馈内容价值，并且效率很低。

对于音频产出者主播来说，主播擅长的内容相对稳定，在短期内生产内容的价值也相对稳定，如何通过人工智能客观的评价主播的价值，而且可以自动的完成音频价值的评估，节省大量人力是未来的发展趋势。

有鉴于此，本发明提供一种基于音频内容画像的音频主播评级方法、系统及存储介质，本案由此产生。

发明内容

本发明的目的在于提供一种基于音频内容画像的音频主播评级方法、系统及存储介质，以实现客观的评价主播的价值，自动的完成音频价值的评估。

为实现上述目的，本发明具体通过以下方案实现：

第一方面，一种基于音频内容画像的音频主播评级方法，所述方法包括：

构建主播画像系统，用以描述主播历史行为，及主播与音频内容之间的关系；

基于主播画像系统，通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法，完成音频内容价值评估。

进一步，所述构建主播画像系统包括：

采集主播以及音频相关服务端操作日志；

基于采集到的日志，挖掘关键信息；

根据主播唯一标识，将挖掘好的信息，进行合并与聚类，形成主播画像系统。

进一步，所述关键信息包括：

主播上传音频的时间；

主播上传音频时定义的分类；

主播历史内容相关的点击信息、收听信息、点赞信息和转发信息。

进一步，模型输入为：前一个月该节目每天的点击率，收听时长，完播率，评论数；

模型输出为：输出为模型预测该节目第二天最佳流量分配方案。

进一步，所述模型算法公式如下：

K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]

第n天的整体收益的衡量：Dn为经归一化的第n天的点击率，Sn为经归一化的第n天的收听时长，Wn为经归一化的第n天的完播率，Pn为经归一化的第n天的评论数；

K＝[k1,k2,k3,k4]K为四个指标相对于整体收益的权重，根据业务类型调整，所述归一化方法使用z-score方法。

进一步，算法学习过程：

一、在该主播上传过的节目中取上传超过k天的节目，把该主播上传过的每个节目生成一个节目特征序列，序列长度为k；k根据主播上传的节目数量定；序列中每个特征为[Dn,Sn,Wn,Pn]；

二、以k为窗口大小生成特征序列训练数据；

原始序列数据：m为该节目上传后的天数，

D	S	W	P
				X11	X12	X13	X14
…	…	…	…
				Xm1	Xm2	…	Xm4

序列特征向量：

Feature:

D	S	W	P
				X11	X12	X13	X14
…	…	…	…
				Xm1	Xm2	Xm3	Xm4

Label:第m+1天的节目整体收益；

四、把序列训练数据经过rnn提取序列特征，生成一维特征向量，一维特征向量经dnn压缩为低维特征向量，低维特征向量经过sigmoid映射为节目分数；节目分数与真实label对比，计算损失函数值，反向传导优化模型权重；

四、根据sigmoid打分结果制定流量分配方案:把sigmoid的结果按照分段函数映射到m个rate，针对每种rate,人工制定流量分配方案。

第二方面，一种基于音频内容画像的音频主播评级系统，

构建主播画像系统模块，用以描述主播历史行为，及主播与音频内容之间的关系；

内容价值评估模块，通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估；

流量分配方案模块，根据音频内容价值评估，输出第二天最佳流量分配方案。

第三方面，提供一种存储介质，所述存储介质上存储有基于音频内容画像的音频主播评级程序，音频主播评级程序被处理器执行时实现所述基于音频内容画像的音频主播评级方法的步骤。

本发明有益效果：通过构建主播画像系统，以及使用人工智能方法，基于主播历史内容价值，预测主播将来内容的价值，不光能够客观的评价主播的价值，而且可以自动话的完成音频价值的评估，节省大量人力。

附图说明

图1是根据一示例性实施例示出的一种基于音频内容画像的音频主播评级方法的流程图；

图2是根据一示例性实施例示出的主播画像系统构建的流程图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种基于音频内容画像的音频主播评级方法的流程图；如图1所示，

一种基于音频内容画像的音频主播评级方法，包括如下步骤：

步骤S100，构建主播画像系统，用以描述主播历史行为，及主播与音频内容之间的关系；

步骤S101，内容价值评估，通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估；

步骤S102，流量分配方案，根据音频内容价值评估，输出第二天最佳流量分配方案。

其中，模型算法为平台每个主播训练一个节目价值评估模型，模型功能为预测主播某一个节目在第二天的价值。

模型输入为：前一个月该节目每天的点击率，收听时长，完播率，评论数。

模型输出为：输出为模型预测该节目第二天最佳流量分配方案，以保证第二天节目整体收益较预测当天不下跌的最高流量分配。

模型算法公式如下：

K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]

如图2所示，构建主播画像系统包括如下步骤：

步骤S200，采集主播以及音频相关服务端操作日志；

步骤S201，基于采集到的日志，采用数据挖掘的算法，挖掘关键信息；

步骤S202，根据主播唯一标识，将挖掘好的信息，进行合并与聚类，形成主播画像系统。

其中步骤S201中所述的关键信息包括：主播上传音频的时间；主播上传音频时定义的分类；主播历史内容相关的点击信息、收听信息、点赞信息和转发信息。

针对单个主播的算法训练流程如下：

二、以k为窗口大小生成特征序列训练数据；

原始序列数据：m为该节目上传后的天数，

D	S	W	P
				X11	X12	X13	X14
…	…	…	…
				Xm1	Xm2	…	Xm4

序列特征向量：

Feature:

D	S	W	P
				X11	X12	X13	X14
…	…	…	…
				Xm1	Xm2	Xm3	Xm4

Label:第m+1天的节目整体收益；

五、把序列训练数据经过rnn提取序列特征，生成一维特征向量，一维特征向量经dnn压缩为低维特征向量，低维特征向量经过sigmoid映射为节目分数；节目分数与真实label对比，计算损失函数值，反向传导优化模型权重；

在示例性实施例中，还提供了一种计算机可读存储介质，基于音频内容画像的音频主播评级程序存储在存储介质上，音频主播评级程序被处理器执行时实现所述基于音频内容画像的音频主播评级方法的步骤。

在示例性实施例中，还提供一种基于音频内容画像的音频主播评级程序系统，包括如下模块：

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种基于音频内容画像的音频主播评级方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于音频内容画像的音频主播评级方法，其特征在于，所述构建主播画像系统包括：

采集主播以及音频相关服务端操作日志；

基于采集到的日志，挖掘关键信息；

3.根据权利要求2所述的一种基于音频内容画像的音频主播评级方法，其特征在于，所述关键信息包括：

主播上传音频的时间；

主播上传音频时定义的分类；

4.根据权利要求1所述的一种基于音频内容画像的音频主播评级方法，其特征在于：

模型输入为：前一个月该节目每天的点击率，收听时长，完播率，评论数；

5.根据权利要求4所述的一种基于音频内容画像的音频主播评级方法，其特征在于，所述模型算法公式如下：

K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]

K＝[k1,k2,k3,k4]K为四个指标相对于整体收益的权重，根据业务类型调整。

6.根据权利要求5所述的一种基于音频内容画像的音频主播评级方法，其特征在于：所述归一化方法使用z-score方法。

7.根据权利要求5所述的一种基于音频内容画像的音频主播评级方法，其特征在于，算法学习过程：

二、以k为窗口大小生成特征序列训练数据；

原始序列数据：m为该节目上传后的天数，

D S W P X11 X12 X13 X14 … … … … Xm1 Xm2 … Xm4

序列特征向量：

Feature:

D S W P X11 X12 X13 X14 … … … … Xm1 Xm2 Xm3 Xm4

Label:第m+1天的节目整体收益；

三、把序列训练数据经过rnn提取序列特征，生成一维特征向量，一维特征向量经dnn压缩为低维特征向量，低维特征向量经过sigmoid映射为节目分数；节目分数与真实label对比，计算损失函数值，反向传导优化模型权重；

8.一种基于音频内容画像的音频主播评级系统，其特征在于：

9.一种存储介质，其特征在于：所述存储介质上存储有基于音频内容画像的音频主播评级程序，音频主播评级程序被处理器执行时实现如权利要求1-7中任一项所述基于音频内容画像的音频主播评级方法的步骤。