CN111192602A

CN111192602A - 一种基于音频内容画像系统的白噪音音频内容价值评估方法

Info

Publication number: CN111192602A
Application number: CN201911221958.2A
Authority: CN
Inventors: 吴海旭; 丁宁
Original assignee: Guangzhou Lizhi Network Technology Co ltd
Current assignee: Guangzhou Lizhi Network Technology Co ltd
Priority date: 2019-12-03
Filing date: 2019-12-03
Publication date: 2020-05-22

Abstract

本发明公开了一种基于音频内容画像系统的白噪音音频内容价值评估方法，包括：构建音频内容画像系统，用以描述用户使用行为与白噪音音频内容之间的关系；基于音频内容画像系统，通过深度学习算法对白噪音音频内容价值构建模型算法，完成对白噪音音频内容价值的评估。通过客观的收集用户对于相关音频的反馈，训练模型，自动的，客观的完成自然界白噪音相关拼音的价值评估，节省人力，且能够更加客观的反馈相关音频给平台带来的价值。

Description

一种基于音频内容画像系统的白噪音音频内容价值评估方法

技术领域

本发明涉及一种基于音频内容画像系统的白噪音音频内容价值评估方法。

背景技术

现阶段社会，在钢筋水泥土构建的生活中，快节奏的生活给大家带来了巨大的压力。众所周知，亲近自然，聆听自然界的声音，能够很大程度的缓解疲劳，以及缓解生活压力，由于时间及空间等的限制，越来越多的人通过收听自然界相关白噪音的方式亲近自然，缓解压力。各大音频平台，也越来越多的为大家准备非常多的自然界白噪音为大家服务。

对于音频平台来说，自然界白噪音相关品类变得越来越重要，那么相关音频内容的价值评估成为相关品类最重要的方式之一。

由于自然界白噪音纯自然音的特殊性，现阶段，相关内容的评价，主要通过人工的方式进行评价，这样的评价方式带来了如下两个方面的缺陷：①评价主观性比较严重，相关评价都是基于评价者的喜好作为依据，很难客观的体现相关音频的价值；②人工评估，效率极低，大量占用了人工成本。

发明内容

本发明旨在至少在一定程度上解决现有相关技术中存在的问题之一，为此，本发明的目的在于提出一种基于音频内容画像系统的白噪音音频内容价值评估方法，客观的完成白噪音的价值评估。

上述目的是通过如下技术方案来实现的：

一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，包括：

构建音频内容画像系统，用以描述用户使用行为与白噪音音频内容之间的关系；

基于音频内容画像系统，通过深度学习算法对白噪音音频内容价值构建模型算法，完成对白噪音音频内容价值的评估。

作为本发明的进一步改进，所述构建音频内容画像系统包括：采集服务端用户使用的相关日志信息；基于采集到的日志信息，挖掘关键信息；根据音频唯一标识，将挖掘的关键信息，进行合并与聚类，构建音频内容画像系统。

作为本发明的进一步改进，所述关键信息包括：白噪音音频内容的点击率；白噪音音频内容的收听时长；白噪音音频内容的完播率；白噪音音频内容的评论数；白噪音音频内容的转发数。

作为本发明的进一步改进，模型输入为：前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。模型输出为：预测该白噪音音频内容第二天最佳流量分配方案。

作为本发明的进一步改进，所述模型算法公式如下：K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)]，Dn为经过归一化的第n天点击率；Sn为经过归一化的第n天的白噪音音频内容收听时长；Wn为经过归一化的第n天的白噪音音频内容完播率；Pn为经过归一化的第n天的白噪音音频内容评论数；Zn为经过归一化的第n天的白噪音音频内容转发数；其中K＝[k1,k2,k3,k4,k5]，k为五个指标相对于整体收益的权重，根据业务需要进行手工调整。

作为本发明的进一步改进，所述归一化方法使用z-score方法。

作为本发明的进一步改进，以k为窗口大小生成特征序列训练数据。

原始序列数据：m为该节目上传后的天数。

D	S	W	P	Z
					X11	X12	X13	X14	X15
…	…	…	…	…
					Xm1	Xm2	…	Xm4	Xm5

序列特征向量：

Feature(特征)：

D	S	W	P	Z
					X11	X12	X13	X14	X15
…	…	…	…	…
					Xm1	Xm2	Xm3	Xm4	X5m

Label(分类):

第m+1天的节目整体收益；

把序列训练数据经过RNN提取序列特征，生成一维特征向量，一维特征向量经DNN压缩为低维特征向量，低维特征向量经过Tanh函数映射为节目分数。节目分数与真实label对比，计算损失函数值，反向传导优化模型权重；

根据Tanh打分结果制定流量分配方案:把Tanh的结果按照分段函数映射到m个rate.针对每种rate,人工制定流量分配方案，其中m针对于不同业务，人工制定即可。

作为本发明的进一步改进，还包括模型迭代优化方法，具体如下：根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数，生成新的训练数据，微调模型。

与现有技术相比，本发明的至少包括以下有益效果：

1.本发明通过客观的收集用户对于相关音频的反馈，训练模型，自动的，客观的完成自然界白噪音相关拼音的价值评估，节省人力，且能够更加客观的反馈相关音频给平台带来的价值。

附图说明

图1是实施例中一种基于音频内容画像系统的白噪音音频内容价值评估方法流程图。

具体实施方式

以下实施例对本发明进行说明，但本发明并不受这些实施例所限制。对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换，而不脱离本发明方案的精神，其均应涵盖在本发明请求保护的技术方案范围当中。

参见附图1示出一种基于音频内容画像系统的白噪音音频内容价值评估方法，包括：构建音频内容画像系统，用以描述用户使用行为与白噪音音频内容之间的关系S1；基于音频内容画像系统，通过深度学习算法对白噪音音频内容价值构建模型算法，完成对白噪音音频内容价值的评估S2；流量分配方案，根据内容价值的评估，输出该白噪音音频内容第二天最佳流量分配方案S3。

优选地，所述构建音频内容画像系统包括：采集服务端用户使用的相关日志信息；基于采集到的日志信息，挖掘关键信息，所述关键信息包括：白噪音音频内容的点击率；白噪音音频内容的收听时长；白噪音音频内容的完播率；白噪音音频内容的评论数；白噪音音频内容的转发数，还可以包括白噪音音频内容的点赞数等其他关键信息。根据音频唯一标识，将挖掘的关键信息，进行合并与聚类，构建音频内容画像系统。

基于音频内容画像系统，采用深度学习算法，主要特征为白噪音音频相关内容价值，构建模型算法，完成白噪音音频价值评估。算法为音频平台相关白噪音音频训练一个音频价值评估模型，模型功能为预测相关音频第二天带来价值，价值主要体现在点击率，收听时长，完播率、评论数、转发数。模型输入为：前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。模型输出为：预测该白噪音音频内容第二天最佳流量分配方案。

所述模型算法公式如下：K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)]，Dn为经过归一化的第n天点击率；Sn为经过归一化的第n天的白噪音音频内容收听时长；Wn为经过归一化的第n天的白噪音音频内容完播率；Pn为经过归一化的第n天的白噪音音频内容评论数；Zn为经过归一化的第n天的白噪音音频内容转发数；其中K＝[k1,k2,k3,k4,k5]，k为五个指标相对于整体收益的权重，根据业务需要进行手工调整。

优选地，所述归一化方法使用z-score方法。其中z-score为零-均值规范化。

原始序列数据：m为该节目上传后的天数。

D	S	W	P	Z
					X11	X12	X13	X14	X15
…	…	…	…	…
					Xm1	Xm2	…	Xm4	Xm5

序列特征向量：

Feature(特征)：

D	S	W	P	Z
					X11	X12	X13	X14	X15
…	…	…	…	…
					Xm1	Xm2	Xm3	Xm4	X5m

Label(分类):

第m+1天的节目整体收益；

其中，RNN为递归神经网络；DNN为深度神经网络；rate为等级，本实施例中为白噪音内容价值；label，tanh为双曲正切函数。

还包括模型迭代优化方法，具体如下：根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数，生成新的训练数据，微调模型。

上述优选实施方式应视为本申请方案实施方式的举例说明，凡与本申请方案雷同、近似或以此为基础作出的技术推演、替换、改进等，均应视为本专利的保护范围。

Claims

1.一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，包括：

2.根据权利要求1所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，所述构建音频内容画像系统包括：

采集服务端用户使用的相关日志信息；

基于采集到的日志信息，挖掘关键信息；

根据音频唯一标识，将挖掘的关键信息，进行合并与聚类，构建音频内容画像系统。

3.根据权利要求2所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，所述关键信息包括：白噪音音频内容的点击率；白噪音音频内容的收听时长；白噪音音频内容的完播率；白噪音音频内容的评论数；白噪音音频内容的转发数。

4.根据权利要求1所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于：

模型输入为：前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。

模型输出为：该白噪音音频内容第二天最佳流量分配方案。

5.根据权利要求4所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，所述模型算法公式如下：

K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)]，

Dn为经过归一化的第n天点击率；Sn为经过归一化的第n天的白噪音音频内容收听时长；Wn为经过归一化的第n天的白噪音音频内容完播率；Pn为经过归一化的第n天的白噪音音频内容评论数；Zn为经过归一化的第n天的白噪音音频内容转发数；

其中K＝[k1,k2,k3,k4,k5]，k为五个指标相对于整体收益的权重，根据业务需要进行手工调整。

6.根据权利要求5所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，所述归一化方法使用z-score方法。

7.根据权利要求5所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，

以k为窗口大小生成特征序列训练数据。

原始序列数据：m为该节目上传后的天数。

D S W P Z X11 X12 X13 X14 X15 … … … … … Xm1 Xm2 … Xm4 Xm5

序列特征向量：

Feature(特征)：

D S W P Z X11 X12 X13 X14 X15 … … … … … Xm1 Xm2 Xm3 Xm4 X5m

Label(分类):

第m+1天的节目整体收益；

8.根据权利要求7所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法，其特征在于，还包括模型迭代优化方法，具体如下：

根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数，生成新的训练数据，微调模型。