CN111192602A - 一种基于音频内容画像系统的白噪音音频内容价值评估方法 - Google Patents

一种基于音频内容画像系统的白噪音音频内容价值评估方法 Download PDF

Info

Publication number
CN111192602A
CN111192602A CN201911221958.2A CN201911221958A CN111192602A CN 111192602 A CN111192602 A CN 111192602A CN 201911221958 A CN201911221958 A CN 201911221958A CN 111192602 A CN111192602 A CN 111192602A
Authority
CN
China
Prior art keywords
audio content
white noise
noise audio
model
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911221958.2A
Other languages
English (en)
Inventor
吴海旭
丁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Lizhi Network Technology Co ltd
Original Assignee
Guangzhou Lizhi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Lizhi Network Technology Co ltd filed Critical Guangzhou Lizhi Network Technology Co ltd
Priority to CN201911221958.2A priority Critical patent/CN111192602A/zh
Publication of CN111192602A publication Critical patent/CN111192602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种基于音频内容画像系统的白噪音音频内容价值评估方法,包括:构建音频内容画像系统,用以描述用户使用行为与白噪音音频内容之间的关系;基于音频内容画像系统,通过深度学习算法对白噪音音频内容价值构建模型算法,完成对白噪音音频内容价值的评估。通过客观的收集用户对于相关音频的反馈,训练模型,自动的,客观的完成自然界白噪音相关拼音的价值评估,节省人力,且能够更加客观的反馈相关音频给平台带来的价值。

Description

一种基于音频内容画像系统的白噪音音频内容价值评估方法
技术领域
本发明涉及一种基于音频内容画像系统的白噪音音频内容价值评估方法。
背景技术
现阶段社会,在钢筋水泥土构建的生活中,快节奏的生活给大家带来了巨大的压力。众所周知,亲近自然,聆听自然界的声音,能够很大程度的缓解疲劳,以及缓解生活压力,由于时间及空间等的限制,越来越多的人通过收听自然界相关白噪音的方式亲近自然,缓解压力。各大音频平台,也越来越多的为大家准备非常多的自然界白噪音为大家服务。
对于音频平台来说,自然界白噪音相关品类变得越来越重要,那么相关音频内容的价值评估成为相关品类最重要的方式之一。
由于自然界白噪音纯自然音的特殊性,现阶段,相关内容的评价,主要通过人工的方式进行评价,这样的评价方式带来了如下两个方面的缺陷:①评价主观性比较严重,相关评价都是基于评价者的喜好作为依据,很难客观的体现相关音频的价值;②人工评估,效率极低,大量占用了人工成本。
发明内容
本发明旨在至少在一定程度上解决现有相关技术中存在的问题之一,为此,本发明的目的在于提出一种基于音频内容画像系统的白噪音音频内容价值评估方法,客观的完成白噪音的价值评估。
上述目的是通过如下技术方案来实现的:
一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,包括:
构建音频内容画像系统,用以描述用户使用行为与白噪音音频内容之间的关系;
基于音频内容画像系统,通过深度学习算法对白噪音音频内容价值构建模型算法,完成对白噪音音频内容价值的评估。
作为本发明的进一步改进,所述构建音频内容画像系统包括:采集服务端用户使用的相关日志信息;基于采集到的日志信息,挖掘关键信息;根据音频唯一标识,将挖掘的关键信息,进行合并与聚类,构建音频内容画像系统。
作为本发明的进一步改进,所述关键信息包括:白噪音音频内容的点击率;白噪音音频内容的收听时长;白噪音音频内容的完播率;白噪音音频内容的评论数;白噪音音频内容的转发数。
作为本发明的进一步改进,模型输入为:前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。模型输出为:预测该白噪音音频内容第二天最佳流量分配方案。
作为本发明的进一步改进,所述模型算法公式如下:K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)],Dn为经过归一化的第n天点击率;Sn为经过归一化的第n天的白噪音音频内容收听时长;Wn为经过归一化的第n天的白噪音音频内容完播率;Pn为经过归一化的第n天的白噪音音频内容评论数;Zn为经过归一化的第n天的白噪音音频内容转发数;其中K=[k1,k2,k3,k4,k5],k为五个指标相对于整体收益的权重,根据业务需要进行手工调整。
作为本发明的进一步改进,所述归一化方法使用z-score方法。
作为本发明的进一步改进,以k为窗口大小生成特征序列训练数据。
原始序列数据:m为该节目上传后的天数。
D S W P Z
X11 X12 X13 X14 X15
Xm1 Xm2 Xm4 Xm5
序列特征向量:
Feature(特征):
D S W P Z
X11 X12 X13 X14 X15
Xm1 Xm2 Xm3 Xm4 X5m
Label(分类):
第m+1天的节目整体收益;
把序列训练数据经过RNN提取序列特征,生成一维特征向量,一维特征向量经DNN压缩为低维特征向量,低维特征向量经过Tanh函数映射为节目分数。节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
根据Tanh打分结果制定流量分配方案:把Tanh的结果按照分段函数映射到m个rate.针对每种rate,人工制定流量分配方案,其中m针对于不同业务,人工制定即可。
作为本发明的进一步改进,还包括模型迭代优化方法,具体如下:根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数,生成新的训练数据,微调模型。
与现有技术相比,本发明的至少包括以下有益效果:
1.本发明通过客观的收集用户对于相关音频的反馈,训练模型,自动的,客观的完成自然界白噪音相关拼音的价值评估,节省人力,且能够更加客观的反馈相关音频给平台带来的价值。
附图说明
图1是实施例中一种基于音频内容画像系统的白噪音音频内容价值评估方法流程图。
具体实施方式
以下实施例对本发明进行说明,但本发明并不受这些实施例所限制。对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换,而不脱离本发明方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
参见附图1示出一种基于音频内容画像系统的白噪音音频内容价值评估方法,包括:构建音频内容画像系统,用以描述用户使用行为与白噪音音频内容之间的关系S1;基于音频内容画像系统,通过深度学习算法对白噪音音频内容价值构建模型算法,完成对白噪音音频内容价值的评估S2;流量分配方案,根据内容价值的评估,输出该白噪音音频内容第二天最佳流量分配方案S3。
优选地,所述构建音频内容画像系统包括:采集服务端用户使用的相关日志信息;基于采集到的日志信息,挖掘关键信息,所述关键信息包括:白噪音音频内容的点击率;白噪音音频内容的收听时长;白噪音音频内容的完播率;白噪音音频内容的评论数;白噪音音频内容的转发数,还可以包括白噪音音频内容的点赞数等其他关键信息。根据音频唯一标识,将挖掘的关键信息,进行合并与聚类,构建音频内容画像系统。
基于音频内容画像系统,采用深度学习算法,主要特征为白噪音音频相关内容价值,构建模型算法,完成白噪音音频价值评估。算法为音频平台相关白噪音音频训练一个音频价值评估模型,模型功能为预测相关音频第二天带来价值,价值主要体现在点击率,收听时长,完播率、评论数、转发数。模型输入为:前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。模型输出为:预测该白噪音音频内容第二天最佳流量分配方案。
所述模型算法公式如下:K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)],Dn为经过归一化的第n天点击率;Sn为经过归一化的第n天的白噪音音频内容收听时长;Wn为经过归一化的第n天的白噪音音频内容完播率;Pn为经过归一化的第n天的白噪音音频内容评论数;Zn为经过归一化的第n天的白噪音音频内容转发数;其中K=[k1,k2,k3,k4,k5],k为五个指标相对于整体收益的权重,根据业务需要进行手工调整。
优选地,所述归一化方法使用z-score方法。其中z-score为零-均值规范化。
作为本发明的进一步改进,以k为窗口大小生成特征序列训练数据。
原始序列数据:m为该节目上传后的天数。
D S W P Z
X11 X12 X13 X14 X15
Xm1 Xm2 Xm4 Xm5
序列特征向量:
Feature(特征):
D S W P Z
X11 X12 X13 X14 X15
Xm1 Xm2 Xm3 Xm4 X5m
Label(分类):
第m+1天的节目整体收益;
把序列训练数据经过RNN提取序列特征,生成一维特征向量,一维特征向量经DNN压缩为低维特征向量,低维特征向量经过Tanh函数映射为节目分数。节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
根据Tanh打分结果制定流量分配方案:把Tanh的结果按照分段函数映射到m个rate.针对每种rate,人工制定流量分配方案,其中m针对于不同业务,人工制定即可。
其中,RNN为递归神经网络;DNN为深度神经网络;rate为等级,本实施例中为白噪音内容价值;label,tanh为双曲正切函数。
还包括模型迭代优化方法,具体如下:根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数,生成新的训练数据,微调模型。
上述优选实施方式应视为本申请方案实施方式的举例说明,凡与本申请方案雷同、近似或以此为基础作出的技术推演、替换、改进等,均应视为本专利的保护范围。

Claims (8)

1.一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,包括:
构建音频内容画像系统,用以描述用户使用行为与白噪音音频内容之间的关系;
基于音频内容画像系统,通过深度学习算法对白噪音音频内容价值构建模型算法,完成对白噪音音频内容价值的评估。
2.根据权利要求1所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,所述构建音频内容画像系统包括:
采集服务端用户使用的相关日志信息;
基于采集到的日志信息,挖掘关键信息;
根据音频唯一标识,将挖掘的关键信息,进行合并与聚类,构建音频内容画像系统。
3.根据权利要求2所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,所述关键信息包括:白噪音音频内容的点击率;白噪音音频内容的收听时长;白噪音音频内容的完播率;白噪音音频内容的评论数;白噪音音频内容的转发数。
4.根据权利要求1所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于:
模型输入为:前一天白噪音音频内容的点击率、收听时长、完播率、评论数及转发数。
模型输出为:该白噪音音频内容第二天最佳流量分配方案。
5.根据权利要求4所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,所述模型算法公式如下:
K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)+(Zn–Zn-1)],
Dn为经过归一化的第n天点击率;Sn为经过归一化的第n天的白噪音音频内容收听时长;Wn为经过归一化的第n天的白噪音音频内容完播率;Pn为经过归一化的第n天的白噪音音频内容评论数;Zn为经过归一化的第n天的白噪音音频内容转发数;
其中K=[k1,k2,k3,k4,k5],k为五个指标相对于整体收益的权重,根据业务需要进行手工调整。
6.根据权利要求5所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,所述归一化方法使用z-score方法。
7.根据权利要求5所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,
以k为窗口大小生成特征序列训练数据。
原始序列数据:m为该节目上传后的天数。
D S W P Z X11 X12 X13 X14 X15 Xm1 Xm2 Xm4 Xm5
序列特征向量:
Feature(特征):
D S W P Z X11 X12 X13 X14 X15 Xm1 Xm2 Xm3 Xm4 X5m
Label(分类):
第m+1天的节目整体收益;
把序列训练数据经过RNN提取序列特征,生成一维特征向量,一维特征向量经DNN压缩为低维特征向量,低维特征向量经过Tanh函数映射为节目分数。节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
根据Tanh打分结果制定流量分配方案:把Tanh的结果按照分段函数映射到m个rate.针对每种rate,人工制定流量分配方案,其中m针对于不同业务,人工制定即可。
8.根据权利要求7所述的一种基于音频内容画像系统的白噪音音频内容价值评估方法,其特征在于,还包括模型迭代优化方法,具体如下:
根据每周使用新上传的白噪音音频内容和历史上每个白噪音音频内容的点击率、收听时长、完播率、评论数、转发数,生成新的训练数据,微调模型。
CN201911221958.2A 2019-12-03 2019-12-03 一种基于音频内容画像系统的白噪音音频内容价值评估方法 Pending CN111192602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911221958.2A CN111192602A (zh) 2019-12-03 2019-12-03 一种基于音频内容画像系统的白噪音音频内容价值评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911221958.2A CN111192602A (zh) 2019-12-03 2019-12-03 一种基于音频内容画像系统的白噪音音频内容价值评估方法

Publications (1)

Publication Number Publication Date
CN111192602A true CN111192602A (zh) 2020-05-22

Family

ID=70710869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911221958.2A Pending CN111192602A (zh) 2019-12-03 2019-12-03 一种基于音频内容画像系统的白噪音音频内容价值评估方法

Country Status (1)

Country Link
CN (1) CN111192602A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567477A (zh) * 2011-06-16 2012-07-11 北京亿赞普网络技术有限公司 网站价值评估方法及装置
CN105791157A (zh) * 2016-04-20 2016-07-20 腾讯科技(深圳)有限公司 一种流量的分配方法、分配系统、及服务器
CN107193805A (zh) * 2017-06-06 2017-09-22 北京百度网讯科技有限公司 基于人工智能的文章价值评估方法、装置及存储介质
CN107402954A (zh) * 2017-05-26 2017-11-28 百度在线网络技术(北京)有限公司 建立排序模型的方法、基于该模型的应用方法和装置
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
CN107426614A (zh) * 2017-04-21 2017-12-01 深圳市茁壮网络股份有限公司 一种基于点播场景的视频资源价值评估方法和装置
CN107705005A (zh) * 2017-09-27 2018-02-16 吴殿义 一种影视内容价值评估方法
CN108011740A (zh) * 2016-10-28 2018-05-08 腾讯科技(深圳)有限公司 一种媒体流量数据处理方法和装置
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109389424A (zh) * 2018-09-20 2019-02-26 北京达佳互联信息技术有限公司 流量分配方法、装置、电子设备及存储介质
CN109670621A (zh) * 2017-10-16 2019-04-23 优酷网络技术(北京)有限公司 神经网络预测方法及装置
CN109784978A (zh) * 2018-12-19 2019-05-21 平安科技(深圳)有限公司 基于大数据的广告竞争力计算方法、装置、介质及设备
CN110069715A (zh) * 2019-04-29 2019-07-30 腾讯科技(深圳)有限公司 一种信息推荐模型训练的方法、信息推荐的方法及装置
CN110110203A (zh) * 2018-01-11 2019-08-09 腾讯科技(深圳)有限公司 资源信息推送方法及服务器、资源信息展示方法及终端
CN110175786A (zh) * 2019-05-30 2019-08-27 浪潮卓数大数据产业发展有限公司 一种基于区块链的内容价值评价方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567477A (zh) * 2011-06-16 2012-07-11 北京亿赞普网络技术有限公司 网站价值评估方法及装置
CN105791157A (zh) * 2016-04-20 2016-07-20 腾讯科技(深圳)有限公司 一种流量的分配方法、分配系统、及服务器
CN108011740A (zh) * 2016-10-28 2018-05-08 腾讯科技(深圳)有限公司 一种媒体流量数据处理方法和装置
CN107426614A (zh) * 2017-04-21 2017-12-01 深圳市茁壮网络股份有限公司 一种基于点播场景的视频资源价值评估方法和装置
CN107402954A (zh) * 2017-05-26 2017-11-28 百度在线网络技术(北京)有限公司 建立排序模型的方法、基于该模型的应用方法和装置
CN107193805A (zh) * 2017-06-06 2017-09-22 北京百度网讯科技有限公司 基于人工智能的文章价值评估方法、装置及存储介质
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
CN107705005A (zh) * 2017-09-27 2018-02-16 吴殿义 一种影视内容价值评估方法
CN109670621A (zh) * 2017-10-16 2019-04-23 优酷网络技术(北京)有限公司 神经网络预测方法及装置
CN110110203A (zh) * 2018-01-11 2019-08-09 腾讯科技(深圳)有限公司 资源信息推送方法及服务器、资源信息展示方法及终端
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109389424A (zh) * 2018-09-20 2019-02-26 北京达佳互联信息技术有限公司 流量分配方法、装置、电子设备及存储介质
CN109784978A (zh) * 2018-12-19 2019-05-21 平安科技(深圳)有限公司 基于大数据的广告竞争力计算方法、装置、介质及设备
CN110069715A (zh) * 2019-04-29 2019-07-30 腾讯科技(深圳)有限公司 一种信息推荐模型训练的方法、信息推荐的方法及装置
CN110175786A (zh) * 2019-05-30 2019-08-27 浪潮卓数大数据产业发展有限公司 一种基于区块链的内容价值评价方法

Similar Documents

Publication Publication Date Title
CN106714062B (zh) 一种基于bp人工神经网络的数字助听器智能验配方法
CN111651722A (zh) 一种针对广告主广告投放效果的风险评估方法及平台
CN103699626A (zh) 一种微博用户个性化情感倾向分析方法及系统
CN102750320B (zh) 一种网络视频实时关注度的计算方法、装置和系统
CN107424614A (zh) 一种声纹模型更新方法
CN101908055B (zh) 一种信息过滤系统
Amoah et al. Barriers to the green retrofitting of existing residential buildings
CN110516057A (zh) 一种信访问题答复方法及装置
Zheng et al. Impacts on human development index due to combinations of renewables and ICTs--new evidence from 26 countries
CN111523433B (zh) 快件末端地址的标准化处理方法、装置和设备
CN112580937A (zh) 一种基于能源结构分析的城市能源发展监测方法
Rahman Impact of rural infrastructure on farm and non-farm enterprise choice and income in Bangladesh
CN111192602A (zh) 一种基于音频内容画像系统的白噪音音频内容价值评估方法
Barten et al. Short‐stature maize reduced wind damage during the 2020 midwestern derecho, improving yields and greenhouse gas outcomes
Wen et al. Coal exploitation and income inequality: Testing the resource curse with econometric analyses of household survey data from northwestern China
CN108093417A (zh) 一种基于基站分布密度自适应的基站位置纠偏方法
CN110909202A (zh) 音频价值评估方法、装置及可读存储介质
CN1556522A (zh) 电话信道说话人声纹识别系统
CN115994590A (zh) 基于分布式集群的数据处理方法、系统、设备及存储介质
CN105554326A (zh) 降低ivr系统的菜单选择时长的方法
Matthews et al. Technological differences in South African sheep production: a stochastic meta-frontier analysis
CN113793600A (zh) 语音识别方法、装置、设备及存储介质
CN111078935A (zh) 一种基于跨领域推荐思想的声音直播主播价值评定方法
Lin et al. A DEA-Based Performance Evaluation of Ecological Land Development of Cities.
CN111369005A (zh) 众包标记系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200522

RJ01 Rejection of invention patent application after publication