CN110647654A - 基于音频内容画像的音频主播评级方法、系统及存储介质 - Google Patents

基于音频内容画像的音频主播评级方法、系统及存储介质 Download PDF

Info

Publication number
CN110647654A
CN110647654A CN201910765775.0A CN201910765775A CN110647654A CN 110647654 A CN110647654 A CN 110647654A CN 201910765775 A CN201910765775 A CN 201910765775A CN 110647654 A CN110647654 A CN 110647654A
Authority
CN
China
Prior art keywords
anchor
audio
program
audio content
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910765775.0A
Other languages
English (en)
Inventor
朱玉婷
杜睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Li Zhi Network Technology Co Ltd
Original Assignee
Guangzhou Li Zhi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Li Zhi Network Technology Co Ltd filed Critical Guangzhou Li Zhi Network Technology Co Ltd
Priority to CN201910765775.0A priority Critical patent/CN110647654A/zh
Publication of CN110647654A publication Critical patent/CN110647654A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2385Channel allocation; Bandwidth allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供一种基于音频内容画像的音频主播评级方法、系统及存储介质,构建主播画像系统,用以描述主播历史行为,及主播与音频内容之间的关系;基于主播画像系统,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法,完成音频内容价值评估。本发明能客观的评价主播的价值,自动的完成音频价值的评估。

Description

基于音频内容画像的音频主播评级方法、系统及存储介质
技术领域
本发明属于大数据领域,为AI人工智能方向,具体涉及一种基于音频内容画像的音频主播评级方法、系统及存储介质。
背景技术
随着互联网及移动互联网的高速发展,人们从互联网上获取信息的方式,逐渐从文字,转变为音频、视频。声音作为人类获取信息的主要方式之一,互联网上的音频内容越来越多,怎么从海量的音频信息中找到高价值的音频,以及对于音频价值的定义越来越重要。
现阶段,对于各个音频的价值,主要是通过人们的口碑传播,带有很大的主观性,不能很好的客观的反馈内容价值,并且效率很低。
对于音频产出者主播来说,主播擅长的内容相对稳定,在短期内生产内容的价值也相对稳定,如何通过人工智能客观的评价主播的价值,而且可以自动的完成音频价值的评估,节省大量人力是未来的发展趋势。
有鉴于此,本发明提供一种基于音频内容画像的音频主播评级方法、系统及存储介质,本案由此产生。
发明内容
本发明的目的在于提供一种基于音频内容画像的音频主播评级方法、系统及存储介质,以实现客观的评价主播的价值,自动的完成音频价值的评估。
为实现上述目的,本发明具体通过以下方案实现:
第一方面,一种基于音频内容画像的音频主播评级方法,所述方法包括:
构建主播画像系统,用以描述主播历史行为,及主播与音频内容之间的关系;
基于主播画像系统,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法,完成音频内容价值评估。
进一步,所述构建主播画像系统包括:
采集主播以及音频相关服务端操作日志;
基于采集到的日志,挖掘关键信息;
根据主播唯一标识,将挖掘好的信息,进行合并与聚类,形成主播画像系统。
进一步,所述关键信息包括:
主播上传音频的时间;
主播上传音频时定义的分类;
主播历史内容相关的点击信息、收听信息、点赞信息和转发信息。
进一步,模型输入为:前一个月该节目每天的点击率,收听时长,完播率,评论数;
模型输出为:输出为模型预测该节目第二天最佳流量分配方案。
进一步,所述模型算法公式如下:
K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]
第n天的整体收益的衡量:Dn为经归一化的第n天的点击率,Sn为经归一化的第n天的收听时长,Wn为经归一化的第n天的完播率,Pn为经归一化的第n天的评论数;
K=[k1,k2,k3,k4]K为四个指标相对于整体收益的权重,根据业务类型调整,所述归一化方法使用z-score方法。
进一步,算法学习过程:
一、在该主播上传过的节目中取上传超过k天的节目,把该主播上传过的每个节目生成一个节目特征序列,序列长度为k;k根据主播上传的节目数量定;序列中每个特征为[Dn,Sn,Wn,Pn];
二、以k为窗口大小生成特征序列训练数据;
原始序列数据:m为该节目上传后的天数,
D S W P
X11 X12 X13 X14
Xm1 Xm2 Xm4
序列特征向量:
Feature:
D S W P
X11 X12 X13 X14
Xm1 Xm2 Xm3 Xm4
Label:第m+1天的节目整体收益;
四、把序列训练数据经过rnn提取序列特征,生成一维特征向量,一维特征向量经dnn压缩为低维特征向量,低维特征向量经过sigmoid映射为节目分数;节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
四、根据sigmoid打分结果制定流量分配方案:把sigmoid的结果按照分段函数映射到m个rate,针对每种rate,人工制定流量分配方案。
第二方面,一种基于音频内容画像的音频主播评级系统,
构建主播画像系统模块,用以描述主播历史行为,及主播与音频内容之间的关系;
内容价值评估模块,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估;
流量分配方案模块,根据音频内容价值评估,输出第二天最佳流量分配方案。
第三方面,提供一种存储介质,所述存储介质上存储有基于音频内容画像的音频主播评级程序,音频主播评级程序被处理器执行时实现所述基于音频内容画像的音频主播评级方法的步骤。
本发明有益效果:通过构建主播画像系统,以及使用人工智能方法,基于主播历史内容价值,预测主播将来内容的价值,不光能够客观的评价主播的价值,而且可以自动话的完成音频价值的评估,节省大量人力。
附图说明
图1是根据一示例性实施例示出的一种基于音频内容画像的音频主播评级方法的流程图;
图2是根据一示例性实施例示出的主播画像系统构建的流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种基于音频内容画像的音频主播评级方法的流程图;如图1所示,
一种基于音频内容画像的音频主播评级方法,包括如下步骤:
步骤S100,构建主播画像系统,用以描述主播历史行为,及主播与音频内容之间的关系;
步骤S101,内容价值评估,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估;
步骤S102,流量分配方案,根据音频内容价值评估,输出第二天最佳流量分配方案。
其中,模型算法为平台每个主播训练一个节目价值评估模型,模型功能为预测主播某一个节目在第二天的价值。
模型输入为:前一个月该节目每天的点击率,收听时长,完播率,评论数。
模型输出为:输出为模型预测该节目第二天最佳流量分配方案,以保证第二天节目整体收益较预测当天不下跌的最高流量分配。
模型算法公式如下:
K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]
第n天的整体收益的衡量:Dn为经归一化的第n天的点击率,Sn为经归一化的第n天的收听时长,Wn为经归一化的第n天的完播率,Pn为经归一化的第n天的评论数;
K=[k1,k2,k3,k4]K为四个指标相对于整体收益的权重,根据业务类型调整,所述归一化方法使用z-score方法。
如图2所示,构建主播画像系统包括如下步骤:
步骤S200,采集主播以及音频相关服务端操作日志;
步骤S201,基于采集到的日志,采用数据挖掘的算法,挖掘关键信息;
步骤S202,根据主播唯一标识,将挖掘好的信息,进行合并与聚类,形成主播画像系统。
其中步骤S201中所述的关键信息包括:主播上传音频的时间;主播上传音频时定义的分类;主播历史内容相关的点击信息、收听信息、点赞信息和转发信息。
针对单个主播的算法训练流程如下:
一、在该主播上传过的节目中取上传超过k天的节目,把该主播上传过的每个节目生成一个节目特征序列,序列长度为k;k根据主播上传的节目数量定;序列中每个特征为[Dn,Sn,Wn,Pn];
二、以k为窗口大小生成特征序列训练数据;
原始序列数据:m为该节目上传后的天数,
D S W P
X11 X12 X13 X14
Xm1 Xm2 Xm4
序列特征向量:
Feature:
D S W P
X11 X12 X13 X14
Xm1 Xm2 Xm3 Xm4
Label:第m+1天的节目整体收益;
五、把序列训练数据经过rnn提取序列特征,生成一维特征向量,一维特征向量经dnn压缩为低维特征向量,低维特征向量经过sigmoid映射为节目分数;节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
四、根据sigmoid打分结果制定流量分配方案:把sigmoid的结果按照分段函数映射到m个rate,针对每种rate,人工制定流量分配方案。
在示例性实施例中,还提供了一种计算机可读存储介质,基于音频内容画像的音频主播评级程序存储在存储介质上,音频主播评级程序被处理器执行时实现所述基于音频内容画像的音频主播评级方法的步骤。
在示例性实施例中,还提供一种基于音频内容画像的音频主播评级程序系统,包括如下模块:
构建主播画像系统模块,用以描述主播历史行为,及主播与音频内容之间的关系;
内容价值评估模块,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估;
流量分配方案模块,根据音频内容价值评估,输出第二天最佳流量分配方案。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (9)

1.一种基于音频内容画像的音频主播评级方法,其特征在于,所述方法包括:
构建主播画像系统,用以描述主播历史行为,及主播与音频内容之间的关系;
基于主播画像系统,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法,完成音频内容价值评估。
2.根据权利要求1所述的一种基于音频内容画像的音频主播评级方法,其特征在于,所述构建主播画像系统包括:
采集主播以及音频相关服务端操作日志;
基于采集到的日志,挖掘关键信息;
根据主播唯一标识,将挖掘好的信息,进行合并与聚类,形成主播画像系统。
3.根据权利要求2所述的一种基于音频内容画像的音频主播评级方法,其特征在于,所述关键信息包括:
主播上传音频的时间;
主播上传音频时定义的分类;
主播历史内容相关的点击信息、收听信息、点赞信息和转发信息。
4.根据权利要求1所述的一种基于音频内容画像的音频主播评级方法,其特征在于:
模型输入为:前一个月该节目每天的点击率,收听时长,完播率,评论数;
模型输出为:输出为模型预测该节目第二天最佳流量分配方案。
5.根据权利要求4所述的一种基于音频内容画像的音频主播评级方法,其特征在于,所述模型算法公式如下:
K的转置*[(Dn–Dn-1)+(Sn–Sn-1)+(Wn–Wn-1)+(Pn–Pn-1)]
第n天的整体收益的衡量:Dn为经归一化的第n天的点击率,Sn为经归一化的第n天的收听时长,Wn为经归一化的第n天的完播率,Pn为经归一化的第n天的评论数;
K=[k1,k2,k3,k4]K为四个指标相对于整体收益的权重,根据业务类型调整。
6.根据权利要求5所述的一种基于音频内容画像的音频主播评级方法,其特征在于:所述归一化方法使用z-score方法。
7.根据权利要求5所述的一种基于音频内容画像的音频主播评级方法,其特征在于,算法学习过程:
一、在该主播上传过的节目中取上传超过k天的节目,把该主播上传过的每个节目生成一个节目特征序列,序列长度为k;k根据主播上传的节目数量定;序列中每个特征为[Dn,Sn,Wn,Pn];
二、以k为窗口大小生成特征序列训练数据;
原始序列数据:m为该节目上传后的天数,
D S W P X11 X12 X13 X14 Xm1 Xm2 Xm4
序列特征向量:
Feature:
D S W P X11 X12 X13 X14 Xm1 Xm2 Xm3 Xm4
Label:第m+1天的节目整体收益;
三、把序列训练数据经过rnn提取序列特征,生成一维特征向量,一维特征向量经dnn压缩为低维特征向量,低维特征向量经过sigmoid映射为节目分数;节目分数与真实label对比,计算损失函数值,反向传导优化模型权重;
四、根据sigmoid打分结果制定流量分配方案:把sigmoid的结果按照分段函数映射到m个rate,针对每种rate,人工制定流量分配方案。
8.一种基于音频内容画像的音频主播评级系统,其特征在于:
构建主播画像系统模块,用以描述主播历史行为,及主播与音频内容之间的关系;
内容价值评估模块,通过深度学习算法对主播历史上传的节目及音频内容价值构建模型算法并完成音频内容价值评估;
流量分配方案模块,根据音频内容价值评估,输出第二天最佳流量分配方案。
9.一种存储介质,其特征在于:所述存储介质上存储有基于音频内容画像的音频主播评级程序,音频主播评级程序被处理器执行时实现如权利要求1-7中任一项所述基于音频内容画像的音频主播评级方法的步骤。
CN201910765775.0A 2019-08-19 2019-08-19 基于音频内容画像的音频主播评级方法、系统及存储介质 Pending CN110647654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910765775.0A CN110647654A (zh) 2019-08-19 2019-08-19 基于音频内容画像的音频主播评级方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910765775.0A CN110647654A (zh) 2019-08-19 2019-08-19 基于音频内容画像的音频主播评级方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN110647654A true CN110647654A (zh) 2020-01-03

Family

ID=68990247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910765775.0A Pending CN110647654A (zh) 2019-08-19 2019-08-19 基于音频内容画像的音频主播评级方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN110647654A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077815A (zh) * 2021-03-29 2021-07-06 腾讯音乐娱乐科技(深圳)有限公司 一种音频评估方法及组件
CN113077815B (zh) * 2021-03-29 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频评估方法及组件

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106228977A (zh) * 2016-08-02 2016-12-14 合肥工业大学 基于深度学习的多模态融合的歌曲情感识别方法
WO2017016059A1 (zh) * 2015-07-24 2017-02-02 成都云堆移动信息技术有限公司 基于文本挖掘的互联网媒体用户属性分析方法
CN109040297A (zh) * 2018-08-30 2018-12-18 广州酷狗计算机科技有限公司 用户画像生成方法及装置
CN109151593A (zh) * 2018-09-30 2019-01-04 广州酷狗计算机科技有限公司 主播推荐方法、装置存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016059A1 (zh) * 2015-07-24 2017-02-02 成都云堆移动信息技术有限公司 基于文本挖掘的互联网媒体用户属性分析方法
CN106228977A (zh) * 2016-08-02 2016-12-14 合肥工业大学 基于深度学习的多模态融合的歌曲情感识别方法
CN109040297A (zh) * 2018-08-30 2018-12-18 广州酷狗计算机科技有限公司 用户画像生成方法及装置
CN109151593A (zh) * 2018-09-30 2019-01-04 广州酷狗计算机科技有限公司 主播推荐方法、装置存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077815A (zh) * 2021-03-29 2021-07-06 腾讯音乐娱乐科技(深圳)有限公司 一种音频评估方法及组件
CN113077815B (zh) * 2021-03-29 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频评估方法及组件

Similar Documents

Publication Publication Date Title
CN108596335B (zh) 一种基于深度强化学习的自适应众包方法
CN111651722B (zh) 一种针对广告主广告投放效果的风险评估方法及平台
WO2021081445A1 (en) System and method with federated learning model for geotemporal data associated medical prediction applications
CN111967971B (zh) 银行客户数据处理方法及装置
EP4239585A1 (en) Video loop recognition method and apparatus, computer device, and storage medium
CN112016773B (zh) 一种确定潜力主播的方法及装置
EP4135264A1 (en) Method and apparatus for predicting node state
CN110929127A (zh) 一种淘宝直播投放效果分析的方法及计算机设备
CN110415036B (zh) 用户等级的确定方法、装置、计算机设备和存储介质
CN105590240A (zh) 一种品牌广告效果优化的离散计算方法
WO2021208535A1 (zh) 基于自动特征分组的推荐方法及装置
CN113301376B (zh) 一种基于虚拟现实技术的直播交互方法及系统
CN110335083A (zh) 一种基于云平台的物价大数据分析系统及其方法
CN113313316A (zh) 预测数据的输出方法及装置、存储介质、电子设备
CN112445690B (zh) 信息获取方法、装置及电子设备
CN114024737A (zh) 确定直播间刷量的方法及装置
CN112785089A (zh) 坐席业务配置方法、装置、电子设备及存储介质
CN110647654A (zh) 基于音频内容画像的音频主播评级方法、系统及存储介质
CN110807369B (zh) 基于深度学习和注意力机制的短视频内容智能分类方法
CN111126714A (zh) 基于长租公寓租房场景下的退租预测系统及方法
CN116485237A (zh) 一种电力调控数据资产价值评估方法、系统、设备及介质
CN107944975A (zh) 创意产品大数据分析方法、装置、计算机设备及存储介质
CN112070564A (zh) 广告拉取方法、装置、系统与电子设备
CN113869565A (zh) 一种电力负荷预测方法、装置、终端设备及存储介质
CN112734142A (zh) 基于深度学习的资源学习路径规划方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200103