CN109104301A - 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统 - Google Patents

一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统 Download PDF

Info

Publication number
CN109104301A
CN109104301A CN201810794254.3A CN201810794254A CN109104301A CN 109104301 A CN109104301 A CN 109104301A CN 201810794254 A CN201810794254 A CN 201810794254A CN 109104301 A CN109104301 A CN 109104301A
Authority
CN
China
Prior art keywords
variety show
information
predicted
show
variety
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810794254.3A
Other languages
English (en)
Inventor
李首峰
李莉莉
孙立宏
陈放
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guozhengtong Technology Co ltd
Original Assignee
Guozhengtong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guozhengtong Technology Co ltd filed Critical Guozhengtong Technology Co ltd
Priority to CN201810794254.3A priority Critical patent/CN109104301A/zh
Publication of CN109104301A publication Critical patent/CN109104301A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于深度学习模型针对综艺节目进行网络热度预测的方法,首先训练生成网络热度预测模型,然后获取待预测综艺节目的特征信息并对待预测综艺节目的特征信息进行量化处理,将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果,获得最优的综艺节目推广发行信息参数。

Description

一种基于深度学习模型针对综艺节目进行网络热度预测的方 法和系统
技术领域
本发明涉及视频服务领域,并且更具体地,涉及一种基于深度学习为综艺节目的宣传发行进行预测,通过对综艺节目涉及的题材及人物方面的现有数据进行分析建模,为综艺节目的宣传、投资、播放时间、播放地点等进行预测。
背景技术
随着网络技术尤其是无线网络技术的快速发展,利用网络在线观看或者收听或者下载多媒体节目己经成为人们的一种娱乐方式,这里的视频节目可以包括综艺节目以及电影等。
发明人在实现本发明过程中发现,对于综艺节目的制作方或者发行方或者销售方或者基于网络的内容提供方等方面而言,针对综艺节目的网络热度是非常重要的,这可以帮助综艺节目的制作方或者发行方或者销售方或者基于网络的内容提供方等需求方提前采取相应的应对策略;然而,目前并不存在针对综艺节目进行网络热度预测的技术方案,更不存在利用深度学习模型针对综艺节目进行网络热度预测的技术方案,从而使发行方的网络热度预测需求得到满足。
发明内容
本发明的目的是提供一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统。
根据本发明的其中一个方面,提供一种基于深度学习模型针对综艺节目进行网络热度预测的方法,其特征在于包括以下步骤:
步骤1.获取样本对象的历史搜索量进行统计,并利用历史搜索量和量化后的特征信息进行训练生成网络热度预测模型,所述网络热度预测模型利用了深度神经网络技术,并且所述深度神经网络中包含多层限制玻尔兹曼机进行有限监督学习;
步骤2.获取待预测综艺节目的特征信息,通过接收外部输入信息的方式获取待预测综艺节目的特征信息,该待预测综艺节目的特征信息可以包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的一个或者多个;
步骤3.根据特征信息的量化处理获得预定对象的特征信息的量化值,利用待预测综艺节目的特征信息所对应的历史搜索量或者待预测综艺节目的特征信息所对应的收益信息来对待预测综艺节目的特征信息进行量化处理;
步骤4.将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果,获得最优的综艺节目推广发行信息参数。
根据本发明的另一个方面,还提供一种基于深度学习模型针对综艺节目进行网络热度预测的系统,其特征在于包括以下模块:
模型构建模块,获取样本对象的历史搜索量进行统计,并利用历史搜索量和量化后的特征信息进行训练生成网络热度预测模型,所述网络热度预测模型利用了深度神经网络技术,并且所述深度神经网络中包含多层限制玻尔兹曼机进行有限监督学习;
待测节目特征获取模块,获取待预测综艺节目的特征信息,通过接收外部输入信息的方式获取待预测综艺节目的特征信息,该待预测综艺节目的特征信息可以包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的一个或者多个;
特征信息量化模块.根据特征信息的量化处理获得预定对象的特征信息的量化值,利用待预测综艺节目的特征信息所对应的历史搜索量或者待预测综艺节目的特征信息所对应的收益信息来对待预测综艺节目的特征信息进行量化处理;
最优参数生成模块,将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果,获得最优的综艺节目推广发行信息参数。
与现有技术相比,本发明具有以下优点:1.本发明首次将深度学习模型用于对综艺节目的网络热度预测;2本发明通过对样本对象的历史搜索量进行统计,并利用历史搜索量和量化后的特征信息进行训练,使网络热度预测模型建立在网络基础数据的基础之上;这样,在利用网络热度预测模型对待预测综艺节目进行网络热度预测时,可以使预测结果与数据挖掘相结合,使预测结果更具有可信度。由此可知,本发明提供的技术方案在充分利用了网络基础数据的基础上,满足了需求方的网络热度的预测需求,使需求方可以根据预测出的网络热度提早采取相应的应对策略。
附图说明
图1为本发明的用于预测网络热度的方法的流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
图1为本实施例的用于预测网络热度的方法的流程图,下面对图1中的各步骤分别进行说明。
步骤1、获取待预测综艺节目的特征信息;
具体的,本实施例可以通过接收外部输入信息的方式获取待预测综艺节目的特征信息。
本实施例中的待预测综艺节目为网络中提供的内容,且待预测综艺节目通常为综艺节目,本实施例不限制待预测综艺节目的具体表现形式。
待预测综艺节目的特征信息是指用于描述待预测综艺节目的信息,利用特征信息通常可以唯一的表示出一个待预测综艺节目。
作为示例,在待预测综艺节目为综艺节目的情况下,该待预测综艺节目的特征信息可以包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的一个或者多个(通常为多个)。本实施例中的综艺节目名称可以包括综艺节目的正式名称以及综艺节目别名等;本实施例中的导演信息可以包括导演的真实姓名以及导演别名等,且导演的数量可以为一个或者多个;本实施例中的演员信息通常为主要演员的信息,且演员信息可以包括演员的真实姓名以及演员的艺名等,演员的数量可以为一个或者多个;本实施例中的制作公司可以包括制作公司的正式名称以及制作公司简称等,且制作公司的数量可以为一个或者多个。
本实施例中的综艺节目制作成本类型可以按照综艺节目的制作金额划分为国产中小成本、国产中成本、国产大制作、进口综艺节目中小成本、进口综艺节目中成本以及进口综艺节目大制作这六大类。
需要说明的是,上述待预测综艺节目的特征信息所包括的内容仅为举例,待预测综艺节目的特征信息也可以包括其他用于描述待预测综艺节目的信息,本实施例不限制待预测综艺节目的特征信息所包含的具体内容。
步骤2、根据特征信息的量化处理获得预定对象的特征信息的量化值。
具体的,本实施例应对待预测综艺节目的特征信息进行量化处理,量化处理的结果即为预定对象的特征信息的量化值。本实施例可以利用待预测综艺节目的特征信息所对应的历史搜索量或者待预测综艺节目的特征信息所对应的收益信息来对待预测综艺节目的特征信息进行量化处理。
可选地,本实施例中的预定时间段可以包括:待预测综艺节目上线(如综艺节目上映或者综艺节目正式播出等)前的第一时间段以及待预测综艺节目上线的第二时间段,例如,对于综艺节目而言,预定时间段可以为综艺节目上映前 13天至综艺节目上映后42天;当然本实施例中的预定时间段也可以仅包括待预测综艺节目上线后的第二时间段,且本实施例也不排除预定时间段仅包括待预测综艺节目上线前的第一时间段的可能性。
下面以待预测综艺节目为综艺节目为例,对本步骤中的量化处理进行详细说明。
作为示例,对待预测综艺节目的综艺节目名称进行量化处理的过程为:统计待预测综艺节目的综艺节目名称在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计该综艺节目的综艺节目名称在综艺节目上映之前的170天至该综艺节目上映前的30天的历史搜索量;这里的历史搜索量可以为该综艺节目的综艺节目名称在某一搜索网站中的历史搜索量,如该综艺节目的综艺节目名称在百度搜索网站中的历史搜索量总和;然后,计算该综艺节目的综艺节目名称的历史搜索量的自然对数,并将计算出的自然对数作为待预测综艺节目的综艺节目名称的量化值。
作为示例,对待预测综艺节目的导演信息进行量化处理的过程为:统计待预测综艺节目的导演信息在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计该综艺节目的导演信息在综艺节目上映之前的170天至该综艺节目上映前的30天的历史搜索量(在该综艺节目具有多名导演的情况下,该历史搜索量是各导演的历史搜索量之和);这里的历史搜索量可以为该综艺节目的导演信息在某搜索网站中的历史搜索量,如该综艺节目的导演信息在百度搜索网站中的历史搜索量总和;然后,计算该综艺节目的导演信息的历史搜索量的自然对数,并将计算出的自然对数作为待预测综艺节目的导演信息的量化值。
作为示例,对待预测综艺节目的演员信息进行量化处理的过程为:统计待预测综艺节目的演员信息在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计该综艺节目的演员信息在综艺节目上映之前的170天至该综艺节目上映前的30天的历史搜索量(在演员信息包括多名演员的情况下,该历史搜索量应该是多名演员分别对应的历史搜索量之和);这里的历史搜索量可以为该综艺节目的演员信息在某一搜索网站中的历史搜索量,例如,该综艺节目的演员信息在百度搜索网站中的历史搜索量总和;然后,计算该综艺节目的演员信息的历史搜索量的自然对数,并将计算出的自然对数作为待预测综艺节目的演员信息的量化值。
作为示例,对待预测综艺节目的制作公司进行量化处理的过程为:统计待预测综艺节目的制作公司在预测的预定时间段之前的第二预定时间范围内的收益信息,在待预测综艺节目具有多个制作公司的情况下,本实施例可以分别统计各制作公司在第二预定时间范围内的收益信息。
上述第二预定时间范围可以为自2010年至今等;然后,根据制作公司的收益信息计算制作公司的收益拉动力,如待预测综艺节目的第一制作公司在第二预定时间范围内一共制作了两部综艺节目,且第一部综艺节目的收益为A,第二部综艺节目的收益为B,第一部综艺节目具有两个制作公司,第二部综艺节目具有三个制作公司,则待预测综艺节目的第一制作公司的收益拉动力为二分之一A和三分之一B之和;本实施例可以将待预测综艺节目的各制作公司的收益拉动力之和作为待预测综艺节目的制作公司的量化值。
作为示例,对待预测综艺节目的综艺节目上映时间进行量化处理的过程为:本实施例可以将一年划分为多个上映档期,如划分为贺岁档期、五一档期、暑期档期、十一档期以及其他档期这五个档期,判断待预测综艺节目的综艺节目上映时间所属的档期,然后,统计在综艺节目上映时间所属的档期上映的各综艺节目在预定时间段内的历史搜索量,并计算各综艺节目的历史搜索量的平均值,将计算出的平均值作为待预测综艺节目的综艺节目上映时间的量化值;例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,如果待预测综艺节目的综艺节目上映时间属于五一档期,则查看所有样本对象在五一档期上映的综艺节目,并分别统计这些综艺节目在其上映之前的13天到其上映后的42天之间的网络热度,并计算这些综艺节目的网络热度的平均值,该平均值即为待预测综艺节目的综艺节目上映时间的量化值。
作为示例,对待预测综艺节目的综艺节目制作成本类型进行量化处理的过程为:本实施例可以根据综艺节目制作成本的多少将综艺节目划分为多种类型,如将综艺节目划分为国产中小成本、国产中成本、国产大制作、进口中小成本、进口中成本以及进口大制作这六大类;判断待预测综艺节目所属的综艺节目制作成本类型,然后,统计具有该综艺节目制作成本类型的各综艺节目在预定时间段内的历史搜索量,并计算各综艺节目的历史搜索量的平均值,将计算出的平均值作为待预测综艺节目的综艺节目制作成本类型的量化值;例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,如果待预测综艺节目属于国产中小成本的综艺节目,则查看所有样本对象中的所有国产中小成本的综艺节目在其上映之前的13天到其上映后的 42天之间的网络热度,并计算这些综艺节目的网络热度的平均值,该平均值即为待预测综艺节目的综艺节目上映时间的量化值。
在待预测综艺节目为综艺节目或者音乐专辑等其他内容时,待预测综艺节目的特征信息的量化处理过程可以参照上述综艺节目的特征信息的量化处理过程,在此不再一一详细说明。
步骤3、将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果。
具体的,本实施例中的用于预测网络热度的网络热度预测模型是利用多个样本数据训练获得的,且一个样本数据对应一个样本对象。用于模型训练的样本数据主要包括:样本对象在预定时间段内的历史搜索量以及样本对象的特征信息的量化值;其中的样本对象在预定时间段内的历史搜索量可以为样本对象的名称(如综艺节目名称)在某一搜索网站中的历史搜索量,如样本对象的名称 (如综艺节目名称)在预定时间段内在百度搜索网站中的历史搜索量总和。
本实施例中的样本对象通常与待预测综艺节目为同种类型的内容,如待预测综艺节目和样本对象同为综艺节目或者综艺节目或者音乐专辑等。另外,本实施例中的样本对象应为多个,且一个样本对象对应一个样本数据,本实施例不限制样本对象的数量以及具体内容等。
样本对象的特征信息是指用于描述样本对象的信息,利用特征信息通常可以唯一表示出一个样本对象。样本对象的特征信息和待预测综艺节目的特征信息通常包括相同类型的内容,如在待预测综艺节目和样本对象均为综艺节目的情况下,待预测综艺节目以及样本对象的特征信息通常都包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的至少一个。
样本对象的各特征信息所包含的具体内容如上述针对待预测综艺节目的特征信息的描述,在此不再重复说明。
下面以待预测综艺节目和样本对象均为综艺节目为例,对本步骤中的模型训练进行说明。
本实施例中的样本对象通常为具有一定影响力的综艺节目,这里的影响力可以通过综艺节目收益以及综艺节目历史搜索量来衡量,如样本对象可以为在第二预定时间范围内收益超过预定收益且历史搜索量超过预定搜索量的综艺节目,一个具体的例子,可以从2010年至今的所有综艺节目中选取收益超过预定收益且历史搜索量超过预定搜索量的综艺节目,被选取的综艺节目均被作为样本对象。
本实施例中的网络热度预测模型可以具体为利用多个样本数据对深度学习模型进行训练而获得的网络热度预测模型,将所述样本数据输入到深度神经网络进行有监督的训练学习,所述深度神经网络为多层限制玻尔兹曼机。当然,本实施例中的网络热度预测模型也可以利用样本数据对其它类型的学习机器进行训练而获得,例如利用样本数据对GBDT(Gradient Boosting Decision Tree,梯度提升决策树)进行训练,从而获得网络热度预测模型,再例如利用样本数据对 LR(Logistic Regression,逻辑回归)进行训练,从而获得网络热度预测模型。
在训练获得网络热度预测模型的过程中,需要使用样本对象的特征信息的量化值,因此,本实施例需要对样本对象的特征信息进行量化处理,量化处理的结果即为样本对象的特征信息的量化值。本实施例可以利用样本对象的特征信息所对应的历史搜索量或者样本对象的特征信息所对应的收益信息(如收益信息)来对样本对象的特征信息进行量化处理;这里的样本对象的特征信息所对应的历史搜索量是指特征信息在预定时间段之前的一段时间内的历史搜索量;这里的样本对象的特征信息所对应的收益信息(如收益信息)是指特征信息在预定时间段之前的一段时间内的收益信息。
作为示例,对某一个样本对象的综艺节目名称进行量化处理的过程为:统计样本对象的综艺节目名称在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计样本对象的综艺节目名称在综艺节目上映之前的170天至该综艺节目上映前的30天的历史搜索量;这里的历史搜索量可以为样本对象的综艺节目名称在某搜索网站中的历史搜索量,如样本对象的综艺节目名称在百度搜索网站中的历史搜索量总和;然后计算样本对象的综艺节目名称的历史搜索量的自然对数,并将计算出的自然对数作为该样本对象的综艺节目名称的量化值。
作为示例,对某一个样本对象的导演信息进行量化处理的过程为:统计样本对象的导演信息在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的 13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计样本对象的导演信息在样本对象上映之前的170天至该样本对象上映前的30 天的历史搜索量(在该样本对象具有多名导演的情况下,该历史搜索量是各导演的历史搜索量之和);这里的历史搜索量可以为该样本对象的导演信息在某搜索网站中的历史搜索量,如该样本对象的导演信息在百度搜索网站中的历史搜索量总和;然后,计算该样本对象的导演信息的历史搜索量的自然对数,并将计算出的自然对数作为样本对象的导演信息的量化值。
作为示例,对样本对象的演员信息进行量化处理的过程为:统计样本对象的演员信息在网络热度预测的预定时间段之前的第一预定时间范围内的历史搜索量(即历史搜索量总和),例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,本实施例可以统计该样本对象的演员信息在样本对象上映之前的170天至该样本对象上映前的30天的历史搜索量(在演员信息包括多名演员的情况下,该历史搜索量应该是多名演员分别对应的历史搜索量之和);这里的历史搜索量可以为该样本对象的演员信息在某一搜索网站中的历史搜索量,例如,该样本对象的演员信息在百度搜索网站中的历史搜索量总和;然后,计算该样本对象的演员信息的历史搜索量的自然对数,并将计算出的自然对数作为样本对象的演员信息的量化值。
作为示例,对样本对象的制作公司进行量化处理的过程为:统计样本对象的制作公司在预测的预定时间段之前的第二预定时间范围内的收益信息,在样本对象具有多个制作公司的情况下,本实施例可以分别统计各制作公司在第二预定时间范围内的收益信息;上述第二预定时间范围可以为自2010年至今等;然后,根据制作公司的收益信息计算制作公司的收益拉动力,如样本对象的第一制作公司在第二预定时间范围内一共制作了两部综艺节目,且第一部综艺节目的收益为A,第二部综艺节目的收益为B,第一部综艺节目具有两个制作公司,第二部综艺节目具有三个制作公司,则样本对象的第一制作公司的收益拉动力为二分之一A和三分之一B之和;本实施例可以将样本对象的各制作公司的收益拉动力之和作为样本对象的制作公司的量化值。
作为示例,对样本对象的综艺节目上映时间进行量化处理的过程为:判断样本对象的综艺节目上映时间所属的档期,然后,统计在样本对象上映时间所属的档期上映的各综艺节目在预定时间段内的历史搜索量,并计算各综艺节目的历史搜索量的平均值,将计算出的平均值作为样本对象的综艺节目上映时间的量化值;例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,如果样本对象的综艺节目上映时间属于五一档期,则查看所有样本对象中所有在五一档期上映的综艺节目,并分别统计这些综艺节目在其上映之前的13天到其上映后的42天之间的网络热度,并计算这些综艺节目的网络热度的平均值,该平均值即为样本对象的综艺节目上映时间的量化值。
作为示例,对待预测综艺节目的综艺节目制作成本类型进行量化处理的过程为:本实施例可以根据综艺节目制作成本的多少将综艺节目划分为多种类型,如将综艺节目划分为国产中小成本、国产中成本、国产大制作、进口音乐专辑中小成本、进口音乐专辑中成本以及进口音乐专辑大制作这六大类;判断待预测综艺节目所属的综艺节目制作成本类型,然后,统计具有该综艺节目制作成本类型的各综艺节目在预定时间段内的历史搜索量,并计算各综艺节目的历史搜索量的平均值,将计算出的平均值作为待预测综艺节目的综艺节目制作成本类型的量化值;例如,在本实施例预测综艺节目上映之前的13天到综艺节目上映后的42天之间的网络热度的情况下,如果待预测综艺节目属于国产中小成本的综艺节目,则查看自2010年至今的国产中小成本的综艺节目在其上映之前的 13天到其上映后的42天之间的网络热度,并计算这些综艺节目的网络热度的平均值,该平均值即为待预测综艺节目的综艺节目上映时间的量化值。
在进行网络热度预测模型的训练时,可以将每一个样本对象在预定时间段内的历史搜索量以及各量化值均作为输入信息,其中的各量化值为自变量,而样本对象在预定时间段内的历史搜索量历史搜索量为因变量;为了保持输入信息在格式上的一致性等原因,在利用该网络热度预测模型对待预测综艺节目的网络热度进行预测时,同样可以将待预测综艺节目在预定时间段内的历史搜索量以及各量化值均作为输入信息提供给网络热度预测模型,然而,其中的待预测综艺节目在预定时间段内的历史搜索量可以设置为缺省值或者无意义数值或者任意值等,从而使输入信息与训练时的输入信息在格式上相同;该模型输出的信息为预测出的待预测综艺节目的网络热度。
对于本领域技术人员而言,显然,本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一方面来看,均应该将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明来限定,因此,旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应该将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一以及第二等词语用来表示名称,而并不表示任何特定顺序。
虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,以上示例仅为说明本发明而非限制性目的,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。

Claims (5)

1.一种基于深度学习模型针对综艺节目进行网络热度预测的方法,其特征在于包括以下步骤:
步骤1.获取样本对象的历史搜索量进行统计,并利用历史搜索量和量化后的特征信息进行训练生成网络热度预测模型,所述网络热度预测模型利用了深度神经网络技术,并且所述深度神经网络中包含多层限制玻尔兹曼机进行有限监督学习;
步骤2.获取待预测综艺节目的特征信息,通过接收外部输入信息的方式获取待预测综艺节目的特征信息,该待预测综艺节目的特征信息可以包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的一个或者多个;
步骤3.根据特征信息的量化处理获得预定对象的特征信息的量化值,利用待预测综艺节目的特征信息所对应的历史搜索量或者待预测综艺节目的特征信息所对应的收益信息来对待预测综艺节目的特征信息进行量化处理;
步骤4.将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果,获得最优的综艺节目推广发行信息参数。
2.根据权利要求1所述的网络热度预测的方法,其特征在于,所述步骤1中的深度神经网络中为含有多层限制玻尔兹曼机的深度置信网,网络的第一层特征信息为:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型;第二层为SVM层;第三层为限制玻尔兹曼机层,其中第一、二、三层之间形成全连接进行信息反馈;第四层为最终的输出层,获得最佳播放时间段、最佳上映频道参数信息。
3.一种基于深度学习模型针对综艺节目进行网络热度预测的系统,其特征在于包括以下模块:
模型构建模块,获取样本对象的历史搜索量进行统计,并利用历史搜索量和量化后的特征信息进行训练生成网络热度预测模型,所述网络热度预测模型利用了深度神经网络技术,并且所述深度神经网络中包含多层限制玻尔兹曼机进行有限监督学习;
待测节目特征获取模块,获取待预测综艺节目的特征信息,通过接收外部输入信息的方式获取待预测综艺节目的特征信息,该待预测综艺节目的特征信息可以包括:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型中的一个或者多个;
特征信息量化模块.根据特征信息的量化处理获得预定对象的特征信息的量化值,利用待预测综艺节目的特征信息所对应的历史搜索量或者待预测综艺节目的特征信息所对应的收益信息来对待预测综艺节目的特征信息进行量化处理;
最优参数生成模块,将待预测综艺节目的特征信息的量化值作为输入信息提供给网络热度预测模型,并将网络热度预测模型的输出信息作为待预测综艺节目在预定时间段内的网络热度预测结果,获得最优的综艺节目推广发行信息参数。
4.根据权利要求1所述的网络热度预测的系统,其特征在于,所述模型构建模块中的深度神经网络中为含有多层限制玻尔兹曼机的深度置信网,网络的第一层特征信息为:综艺节目名称、导演信息、演员信息、制作公司、综艺节目上映时间以及综艺节目制作成本类型;第二层为SVM层;第三层为限制玻尔兹曼机层,其中第一、二、三层之间形成全连接进行信息反馈;第四层为最终的输出层,获得最佳播放时间段、最佳上映频道参数信息。
5.一种存储有指令的程序介质,其存储的程序指令能够实现如权利要求1-2所述的方法。
CN201810794254.3A 2018-07-19 2018-07-19 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统 Pending CN109104301A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810794254.3A CN109104301A (zh) 2018-07-19 2018-07-19 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810794254.3A CN109104301A (zh) 2018-07-19 2018-07-19 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统

Publications (1)

Publication Number Publication Date
CN109104301A true CN109104301A (zh) 2018-12-28

Family

ID=64846933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810794254.3A Pending CN109104301A (zh) 2018-07-19 2018-07-19 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统

Country Status (1)

Country Link
CN (1) CN109104301A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750728A (zh) * 2019-10-28 2020-02-04 精硕科技(北京)股份有限公司 一种浏览资源热度的预测方法、预测装置及可读存储介质
CN112015924A (zh) * 2019-05-31 2020-12-01 中国电信股份有限公司 流媒体缓存方法及其装置、计算机可存储介质
CN113657926A (zh) * 2021-07-28 2021-11-16 上海明略人工智能(集团)有限公司 一种广告效果预测方法、系统、电子设备及存储介质
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095414A (zh) * 2015-07-10 2015-11-25 百度在线网络技术(北京)有限公司 用于预测网络搜索量的方法和装置
US20150379135A1 (en) * 2013-12-18 2015-12-31 Yanqun Sun Search Engine Ranking Method Based on User Participation
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150379135A1 (en) * 2013-12-18 2015-12-31 Yanqun Sun Search Engine Ranking Method Based on User Participation
CN105095414A (zh) * 2015-07-10 2015-11-25 百度在线网络技术(北京)有限公司 用于预测网络搜索量的方法和装置
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015924A (zh) * 2019-05-31 2020-12-01 中国电信股份有限公司 流媒体缓存方法及其装置、计算机可存储介质
CN110750728A (zh) * 2019-10-28 2020-02-04 精硕科技(北京)股份有限公司 一种浏览资源热度的预测方法、预测装置及可读存储介质
CN113657926A (zh) * 2021-07-28 2021-11-16 上海明略人工智能(集团)有限公司 一种广告效果预测方法、系统、电子设备及存储介质
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备
CN116887001B (zh) * 2023-09-06 2023-12-15 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Watters et al. Decision‐making for ecosystem‐based management: evaluating options for a krill fishery with an ecosystem dynamics model
Ma et al. Estimating warehouse rental price using machine learning techniques
Schmidt Absorptive capacity—one size fits all? A firm‐level analysis of absorptive capacity for different kinds of knowledge
Giustolisi et al. Development of rehabilitation plans for water mains replacement considering risk and cost-benefit assessment
CN109104301A (zh) 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统
Yang A tale of two cities: Physical form and neighborhood satisfaction in metropolitan Portland and Charlotte
Côté et al. Comparison of stochastic optimization algorithms for hydropower reservoir operation with ensemble streamflow prediction
Zhang et al. Regionalization in the Yangtze River Delta, China, from the perspective of inter-city daily mobility
Liu et al. Key factors of project characteristics affecting project delivery system decision making in the Chinese construction industry: Case study using Chinese data based on rough set theory
Liu et al. Which owner characteristics are key factors affecting project delivery system decision making? Empirical analysis based on the rough set theory
Yoo Oil consumption and economic growth: evidence from Korea
CN110321291A (zh) 测试案例智能提取系统及方法
Nazarko et al. Sectoral foresight in Poland: thematic and methodological analysis
Mosconi et al. Institutional quality and innovation: evidence from Emilia-Romagna
Cid-López et al. A hybrid model for decision-making in the information and communications technology sector
Holden et al. Human judgment vs. quantitative models for the management of ecological resources
Ramkumar et al. A survey on mining multiple data sources
Geertman et al. Spatial‐temporal specific neighbourhood rules for cellular automata land‐use modelling
Tuyen et al. THE IMPACT OF LAND LOSS ON HOUSEHOLD INCOME: THE CASE OF HANOI'S SUB-URBAN AREAS, VIETNAM.
US20210383426A1 (en) Creating an effective product using an attribute solver
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
Costantiello et al. The regulatory quality in the light of environmental, social and governance framework at world level
Yu et al. Common set of weights in data envelopment analysis under prospect theory
Salehi et al. Assessment of the knowledge-based decisions in the field of urban water infrastructure in Iran and Brazil using nominal-based multi-criteria group decision method
Ünlüçay et al. Cumulative belief degrees approach for assessment of sustainable development

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181228