CN117319576A - 一种基于全媒体多维数据融合的电视节目提质系统和方法 - Google Patents

一种基于全媒体多维数据融合的电视节目提质系统和方法 Download PDF

Info

Publication number
CN117319576A
CN117319576A CN202311247864.9A CN202311247864A CN117319576A CN 117319576 A CN117319576 A CN 117319576A CN 202311247864 A CN202311247864 A CN 202311247864A CN 117319576 A CN117319576 A CN 117319576A
Authority
CN
China
Prior art keywords
program
data
heat
artist
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311247864.9A
Other languages
English (en)
Inventor
朱甲雄
傅婷婷
鲜沁雨
倪超
龚昊
陆盈嘉
汤振华
叶灵
张亦弛
赵明汉
潘宁宁
王丹彤
章丽兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Radio and Television Group of Zhejiang
Original Assignee
Radio and Television Group of Zhejiang
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Radio and Television Group of Zhejiang filed Critical Radio and Television Group of Zhejiang
Priority to CN202311247864.9A priority Critical patent/CN117319576A/zh
Publication of CN117319576A publication Critical patent/CN117319576A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects

Abstract

本发明公开了一种基于全媒体多维数据融合的电视节目提质系统和方法,属于全媒体制作传播领域,该系统包括节目孵化模块、全媒体数据采集处理分析模块、播后数据反馈模块和节目制作辅助模块。该方法的核心为全媒体多维数据融合,采集节目孵化、制作和宣推的全流程数据,通过多维度融合热度、节目精彩片段、节目热门时刻、艺人热度正负极性、节目受众等数据分析反馈,形成节目质量看板,动态调整节目内容,辅助节目制作剪辑,提升节目整体播出质量。同时,本发明还进一步构建包含节目、艺人等标签体系,根据标签属性如节目热度、艺人热度等,智能化预测爆款素材并推送到发布库,实现数据预测引导宣发流程,增强节目宣传效果。

Description

一种基于全媒体多维数据融合的电视节目提质系统和方法
技术领域
本发明涉及全媒体制作传播领域,更为具体的,涉及一种基于全媒体多维数据融合的电视节目提质系统和方法。
背景技术
随着信息高速发展,新媒体快速崛起,电商、两微一端等新兴产业正在不断与传统媒体抢夺市场资源。传统电视节目制作周期长、成本高,存在船大难掉头等问题。且面对目标受众在不断被细分、切割等新媒体带来的冲击,因自身的技术手段不足,无法追踪溯源。传统电视节目受播出时间限制、观看沟通交流互动性差,无法感知节目忠实用户的喜好和数据,在利用新兴技术,人工智能技术、大数据技术、音视频技术、云计算技术等,采集多源异构的节目与艺人数据、弹幕数据等,反哺节目制作生产上,也与新媒体存在差距。构建和完成基于全媒体多维数据融合的电视节目提质系统和方法,面临着改革和挑战。
上述的现有节目生产在实际业务场景下,存在以下技术问题:
(1)制作流程割裂,无法追踪溯源:节目制作流程相互独立,缺乏提案、制作、播出、反馈全生命周期管理,提案阶段无法关联艺人和历史节目数据,播出阶段无法留存艺人和节目的全媒体数据,反馈阶段无法回流分析节目质量,流程可能存在繁琐的环节和冗余的步骤,导致制作周期较长、成本较高,并且可能出现信息传递和沟通不畅的情况。
(2)“互动感弱”,“体验不佳”:传统的电视节目往往只是单向传递信息给观众,观众无法积极参与节目内容的创作和决策过程。缺乏互动性使得观众的参与感和体验感较弱,无法真正融入到节目中。而播出内容质量、剧情脚本、艺人讨论度、CP设置等与受众喜好存在偏差的情况下,这些问题可能导致观众的兴趣下降和观看体验不佳。
(3)数据分析能力不够,无法指导节目制作:传统节目制作生产方式中生产、播出、反馈脱节,无法形成闭环,实现全流程数据存储分析引用;缺乏通过全媒体多维数据融合贯穿整个节目生产播出以提升节目质量的能力。
(4)节目质量度量体系不完善:现有的节目质量评价往往依赖于主观的意见,缺乏科学的标准和量化的指标,难以客观评估和提升节目的质量。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于全媒体多维数据融合的电视节目提质系统和方法,提升了节目整体播出质量,增强了节目宣传效果。
本发明的目的是通过以下方案实现的:
一种基于全媒体多维数据融合的电视节目提质系统,包括节目孵化模块、全媒体数据采集处理分析模块、播后数据反馈模块和节目制作辅助模块;所述节目孵化模块用于对数据资源进行统一标签化管理,在节目孵化时通过选择特定标签组合获取推荐的最佳组合;所述全媒体数据采集处理分析模块用于抓取和处理全网相关数据;所述播后数据反馈模块用于基于数据分析,以设计节目和艺人热度正负极性、节目热门时刻、节目精彩片段和节目受众分组功能;所述节目制作辅助模块用于根据多维度融合节目和艺人热度正负极性、节目热门时刻、节目精彩片段和节目受众分析指标,构建节目质量看板,并通过查看艺人极性,进行节目制作辅助决策以及选择标签匹配节目精彩片段,预测节目爆款内容。
进一步地,所述数据资源包括模式库、提案库和艺人库。
进一步地,所述全网相关数据包括正文清洗和格式化、文本去重、关键词提取、智能标签识别、实体识别和依存句法分析处理后的数据;并且,所述全媒体数据采集处理分析模块执行如下流程:
1)基于应用、任务和抓取记录的三级粒度管理架构,针对每个目标网站配置或应用来配置多个相关任务,针对每个任务配置多个抓取记录;
2)利用采集到的节目、艺人在各站点的评论和互动数据进行清洗、过滤和分析,计算节目在各播放平台的权重,对不同权重的站点适配不同的抓取频率,确保采集到的数据具有讨论度和影响力。
进一步地,所述全媒体数据采集处理分析模块,执行如下流程:
基于大数据多模态建立热度模型,以热度为核心,围绕“节目播放”、“热搜”、“二次传播”和“互动指数”为考量维度,综合考量同一综剧各类指数平衡、自由综剧平衡和全国综剧平衡;在考量过程中,设计考量策略为各指标跨领域拉齐,具体包含正片和热搜热度标准化方法;其中,正片热度标准化方法为采集各平台样本预测最高热度,经平滑处理后归一化计算,获取热度相对值,并跨平台加权计算总热度;所述热搜热度标准化方法为计算节目和艺人的上榜质量分,基于排名得分、上榜时长和平台系数三个维度综合计算。
进一步地,所述播后数据反馈模块用于提供数据概况、热搜话题、相关资讯和评论弹幕功能;其中,数据概况功能支持对不同平台的数据进行汇总形成综合热度趋势、正片热度和热搜趋势;热搜话题功能支持对热搜话题内容、平台、上榜时间和最高排名进行筛选展示,并基于热度分析上榜和下榜原因;相关资讯功能支持对视频、图片、标题和摘要按照节目和艺人主题进行聚类分析展示;评论弹幕功能支持对弹幕时间戳与剧情集数起始时间和结束时间匹配,分集存储弹幕内容、弹幕热度、弹幕涉及艺人和CP数据,展示弹幕热度、话题和艺人词云。
进一步地,所述播后数据反馈模块用于用户一键生成榜单,查看多平台热搜;
其中,所述一键生成多平台榜单,具体按照如下方式实现:基于榜单网页在移动端浏览器视图的截图结果基础上,通过AI算法匹配相对应的热搜标题进行定位,在完成单个榜单的定位后,进行局部位置截图;然后,根据话题的上榜平台个数,按照动态布局规则即通过图块大小进行空间布局计算,将不同榜单内容按照权重填充要空白图片中,最终拼接成一张完整的多平台热搜结果拼图。
进一步地,所述节目制作辅助模块用于利用资源标签库累积的标签能力查找匹配用户需求的视频片段,通过其相关播后数据预测片段播出效果,给出相关建议,直接用于节目制作及宣发工作。
进一步地,所述节目制作辅助模块用于艺人热度极性分析,通过对弹幕、热搜、话题、提取弹幕ID、内容、用户名、时间戳、弹幕点赞数、热搜平台、排名、标题、评论数、点赞数,话题平台、标题和播放量,使用Transformer模型来判断极性,将艺人实体名称与艺人正负极性值关联。
一种基于全媒体多维数据融合的电视节目提质方法,基于如上任一项所述的基于全媒体多维数据融合的电视节目提质系统,包括运行如下步骤:
S1:当用户在节目孵化阶段登录系统,根据需要进入不同的模块;当选择进入节目孵化模块时,则进入节目孵化模块的提案库查看制作人员上报的节目提案,查看是否有合适的提案,若是,则发起艺人匹配推荐;若否,则进入节目模式库,查看国内外现有节目模式,寻找节目灵感,结合用户创意形成节目提案;
S2:发起艺人匹配,根据节目提案库中预设标签推荐相应艺人,调用资源标签库匹配艺人相关数据,搜索相关艺人的精彩片段、艺人热度正负极性和艺人热度指标,通过让用户随时查看精彩片段的话题、热搜和CP数据,为用户提供艺人选择依据及更多的节目灵感;
S3:当节目制作完成并在互联网平台播出后,由全媒体数据采集处理分析模块完成数据采集和数据分析;在数据采集阶段,通过配置不同的爬取策略定时采集和更新基础数据,包括内容数据、账号数据和平台数据,并对抓取到的数据进行处理,包括正文清洗和格式化、文本去重、关键词提取、智能标签识别、实体识别和依存句法分析处理,产出标准格式数据,包括官方账号粉丝数据、节目正片播放量、热搜排名、热搜时长、二次传播热度、图文咨询热度、互动指数热度、艺人人物自身热度、热搜热度和曝光度。
进一步地,在步骤S1中,所述根据需要进入不同的模块,具体还包括进入播后数据反馈模块、节目制作辅助模块和标签库模块;其中,进入播后数据反馈模块支持搜索节目和查看节目综合榜单,进入节目管理后台;进入节目制作辅助模块支持查看艺人极性和选择标签;进入标签库模块汇聚了节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,根据相关标签分类搜索查询;并且,在登录阶段通过设置不同的用户角色,包括管理员、普通用户和节目组用户,根据业务范围对用户角色进行模块的权限管控。
进一步地,在步骤S2中,所述预设标签具体是提案在新增时,选择相应的节目类别和节目标签信息,用于描述和标识节目内容的关键信息;匹配标签数据则是通过接口调用来查询资源标签库中该标签类聚数据;所述资源标签库是全媒体数据采集处理分析模块对采集到的节目、艺人数据进行处理分析后,根据标签类聚的数据资源;在匹配标签数据过程中,根据匹配模型计算出契合程度,形成艺人推荐排行。
进一步地,在步骤S3中,所述爬取策略包括深度优先遍历策略和宽度优先遍历策略两种方式,用户根据实际业务自行配置数据采集爬取策略;并且,利用所述爬取策略采集的数据范围包括:中长视频平台正片的播放量、热度、官方账号粉丝数据、评论和互动数据;以及短视频平台的二创数据;以及社交平台热搜热度及次数、艺人影响力、官方宣发数据;以及新闻网站的资讯数据。
进一步地,还包括步骤:
S4:当用户进入播后数据反馈模块,搜索节目查看该节目是否已开启节目监测,若是,则点击该节目,查看节目数据概况、热搜话题、相关咨询和评论弹幕信息;若否,则手动添加到节目监测任务队列,搜索节目相关信息,包括节目基础信息、艺人和节目关键词,存入任务队列并持续监测该节目相关数据;
在步骤S4中,当有节目在互联网播后时,搜集该节目基础数据,当用户搜索节目时,匹配节目基础数据库,进行节目名称关键词匹配,选择相应词条后,查看包括节目名称、播出平台、导演和主演在内的基础数据,若启动节目监测,则根据监测规则抓取更多有价值的节目数据。
进一步地,还包括步骤:
S5:当用户搜索节目名称,则反馈监测任务列表查询结果,对已启动监测的节目,调用节目查询接口返回节目相关信息,包括数据概况功能、热搜话题功能、相关资讯功能和评论弹幕功能;同时,调用艺人查询接口,返回艺人相关信息,包括艺人热度、正负极性和艺人CP数据;
在步骤S5中,所述数据概况功能,能够支持对不同平台的数据进行汇总形成综合热度趋势、正片热度和热搜趋势;首页支持按照年度、季度、月度和日榜维度计算累计热度、最新热度、最高热度,并可视化展示;榜单内容包括节目名称、上榜时长、上榜次数以及上榜原因;点击节目名称,进入二级详情页面,展示热度趋势和热度次数;能够统计某个时间段内的各平台上的综合热度、正片播放热度、热搜热度、短视频二次传播、图文资讯和互动趋势图;点击图上坐标,能够查看该时间点对应值,并下钻统计数据计算来源;也能够支持统计包括微博、微信、抖音、头条、知乎、爱奇艺、腾讯、优酷、腾讯新闻、百度新闻、网易新闻和新浪新闻在内的不同渠道热搜次数;用户能够设置重点节目、重点渠道、重点时间段,进行统计频率调整;
在热搜话题统计页面包括热搜话题监测、关键词预设和圈图、热搜图片导出、数据统计和分析共四个功能;
在热搜话题监测功能中,支持用户手动添加话题名称,并监测话题的上榜时间、排名和渠道;并且,系统能够定时更新数据,并进行排行展示,让用户了解热搜话题的动态变化;
在关键词预设和圈图功能中,允许用户预设关键词,以便快速筛选出相关的热搜话题;系统还设置有一键圈图功能,自动圈出与关键词匹配的热搜话题,方便用户进行拼接和导出;
在热搜图片导出功能中,用户能够根据需要,选择相应的节目和热搜话题,系统会根据用户的选择生成相应的热搜图片;
在数据统计和分析功能中,系统定期统计热搜话题的排名和渠道分布等数据,并进行分析,以便用户了解热搜话题的趋势和影响力;用户根据数据分析结果,调整关键词预设和圈图策略,以获取更好的效果;
所述相关资讯功能,具体包括如下处理过程:系统通过数据采集服务从各个发布平台获取节目相关的资讯,包括封面、标题、摘要、正文、发布日期、发布平台、发布作者、播放量和点赞量信息;对图文类资讯进行聚类分析,将标题和摘要按照节目和艺人主题进行分类,便于用户浏览和搜索;对视频类资讯进行逐帧分析,提取图像画面、文字和弹幕信息,并按照节目和艺人主题进行聚类展示;对资讯进行按播放量排序,展示统计时间段内最热门的资讯;根据节目类型,发布媒体进行分类,用户查看不同类型剧集的最新资讯;根据资讯与当前节目的匹配度,进行排序展示;同时,用户点击一键推送功能,选择感兴趣的资讯,以文本、视频和图片形式推送到内容库,作为二次创作素材使用;
在评论弹幕功能中,支持展示弹幕内容、弹幕热度、弹幕涉及的艺人和CP数据,提供弹幕热度、话题和艺人词云的可视化展示;用户通过系统了解各个剧情集数的弹幕热度排名、热门话题以及观众对节目和艺人的关注程度;
在艺人数据查看功能中,能够查看艺人热度、艺人正负极性值以及艺人CP。
进一步地,还包括步骤:
S6:当用户查看节目K线图时,系统根据各平台上采集的弹幕数据对节目热度进行评估;具体包括如下过程:首先,用户选择适合的时间片将整个节目划分为以时间片为单位的n个片段;对于每个时间片计算弹幕频次、前后热度关联值数据,根据这些数据计算每个时间片的热度值;最后,运用Savitzky-Golay滤波方法对生成的时间片热度值做平滑处理,减少噪音和突变,生成节目的热度K线图;用户在生成的K线图上拖动,查看K线图波峰时的节目片段,帮助用户快速找到节目的热点;在本步骤中,设后一个时间片中靠近间隔的弹幕对前一个时间片依然具有热度影响,使其参与前一个时间片热度计算,将这些弹幕对前一个时间片的影响进行加权处理,根据和时间间隔的时间差做指数衰减,用于保证离时间间隔较远的弹幕具有更小的影响力。
进一步地,还包括步骤:
S7:当用户查看热门片段时,系统根据步骤S6中生成的热度K线图提取热门片段,识别相关艺人、CP和场景,自动打标并保存到资源标签库;具体实现过程包括如下子步骤:
1)系统识别出热度K线图中的波峰,根据波峰前后K线图曲线斜率和曲率幅度判断出相关的热门片段;
2)对识别出的热门片段进行整理,两个热门片段间隔时长小于1min且间隔时长内热度指数均值不小于前后片段热度均值的50%,对热门片段进行合并;
3)对热门片段进行多模态处理,识别片段中的人脸、场景、弹幕和语音,并基于艺人、CP、场景和热门弹幕属性进行打标,保存到资源标签库。
进一步地,还包括步骤:
S8:当用户启用节目受众分组功能后,对收集到的弹幕数据进行清洗和预处理,去除无效或重复的弹幕,对弹幕文本进行分词,去除停用词和标点符号;使用Transformer模型判断弹幕极性,识别弹幕中的实体和关键词,通过极性分析、实体关联分析、关键词聚类和情感分布分析方式获取观众的总体倾向和看法,从而对受众按照节目、艺人和CP喜爱程度划分不同群组,形成受众分组标签,个性化宣发;其中,通过极性分析查看所有弹幕的正负面比例,确认观众对节目的整体态度;通过实体关联分析,统计实体、关键词极性联合出现的频率,查看实体在节目中的正负向;通过关键词聚类分析,通过将词云的方式展示弹幕的关键词,直观地反应节目受众的主要关注点;通过情感分布分析,结合K线图,拖动时间轴查看正负面情感趋势变化。
进一步地,还包括步骤:
S9:当用户启用查看艺人信息功能后,调用艺人查询接口,查看艺人热度、艺人正负极性和CP信息,并根据艺人的热度值、在播状态、正负极性指标,绘制艺人百科,展示当前艺人的热门程度、观众喜爱度和趋势变化。
进一步地,还包括步骤:
S10:系统管理员进入系统后台,对热门节目榜单以及热门艺人榜单评分系统进行修改,确保不会因为节目自身热度差异导致综合热度评分失真;其中,综合热度评分规则设计为:
节目综合热度=正片热度*正片系数+热搜热度*热搜系数+短视频热度*短视频系数+图文热度*图文系数+互动指数*互动系数;
艺人综合热度=人物自身热度*系数+热搜热度*热搜系数+短视频热度*短视频系数+互动指数*互动系数;
修改系数后,系统会在次日重新计算当日综合热度分;每日的节目热度以及艺人热度也会存入资源标签库中,以供后续进一步使用;并且,在处理不同平台同一个节目时,系统会使用多维度的数据融合计算模型由原始数据参照通过计算公式推导出标准的数值,用于衡量原始数据在其维度的相对表现。
进一步地,还包括步骤:
S11:当用户进入节目制作辅助模块后,根据艺人和节目标签组合查询,获取符合条件的节目数据,全方位了解节目播出后的数据情况、受众反馈情况和节目内容质量,为后期节目制作策划提供参考依据;其中,在选择艺人方面,用户在界面上点击艺人正负极性标签,以筛选出符合条件的艺人,若当前热度为正向,查看正向艺人热度和推荐热门片段,锁定艺人和热门内容;在选择CP方面,查看CP热度和推荐热门片段,锁定CP组合和热门内容;系统根据用户的查询结果,提供节目制作策划的参考依据。
进一步地,还包括步骤:
S12:若当前艺人热度为负向,用户发起违规艺人智能识别服务,包括图像识别、语音识别和文本分析,用于判断艺人是否存在违规行为,反馈智能识别结果,并进行人工审核,将识别结果存入标签库,作为后续查询和分析的依据;根据艺人的违规状态和识别结果的严重程度,系统设置相应预警功能,向后期制作人员发送提醒,以便在后续节目制作过程中注意相关违规问题。
进一步地,还包括步骤:
S13:当用户需要针对某个节目或艺人进行宣发时,通过输入关键词在资源标签库中快速找到相关的精彩片段;若该片段符合用户需求,用户直接使用该片段;若该片段部分符合,则通过该片段直接找到完整的节目资源,并通过之前生成的K线图锁定精彩片段并根据实际需求对片段进行裁剪;若该片段不符合用户需求,用户继续查看类似的片段推荐列表,或是进一步细化需求条件以找到用户满意的视频片段;其中,当用户根据搜索条件匹配到相应的片段时,系统会将搜索内容和片段关联起来,作为该搜索内容的优先推荐,用于提高系统的准确度;并且,该片段二次传播后系统通过获取其播放数据和用户评论信息,通过分析评论和热度进一步优化智能推荐能力。
进一步地,还包括步骤:
S14:在资源标签库汇聚节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,所述基础节目属性标签包括节目、艺人、节目热度、艺人热度、精彩片段、节目用户、节目CP、节目场景和节目用户受众信息,支持用户通过各种标签组合查询相关信息。
本发明的有益效果包括:
本发明通过全媒体多维数据融合,采集节目孵化、制作、宣推全流程数据,通过多维度融合热度、节目精彩片段、节目热门时刻、艺人热度正负极性、节目受众等数据分析反馈,形成节目质量看板,动态调整节目内容,辅助节目制作剪辑,提升节目整体播出质量。同时本发明还可以进一步构建包含节目、艺人、CP、热门画面、热门弹幕、艺人热度、节目热度等标签体系,根据标签属性如节目热度、艺人热度、艺人镜头占比、时长、CP镜头占比、时长等,智能化预测爆款素材并推送到发布库,实现数据预测引导宣发流程,增强节目宣传效果。
本发明解决了当前节目制作全流程各环节割裂、与用户“互动感弱”,“体验不佳”、数据分析能力不够、节目质量度量体系不完善的问题。
本发明打破节目提案、播出、反馈各环节数据独立、无法协作的壁垒,采集全媒体多维度数据,进行多维度融合热度、节目精彩片段、节目热门时刻、艺人热度正负极性、节目受众等数据分析,刻画节目质量看板,通过数据指导科学动态调整节目艺人时长、CP镜头时长、智能弹幕设置等,提升节目制作质量。同时本发明还可以进一步构建包含节目、艺人、CP、热门画面、热门弹幕、艺人热度、节目热度等标签体系,根据标签属性如节目热度、艺人热度、艺人镜头占比、时长、CP镜头占比、时长等,智能化预测爆款素材并推送到发布库,实现数据预测引导宣发流程,扩大节目宣传效果。
本发明通过采集节目孵化、制作和宣推全流程的数据,反哺节目生产宣传全流程,实现数字化策划、制作、宣传和质量评价闭环,从而达到提质创优的目的。系统构建了多维度融合热度、节目精彩片段、节目热门时刻、艺人热度正负极性、节目受众等分析模型,以及全局标签体系,支持查看节目和艺人热度值、弹幕、CP等指标并推荐内容,刻画节目质量看板,优化节目的制作和宣传策略,提升节目的质量和吸引力。同时,系统的数据分析和预测爆款节目、热度趋势功能可辅助节目制作团队决策,提高节目的播出效果和影响力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的全媒体多维数据融合的电视节目提质系统的总体业务逻辑;
图2为本发明实施例的全媒体多维数据融合的电视节目提质方法的整体流程图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
在本发明的一个较佳实施例中,提供了一种基于全媒体多维数据融合的电视节目提质方案,包括相应系统和方法。本实施例通过构建节目孵化、全媒体数据采集处理分析、数据反馈、节目制作辅助等模块,实现节目孵化、生产制作、播后数据分析、指导生产全链路闭环管理。
如图1所述,展示了一个实施例中全媒体多维数据融合的电视节目提质系统的总体业务逻辑,其包括节目生产制作播出、全媒体数据采集处理分析、资源标签库、节目精准提质四部分。下面分别对四部分的具体实现形式进行详细介绍。
(1)节目生产制作播出:该部分的功能分成节目孵化、播后数据反馈和节目制作辅助,以节目孵化及播后反馈指导为基准进行业务逻辑统一设计。节目孵化部分提供提案库和模式库资源,用户可进入模式库寻找节目灵感,结合自身创意,形成节目提案进行提案上报。对于提案,可一键发起艺人匹配,后台自动调用资源标签库中艺人相关信息进行智能匹配。节目制作完成并播出后,用户可搜索节目信息手动对其开启节目监测,通过全媒体数据采集处理模块抓取节目、艺人信息并进行处理分析,在节目播后数据反馈模块进行数据呈现。播后数据反馈模块可查看节目综合榜单、单个节目数据、节目热度K线图、节目精彩片段、节目受众分析、艺人热度情感极性分析等数据。通过数据指导科学动态调整节目艺人时长、CP镜头时长、智能弹幕设置等,提升节目制作质量,并进一步构建包含节目、艺人、CP、热门画面、热门弹幕、艺人热度、节目热度等标签体系,根据标签属性如节目热度、艺人热度、艺人镜头占比、时长、CP镜头占比、时长等,智能化预测爆款素材并推送到发布库,实现数据预测引导宣发流程,扩大节目宣传效果。
(2)全媒体数据采集处理分析:该部分主要用于数据的抓取、处理和分析。数据采集负责基础数据的采集和维护,基础数据包括内容数据和账号数据以及平台数据,基于定时任务模块,并通过配置不同平台的爬取策略,可以定时采集和更新基础数据。采集的方法包括埋点接入、用户导入等;采集的任务包括采集全网榜单数据、基础知识库、节目播放数据、社交账号数据、短视频数据、图文资讯数据等。数据处理包括数据更新、监控策略、数据清洗、数据转换、词法分析等,处理后的数据进入数据中心。
数据分析主要有节目热度计算、人物热度计算和弹幕分析这三部分。
节目热度计算是以数据中心为依托,以量化数据为呈现形态,以热度为核心,围绕“节目播放”、“热搜”、“二次传播”、“互动指数”等为主要考量维度,选取多项基础指标并持续优化指标权重,综合考量同一综剧各类指数平衡(如比较同一综艺、剧集的节目播放、热搜、二次传播、图文资讯、活动指数对比分析)、自有综剧平衡(卫视播放综艺、剧集的对比分析)、全国综剧平衡(如同全国所有播放的综艺、剧集的对比分析)。
人物热度计算是以数据中心为依托,以量化数据为呈现形态,以热度为核心,围绕“艺人/网红自身热度”、“热搜”、“曝光度”等为主要考量维度,选取多项基础指标并持续优化指标权重,综合考量艺人各类指数平衡(如比较艺人的热度指数对比分析)、网红热度(网红的带货能力对比分析)。
弹幕分析,以数据中心为依托,以内容和量化数据为呈现形态,围绕“弹幕极性”、“弹幕受众群组”、“弹幕热度”、“弹幕互动”等为主要考量维度,采集弹幕极性、弹幕热度、关联艺人和CP等数据,提供节目极性分析、艺人极性分析、弹幕受众分析、节目K线分析等,综合考量用户与节目艺人互动效果。
(3)资源标签库:该部分是电视节目生产制作过程中的重要组成部分,它是用于汇聚和管理各类资源数据的业务资源库。资源标签库充当着数据集中存储和标记的角色,通过对资源进行分类、标签化和索引化,方便用户在不同阶段快速查找和使用所需的素材、片段、音频、视频和图像等。节目孵化阶段,根据标签匹配模型计算出契合程度,形成艺人推荐排行。播后数据反馈阶段,根据节目热度、精彩片段、艺人热度、CP、节目受众等指标,进行相关查询。节目制作辅助阶段,提供艺人极性用于节目制作,预测爆款片段用于节目宣发。
(4)节目精准提质:该部分旨在全链路打通节目生命周期节目数据管理,获取节目孵化、播出、再制作全流程节目和艺人相关数据,包括节目热度、艺人热度、热搜热度、弹幕活跃度,实现数据统一管理和共享复用。通过数据指导生产,针对性地优化和改进节目内容,提高节目的质量和观众满意度。
从数据的视角,利用节目和艺人的相关数据,包括艺人的精彩片段、艺人热度正负极性、艺人热度、节目精彩片段、热门话题、热搜、CP、热门弹幕、弹幕受众分组等数据,可在节目不同阶段起到提质创优效果。
孵化阶段提供艺人匹配推荐和相关热门素材,为节目选人和制作提供发现功能。
播出阶段提供受众群组分析和情感分析,识别弹幕实体(艺人、CP、路人等角色)、极性,计算各分组留存率和转化率,优化后期节目的节奏,增加各群组的正向持续关注度,提高观众满意度。
播后辅助阶段,跟踪节目和艺人的热度、等相关数据,结合节目精彩片段、K线图、收视率等,纵向提供节目同期和往期数据对比分析,横向支持竞品分析,一方面可通过数据总结复盘当前节目的主要贡献艺人、片段和受众群组,为后续持续发力做准备,另一方面可通过数据预测爆款精品内容,为后期节目制作提供方向。
宣发阶段,提供热门视频索引,支持一键发布全平台热搜,包括排名、上榜时长、上榜原因,持续深化节目传播影响力。该阶段还支持再次采集播后数据,支撑二次传播,快速调整宣发方向和策略。
本实施例中,基于上述系统,本发明的全媒体多维数据融合的电视节目提质系统和方法的主要流程是用户单位通过全媒体多维数据融合的电视节目提质系统进行节目孵化、全媒体数据采集处理分析、播后数据反馈分析、节目制作辅助引导,达到节目精准提质的效果。
下面详细描述本发明的全媒体多维数据融合的电视节目提质系统业务流程管理方法具体步骤。如前所述,在该业务流程管理方法实现过程中,以节目提质为中心,专注节目孵化、播后数据分析和节目制作引导,在整个业务流程中抓取业务数据,对其进行处理分析,统一管理。
下面详细介绍本发明实施例的具体实现步骤,如图2所示,但需注意的是,下述步骤中,当前后没有明确的顺序描述时,在符合实现逻辑情况下,步骤顺序可以适当调整。
S1:当用户在节目孵化阶段登录系统,可优先进入节目孵化模块的提案库查看制作人员上报的节目提案,查看是否有合适的提案,若是,则发起艺人匹配推荐;若否,则进入节目模式库,查看国内外现有节目模式,寻找节目灵感,结合用户创意形成节目提案。
需要说明的是,用户登录全媒体多维数据融合的电视节目提质系统,可根据需要进入不同的模块,主要有节目孵化模块、播后数据反馈模块、节目制作辅助模块和标签库模块。节目孵化模块支持查看节目模式库和节目提案库;播后数据反馈模块支持搜索节目、查看节目综合榜单,进入节目管理后台;节目制作辅助模块支持查看艺人极性、选择标签;标签库模块汇聚了节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,可根据相关标签分类搜索查询。不同的使用场景下可以进入不同的模块进行操作,一般而言,系统可以设置不同的用户角色,例如管理员、普通用户、节目组用户等,根据业务范围对用户角色进行模块的权限管控。
S2:发起艺人匹配,根据节目提案库中预设标签自动推荐相应艺人,调用资源标签库自动匹配艺人相关数据,搜索相关艺人的精彩片段、艺人热度正负极性、艺人热度等指标,用户可以随时查看精彩片段的话题、热搜、CP等数据,为用户提供艺人选择依据及更多的节目灵感。
需要说明的是,节目提案库中预设标签是提案在新增时,会选择相应的节目类别、节目标签等信息,用来描述和标识节目内容的关键信息;匹配标签数据是通过接口调用查询资源标签库中该标签类聚数据;资源标签库是全媒体数据采集处理分析模块对采集到的节目、艺人数据进行处理分析后,根据标签类聚的数据资源。在匹配标签数据过程中,会根据匹配模型计算出契合程度,从而形成艺人推荐排行。一般而言,艺人推荐方式、查看艺人的精彩片段、艺人热度正负极性、艺人热度等信息的具体形式可以根据实际业务进行设计,并非本发明的重点,对此可不作限制。
S3:当节目制作完成并在互联网平台播出后,由全媒体数据采集处理分析模块完成数据采集和数据分析。数据采集阶段,通过配置不同的爬取策略定时采集和更新基础数据,包括内容数据、账号数据和平台数据,并对抓取到的数据进行处理,包括正文清洗和格式化、文本去重、关键词提取、智能标签识别、实体识别、依存句法分析等,产出标准格式数据,包括官方账号粉丝数据,节目正片播放量、热搜排名、热搜时长、二次传播热度、图文咨询热度、互动指数热度,艺人人物自身热度、热搜热度和曝光度等。
需要说明的是,节目制作包含但不限于策划、预算规划、制片准备、拍摄和录制、后期制作、审片和修正等步骤,节目可根据具体业务场景自行选择制作方式,此部分只作为节目生产流程衔接的一环,而非本发明重点,对此可不作限制。另外,数据采集的爬取策略有深度优先遍历策略和宽度优先遍历策略两种方式:深度优先遍历策略是指网络数据获取会从起始页开始,一个链接一个链接的跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接;宽度优先遍历策略是将新下载网页中发现的链接直接插入待抓取URL队列的末尾,也就是指网络数据获取会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。用户可根据实际业务自行配置数据采集爬取策略。数据的采集范围包含:中长视频平台正片的播放量、热度、官方账号粉丝数据、评论和弹幕等互动数据;短视频平台的二创数据;社交平台热搜热度及次数、艺人影响力、官方宣发数据;新闻网站的资讯数据等,较为全面地覆盖了有价值的数据范围及指标。
S4:当用户进入播后数据反馈模块,可以搜索节目查看该节目是否已开启节目监测,若是,则点击该节目,查看节目数据概况、热搜话题、相关咨询和评论弹幕等信息;若否,则手动添加到节目监测任务队列,自动搜索节目相关信息,包括节目基础信息、艺人、节目关键词等,存入任务队列并持续监测该节目相关数据。
需要说明的是,当有节目在互联网播后时,系统会自动搜集该节目基础数据,当用户搜索节目时,系统会匹配节目基础数据库,进行节目名称关键词匹配,选择相应词条后,可查看节目名称、播出平台、导演、主演等基础数据,若启动节目监测,系统则会根据监测规则抓取更多有价值的节目数据。另外,系统还开放了用户手动添加节目关键词的配置入口,能够更准确地匹配并抓取相关数据。
S5:当用户搜索节目名称,系统会反馈监测任务列表查询结果,对已启动监测的节目,调用节目查询接口返回节目相关信息,包括数据概况、热搜话题、相关资讯、评论弹幕等。同时,调用艺人查询接口,返回艺人相关信息,包括艺人热度、正负极性、艺人CP等。
(1)数据概况,支持对不同平台的数据进行汇总形成综合热度趋势、正片热度、热搜趋势等。首页支持按照年度、季度、月度、日榜等维度计算累计热度、最新热度、最高热度,并可视化展示。榜单内容包括节目名称、上榜时长、上榜次数以及上榜原因。点击节目名称,可进入二级详情页面,展示热度趋势和热度次数。可统计某个时间段内的,各平台上的综合热度、正片播放热度、热搜热度、短视频二次传播、图文资讯、互动趋势图。点击图上坐标,可查看该时间点对应值,并下钻统计数据计算来源。也支持统计微博、微信、抖音、头条、知乎、爱奇艺、腾讯、优酷、腾讯新闻、百度新闻、网易新闻、新浪新闻等不同渠道热搜次数。用户可设置重点节目、重点渠道、重点时间段,进行统计频率调整。
(2)热搜话题统计页面,包含热搜话题监测、关键词预设和圈图、热搜图片导出、数据统计和分析共四个功能。
热搜话题监测:支持用户手动添加话题名称,并监测话题的上榜时间、排名和渠道。系统会定时更新数据,并进行排行展示,让用户了解热搜话题的动态变化。
关键词预设和圈图功能:系统允许用户预设关键词,以便快速筛选出相关的热搜话题。系统还支持一键圈图功能,可以自动圈出与关键词匹配的热搜话题,方便用户进行拼接和导出。
热搜图片导出:用户可以根据需要,选择相应的节目和热搜话题,系统会根据用户的选择生成相应的热搜图片。这样既能满足宣发要求,又能满足节目广告引流的需求。
数据统计和分析:系统定期统计热搜话题的排名和渠道分布等数据,并进行分析,以便用户了解热搜话题的趋势和影响力。用户可以根据数据分析结果,调整关键词预设和圈图策略,以获取更好的效果。
(3)相关资讯,系统通过数据采集服务从各个发布平台获取节目相关的资讯,包括封面、标题、摘要、正文、发布日期、发布平台、发布作者、播放量、点赞量等信息。对图文类资讯进行聚类分析,将标题、摘要等按照节目和艺人主题进行分类,便于用户浏览和搜索。对视频类资讯进行逐帧分析,提取图像画面、文字和弹幕等信息,并按照节目和艺人主题进行聚类展示。为方便用户查看最热门的资讯,对资讯进行按播放量排序,展示统计时间段内最热门的资讯。根据节目类型(综艺类、新闻类、剧集类等),发布媒体(自媒体、省级媒体、中央媒体等)进行分类,用户可以查看不同类型剧集的最新资讯。根据资讯与当前节目的匹配度,进行排序展示。同时,用户可点击一键推送功能,选择感兴趣的资讯,以文本、视频、图片等形式推送到内容库,作为二次创作素材使用。
(4)评论弹幕,支持展示弹幕内容、弹幕热度、弹幕涉及的艺人和CP等数据,提供弹幕热度、话题和艺人词云等可视化展示。用户可以通过系统了解各个剧情集数的弹幕热度排名、热门话题以及观众对节目和艺人的关注程度。
(5)艺人数据查看,查看艺人热度、艺人正负极性值以及艺人CP。
S6:当用户查看节目K线图时,系统可根据各平台上采集的弹幕数据对节目热度进行评估。首先用户选择适合的时间片(如10s、30s等)将整个节目划分为以时间片为单位的n个片段。对于每个时间片计算弹幕频次、前后热度关联值等关键数据,根据这些数据计算每个时间片的热度值。最后运用Savitzky-Golay滤波方法对生成的时间片热度值做平滑处理,减少噪音和突变,生成节目的热度K线图。用户可在生成的K线图上拖动,查看K线图波峰时的节目片段,帮助用户快速找到节目的热点。
需要说明的是,在本步骤中,由于弹幕本身特性决定了其具有延迟性,可以认为后一个时间片中靠近间隔的弹幕对前一个时间片依然具有热度影响,参与前一个时间片热度计算。但与普通弹幕不同的是,这些弹幕对前一个时间片影响需要进行加权处理,根据和时间间隔的时间差做指数衰减,保证离时间间隔较远的弹幕具有更小的影响力。
S7:当用户查看热门片段时,系统会根据步骤S6中生成的热度K线图自动提取热门片段,识别相关艺人、CP和场景,自动打标并保存到资源标签库。其具体方法为:
(1)系统自动识别出热度K线图中的波峰,根据波峰前后K线图曲线斜率和曲率幅度判断出相关的热门片段;
(2)对识别出的热门片段进行整理,如果两个热门片段接近且中间无明显下降趋势,自动对热门片段进行合并;
(3)对热门片段进行多模态处理,识别片段中的人脸、场景、弹幕、语音等,并基于艺人、CP、场景、热门弹幕等属性进行打标,保存到资源标签库。
S8:当用户启用节目受众分组功能,对收集到的弹幕数据进行清洗和预处理,去除无效或重复的弹幕,对弹幕文本进行分词,去除停用词、标点符号等。使用Transformer模型判断弹幕极性(正负向),识别弹幕中的实体(艺人、角色、CP等)、关键词等,通过极性分析,实体关联分析,关键词聚类,情感分布分析等方式获取观众的总体倾向和看法。
通过极性分析,查看所有弹幕的正负面比例,确认观众对节目的整体态度。
通过实体关联分析,统计实体、关键词极性联合出现的频率,查看实体在节目中的正负向。
关键词聚类分析,通过将词云的方式展示弹幕的关键词,直观地反应节目受众的主要关注点。
情感分布分析,结合K线图,拖动时间轴查看正负面情感趋势变化。
通过上述分析,可对受众按照节目、艺人和CP喜爱程度划分不同群组,形成受众分组标签,个性化宣发。
S9:当用户启用查看艺人信息功能,调用艺人查询接口,可查看艺人热度、艺人正负极性、CP等信息,并根据艺人的热度值、在播状态、正负极性等指标,绘制艺人百科,展示当前艺人的热门程度、观众喜爱度和趋势变化。
点击艺人名称,可查看艺人正度极性、参演节目、在播状态、当前热度值、有关话题数量、排名、时长、有关弹幕。并支持查看该艺人关联的CP组合名。并支持查看艺人对应正片节目片段。
点击某个CP组合名称,可查看该CP当前热度值、有关话题数量、排名、时长、有关弹幕。并支持查看CP对应正片节目片段。
S10:系统管理员可进入系统后台,对热门节目榜单以及热门艺人榜单评分系统进行修改,确保不会因为节目自身热度差异导致综合热度评分失真。综合热度评分规则为:
节目综合热度=正片热度*正片系数+热搜热度*热搜系数+短视频热度*短视频系数+图文热度*图文系数+互动指数*互动系数;
艺人综合热度=人物自身热度*系数+热搜热度*热搜系数+短视频热度*短视频系数+互动指数*互动系数。
修改系数后,系统会在次日重新计算当日综合热度分。另外,每日的节目热度以及艺人热度也会存入资源标签库中,以供后续进一步使用。
需要说明的是,在处理不同平台同一个节目时,系统会使用多维度的数据融合计算模型由原始数据参照技术通过计算公式推导出标准的数值,用以衡量原始数据在其所述维度的相对表现,例如,某一个节目的综合热度为1000,系统会将这一数据和其他剧集/综艺常数进行比较,以确定其综合热度数的相对位置,进而转为其综合热度指数。其优势在于:
(1)既显示了绝对数据,也反应其所处的相对位置;
(2)标准化后,不同维度的指标之间可以相互比较;
(3)指标之间可以互相运算,从而得到综合考察的指标;
(4)同一指数不仅可以用于自身节目的跨期比较,也可用于全网的节目比较;
S11:当用户进入节目制作辅助模块,可根据艺人和节目标签组合查询,获取符合条件的节目数据,全方位了解节目播出后的数据情况、受众反馈情况、节目内容质量等,例如节目的收视率、网友评论、点赞、评论、分享等,为后期节目制作策划提供参考依据。
在选择艺人方面,用户可以在界面上点击艺人正负极性标签,以筛选出符合条件的艺人,若当前热度为正向,可查看正向艺人热度和推荐热门片段,锁定艺人和热门内容。在选择CP方面,可查看CP热度和推荐热门片段,锁定CP组合和热门内容。
系统根据用户的查询结果,提供节目制作策划的参考依据,例如推荐的艺人和CP组合、热门内容等。
S12:若当前艺人热度为负向,用户可发起违规艺人智能识别服务,包括图像识别、语音识别、文本分析等技术,判断艺人是否存在违规行为,反馈智能识别结果,包括违规、疑似违规、无违规类别,并进行人工审核(包括艺人信息、识别结果、审核状态等相关信息),将识别结果存入标签库,作为后续查询和分析的依据。
根据艺人的违规状态和识别结果的严重程度,系统可以提供预警功能,向后期制作人员发送提醒,以便他们在后续节目制作过程中注意相关违规问题。
S13:当用户需要针对某个节目或艺人进行宣发时,可以通过输入关键词在资源标签库快速找到相关的精彩片段。若该片段符合用户需求,用户可以直接使用该片段;若该片段部分符合,可以通过该片段直接找到完整的节目资源,并通过之前生成的K线图快速锁定精彩片段并根据实际需求对片段进行裁剪;若该片段不符合用户需求,用户可以继续查看类似的片段推荐列表,或是进一步细化需求条件以找到用户满意的视频片段。
需要说明的是,当用户根据搜索条件匹配到相应的片段时,系统会将搜索内容和片段关联起来,作为该搜索内容的优先推荐,提高系统的准确度。此外该片段二次传播后系统也能获取其播放数据和用户评论信息,通过分析评论和热度进一步优化智能推荐能力。
S14:资源标签库汇聚了节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,包括节目、艺人、节目热度、艺人热度、精彩片段、节目用户、节目CP、节目场景、节目用户受众等关键信息,支持用户通过各种标签组合查询相关的信息。
通过以上描述,本领域的技术人员可清楚了解到本发明的基本技术点。基于上述理解,本发明的技术方案以软件系统的形式体现出来。系统作为接入产品应用于新闻工作者日常使用的生产平台中,通过门户模块跳转进入的形式后台数据及软件自动运行,执行本发明的各个实施所述的方法。

Claims (23)

1.一种基于全媒体多维数据融合的电视节目提质系统,其特征在于,包括节目孵化模块、全媒体数据采集处理分析模块、播后数据反馈模块和节目制作辅助模块;
所述节目孵化模块用于对数据资源进行统一标签化管理,在节目孵化时通过选择特定标签组合获取推荐的最佳组合;
所述全媒体数据采集处理分析模块用于抓取和处理全网相关数据;
所述播后数据反馈模块用于基于数据分析,以设计节目和艺人热度正负极性、节目热门时刻、节目精彩片段和节目受众分组功能;
所述节目制作辅助模块用于根据多维度融合节目和艺人热度正负极性、节目热门时刻、节目精彩片段和节目受众分析指标,构建节目质量看板,并通过查看艺人极性,进行节目制作辅助决策以及选择标签匹配节目精彩片段,预测节目爆款内容。
2.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质系统,其特征在于,所述数据资源包括模式库、提案库和艺人库。
3.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质系统,其特征在于,所述全网相关数据包括正文清洗和格式化、文本去重、关键词提取、智能标签识别、实体识别和依存句法分析处理后的数据;并且,所述全媒体数据采集处理分析模块执行如下流程:
1)基于应用、任务和抓取记录的三级粒度管理架构,针对每个目标网站配置或应用来配置多个相关任务,针对每个任务配置多个抓取记录;
2)利用采集到的节目、艺人在各站点的评论和互动数据进行清洗、过滤和分析,计算节目在各播放平台的权重,对不同权重的站点适配不同的抓取频率,确保采集到的数据具有讨论度和影响力。
4.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质系统,其特征在于,所述全媒体数据采集处理分析模块,执行如下流程:
基于大数据多模态建立热度模型,以热度为核心,围绕“节目播放”、“热搜”、“二次传播”和“互动指数”为考量维度,综合考量同一综剧各类指数平衡、自由综剧平衡和全国综剧平衡;在考量过程中,设计考量策略为各指标跨领域拉齐,具体包含正片和热搜热度标准化方法;其中,正片热度标准化方法为采集各平台样本预测最高热度,经平滑处理后归一化计算,获取热度相对值,并跨平台加权计算总热度;所述热搜热度标准化方法为计算节目和艺人的上榜质量分,基于排名得分、上榜时长和平台系数三个维度综合计算。
5.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质系统,其特征在于,所述播后数据反馈模块用于提供数据概况、热搜话题、相关资讯和评论弹幕功能;其中,数据概况功能支持对不同平台的数据进行汇总形成综合热度趋势、正片热度和热搜趋势;热搜话题功能支持对热搜话题内容、平台、上榜时间和最高排名进行筛选展示,并基于热度分析上榜和下榜原因;相关资讯功能支持对视频、图片、标题和摘要按照节目和艺人主题进行聚类分析展示;评论弹幕功能支持对弹幕时间戳与剧情集数起始时间和结束时间匹配,分集存储弹幕内容、弹幕热度、弹幕涉及艺人和CP数据,展示弹幕热度、话题和艺人词云。
6.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质系统,其特征在于,所述播后数据反馈模块用于用户一键生成榜单,查看多平台热搜;
其中,所述一键生成多平台榜单,具体按照如下方式实现:基于榜单网页在移动端浏览器视图的截图结果基础上,通过AI算法匹配相对应的热搜标题进行定位,在完成单个榜单的定位后,进行局部位置截图;然后,根据话题的上榜平台个数,按照动态布局规则即通过图块大小进行空间布局计算,将不同榜单内容按照权重填充要空白图片中,最终拼接成一张完整的多平台热搜结果拼图。
7.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,所述节目制作辅助模块用于利用资源标签库累积的标签能力查找匹配用户需求的视频片段,通过其相关播后数据预测片段播出效果,给出相关建议,直接用于节目制作及宣发工作。
8.根据权利要求1所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,所述节目制作辅助模块用于艺人热度极性分析,通过对弹幕、热搜、话题、提取弹幕ID、内容、用户名、时间戳、弹幕点赞数、热搜平台、排名、标题、评论数、点赞数,话题平台、标题和播放量,使用Transformer模型来判断极性,将艺人实体名称与艺人正负极性值关联。
9.一种基于全媒体多维数据融合的电视节目提质方法,其特征在于,基于权利要求1~8任一项所述的基于全媒体多维数据融合的电视节目提质系统,包括运行如下步骤:
S1:当用户在节目孵化阶段登录系统,根据需要进入不同的模块;当选择进入节目孵化模块时,则进入节目孵化模块的提案库查看制作人员上报的节目提案,查看是否有合适的提案,若是,则发起艺人匹配推荐;若否,则进入节目模式库,查看国内外现有节目模式,寻找节目灵感,结合用户创意形成节目提案;
S2:发起艺人匹配,根据节目提案库中预设标签推荐相应艺人,调用资源标签库匹配艺人相关数据,搜索相关艺人的精彩片段、艺人热度正负极性和艺人热度指标,通过让用户随时查看精彩片段的话题、热搜和CP数据,为用户提供艺人选择依据及更多的节目灵感;
S3:当节目制作完成并在互联网平台播出后,由全媒体数据采集处理分析模块完成数据采集和数据分析;在数据采集阶段,通过配置不同的爬取策略定时采集和更新基础数据,包括内容数据、账号数据和平台数据,并对抓取到的数据进行处理,包括正文清洗和格式化、文本去重、关键词提取、智能标签识别、实体识别和依存句法分析处理,产出标准格式数据,包括官方账号粉丝数据、节目正片播放量、热搜排名、热搜时长、二次传播热度、图文咨询热度、互动指数热度、艺人人物自身热度、热搜热度和曝光度。
10.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,在步骤S1中,所述根据需要进入不同的模块,具体还包括进入播后数据反馈模块、节目制作辅助模块和标签库模块;其中,进入播后数据反馈模块支持搜索节目和查看节目综合榜单,进入节目管理后台;进入节目制作辅助模块支持查看艺人极性和选择标签;进入标签库模块汇聚了节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,根据相关标签分类搜索查询;并且,在登录阶段通过设置不同的用户角色,包括管理员、普通用户和节目组用户,根据业务范围对用户角色进行模块的权限管控。
11.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,在步骤S2中,所述预设标签具体是提案在新增时,选择相应的节目类别和节目标签信息,用于描述和标识节目内容的关键信息;匹配标签数据则是通过接口调用来查询资源标签库中该标签类聚数据;所述资源标签库是全媒体数据采集处理分析模块对采集到的节目、艺人数据进行处理分析后,根据标签类聚的数据资源;在匹配标签数据过程中,根据匹配模型计算出契合程度,形成艺人推荐排行。
12.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,在步骤S3中,所述爬取策略包括深度优先遍历策略和宽度优先遍历策略两种方式,用户根据实际业务自行配置数据采集爬取策略;并且,利用所述爬取策略采集的数据范围包括:中长视频平台正片的播放量、热度、官方账号粉丝数据、评论和互动数据;以及短视频平台的二创数据;以及社交平台热搜热度及次数、艺人影响力、官方宣发数据;以及新闻网站的资讯数据。
13.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S4:当用户进入播后数据反馈模块,搜索节目查看该节目是否已开启节目监测,若是,则点击该节目,查看节目数据概况、热搜话题、相关咨询和评论弹幕信息;若否,则手动添加到节目监测任务队列,搜索节目相关信息,包括节目基础信息、艺人和节目关键词,存入任务队列并持续监测该节目相关数据;
在步骤S4中,当有节目在互联网播后时,搜集该节目基础数据,当用户搜索节目时,匹配节目基础数据库,进行节目名称关键词匹配,选择相应词条后,查看包括节目名称、播出平台、导演和主演在内的基础数据,若启动节目监测,则根据监测规则抓取更多有价值的节目数据。
14.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S5:当用户搜索节目名称,则反馈监测任务列表查询结果,对已启动监测的节目,调用节目查询接口返回节目相关信息,包括数据概况功能、热搜话题功能、相关资讯功能和评论弹幕功能;同时,调用艺人查询接口,返回艺人相关信息,包括艺人热度、正负极性和艺人CP数据;
在步骤S5中,所述数据概况功能,能够支持对不同平台的数据进行汇总形成综合热度趋势、正片热度和热搜趋势;首页支持按照年度、季度、月度和日榜维度计算累计热度、最新热度、最高热度,并可视化展示;榜单内容包括节目名称、上榜时长、上榜次数以及上榜原因;点击节目名称,进入二级详情页面,展示热度趋势和热度次数;能够统计某个时间段内的各平台上的综合热度、正片播放热度、热搜热度、短视频二次传播、图文资讯和互动趋势图;点击图上坐标,能够查看该时间点对应值,并下钻统计数据计算来源;也能够支持统计包括微博、微信、抖音、头条、知乎、爱奇艺、腾讯、优酷、腾讯新闻、百度新闻、网易新闻和新浪新闻在内的不同渠道热搜次数;用户能够设置重点节目、重点渠道、重点时间段,进行统计频率调整;
在热搜话题统计页面包括热搜话题监测、关键词预设和圈图、热搜图片导出、数据统计和分析共四个功能;
在热搜话题监测功能中,支持用户手动添加话题名称,并监测话题的上榜时间、排名和渠道;并且,系统能够定时更新数据,并进行排行展示,让用户了解热搜话题的动态变化;
在关键词预设和圈图功能中,允许用户预设关键词,以便快速筛选出相关的热搜话题;系统还设置有一键圈图功能,自动圈出与关键词匹配的热搜话题,方便用户进行拼接和导出;
在热搜图片导出功能中,用户能够根据需要,选择相应的节目和热搜话题,系统会根据用户的选择生成相应的热搜图片;
在数据统计和分析功能中,系统定期统计热搜话题的排名和渠道分布等数据,并进行分析,以便用户了解热搜话题的趋势和影响力;用户根据数据分析结果,调整关键词预设和圈图策略,以获取更好的效果;
所述相关资讯功能,具体包括如下处理过程:系统通过数据采集服务从各个发布平台获取节目相关的资讯,包括封面、标题、摘要、正文、发布日期、发布平台、发布作者、播放量和点赞量信息;对图文类资讯进行聚类分析,将标题和摘要按照节目和艺人主题进行分类,便于用户浏览和搜索;对视频类资讯进行逐帧分析,提取图像画面、文字和弹幕信息,并按照节目和艺人主题进行聚类展示;对资讯进行按播放量排序,展示统计时间段内最热门的资讯;根据节目类型,发布媒体进行分类,用户查看不同类型剧集的最新资讯;根据资讯与当前节目的匹配度,进行排序展示;同时,用户点击一键推送功能,选择感兴趣的资讯,以文本、视频和图片形式推送到内容库,作为二次创作素材使用;
在评论弹幕功能中,支持展示弹幕内容、弹幕热度、弹幕涉及的艺人和CP数据,提供弹幕热度、话题和艺人词云的可视化展示;用户通过系统了解各个剧情集数的弹幕热度排名、热门话题以及观众对节目和艺人的关注程度;
在艺人数据查看功能中,能够查看艺人热度、艺人正负极性值以及艺人CP。
15.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S6:当用户查看节目K线图时,系统根据各平台上采集的弹幕数据对节目热度进行评估;具体包括如下过程:首先,用户选择适合的时间片将整个节目划分为以时间片为单位的n个片段;对于每个时间片计算弹幕频次、前后热度关联值数据,根据这些数据计算每个时间片的热度值;最后,运用Savitzky-Golay滤波方法对生成的时间片热度值做平滑处理,减少噪音和突变,生成节目的热度K线图;用户在生成的K线图上拖动,查看K线图波峰时的节目片段,帮助用户快速找到节目的热点;在本步骤中,设后一个时间片中靠近间隔的弹幕对前一个时间片依然具有热度影响,使其参与前一个时间片热度计算,将这些弹幕对前一个时间片的影响进行加权处理,根据和时间间隔的时间差做指数衰减,用于保证离时间间隔较远的弹幕具有更小的影响力。
16.根据权利要求15所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S7:当用户查看热门片段时,系统根据步骤S6中生成的热度K线图提取热门片段,识别相关艺人、CP和场景,自动打标并保存到资源标签库;具体实现过程包括如下子步骤:
1)系统识别出热度K线图中的波峰,根据波峰前后K线图曲线斜率和曲率幅度判断出相关的热门片段;
2)对识别出的热门片段进行整理,两个热门片段间隔时长小于1min且间隔时长内热度指数均值不小于前后片段热度均值的50%,对热门片段进行合并;
3)对热门片段进行多模态处理,识别片段中的人脸、场景、弹幕和语音,并基于艺人、CP、场景和热门弹幕属性进行打标,保存到资源标签库。
17.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S8:当用户启用节目受众分组功能后,对收集到的弹幕数据进行清洗和预处理,去除无效或重复的弹幕,对弹幕文本进行分词,去除停用词和标点符号;使用Transformer模型判断弹幕极性,识别弹幕中的实体和关键词,通过极性分析、实体关联分析、关键词聚类和情感分布分析方式获取观众的总体倾向和看法,从而对受众按照节目、艺人和CP喜爱程度划分不同群组,形成受众分组标签,个性化宣发;其中,通过极性分析查看所有弹幕的正负面比例,确认观众对节目的整体态度;通过实体关联分析,统计实体、关键词极性联合出现的频率,查看实体在节目中的正负向;通过关键词聚类分析,通过将词云的方式展示弹幕的关键词,直观地反应节目受众的主要关注点;通过情感分布分析,结合K线图,拖动时间轴查看正负面情感趋势变化。
18.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S9:当用户启用查看艺人信息功能后,调用艺人查询接口,查看艺人热度、艺人正负极性和CP信息,并根据艺人的热度值、在播状态、正负极性指标,绘制艺人百科,展示当前艺人的热门程度、观众喜爱度和趋势变化。
19.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S10:系统管理员进入系统后台,对热门节目榜单以及热门艺人榜单评分系统进行修改,确保不会因为节目自身热度差异导致综合热度评分失真;其中,综合热度评分规则设计为:
节目综合热度=正片热度*正片系数+热搜热度*热搜系数+短视频热度*短视频系数+图文热度*图文系数+互动指数*互动系数;
艺人综合热度=人物自身热度*系数+热搜热度*热搜系数+短视频热度*短视频系数+互动指数*互动系数;
修改系数后,系统会在次日重新计算当日综合热度分;每日的节目热度以及艺人热度也会存入资源标签库中,以供后续进一步使用;并且,在处理不同平台同一个节目时,系统会使用多维度的数据融合计算模型由原始数据参照通过计算公式推导出标准的数值,用于衡量原始数据在其维度的相对表现。
20.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S11:当用户进入节目制作辅助模块后,根据艺人和节目标签组合查询,获取符合条件的节目数据,全方位了解节目播出后的数据情况、受众反馈情况和节目内容质量,为后期节目制作策划提供参考依据;其中,在选择艺人方面,用户在界面上点击艺人正负极性标签,以筛选出符合条件的艺人,若当前热度为正向,查看正向艺人热度和推荐热门片段,锁定艺人和热门内容;在选择CP方面,查看CP热度和推荐热门片段,锁定CP组合和热门内容;系统根据用户的查询结果,提供节目制作策划的参考依据。
21.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S12:若当前艺人热度为负向,用户发起违规艺人智能识别服务,包括图像识别、语音识别和文本分析,用于判断艺人是否存在违规行为,反馈智能识别结果,并进行人工审核,将识别结果存入标签库,作为后续查询和分析的依据;根据艺人的违规状态和识别结果的严重程度,系统设置相应预警功能,向后期制作人员发送提醒,以便在后续节目制作过程中注意相关违规问题。
22.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S13:当用户需要针对某个节目或艺人进行宣发时,通过输入关键词在资源标签库中快速找到相关的精彩片段;若该片段符合用户需求,用户直接使用该片段;若该片段部分符合,则通过该片段直接找到完整的节目资源,并通过之前生成的K线图锁定精彩片段并根据实际需求对片段进行裁剪;若该片段不符合用户需求,用户继续查看类似的片段推荐列表,或是进一步细化需求条件以找到用户满意的视频片段;其中,当用户根据搜索条件匹配到相应的片段时,系统会将搜索内容和片段关联起来,作为该搜索内容的优先推荐,用于提高系统的准确度;并且,该片段二次传播后系统通过获取其播放数据和用户评论信息,通过分析评论和热度进一步优化智能推荐能力。
23.根据权利要求9所述的基于全媒体多维数据融合的电视节目提质方法,其特征在于,还包括步骤:
S14:在资源标签库汇聚节目孵化模块、播后数据反馈模块和节目制作辅助模块的基础节目属性标签,所述基础节目属性标签包括节目、艺人、节目热度、艺人热度、精彩片段、节目用户、节目CP、节目场景和节目用户受众信息,支持用户通过各种标签组合查询相关信息。
CN202311247864.9A 2023-09-26 2023-09-26 一种基于全媒体多维数据融合的电视节目提质系统和方法 Pending CN117319576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311247864.9A CN117319576A (zh) 2023-09-26 2023-09-26 一种基于全媒体多维数据融合的电视节目提质系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311247864.9A CN117319576A (zh) 2023-09-26 2023-09-26 一种基于全媒体多维数据融合的电视节目提质系统和方法

Publications (1)

Publication Number Publication Date
CN117319576A true CN117319576A (zh) 2023-12-29

Family

ID=89280556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311247864.9A Pending CN117319576A (zh) 2023-09-26 2023-09-26 一种基于全媒体多维数据融合的电视节目提质系统和方法

Country Status (1)

Country Link
CN (1) CN117319576A (zh)

Similar Documents

Publication Publication Date Title
US11709888B2 (en) User interface for viewing targeted segments of multimedia content based on time-based metadata search criteria
US11936953B2 (en) Recommending media programs based on media program popularity
Merialdo et al. Automatic construction of personalized TV news programs
US9253511B2 (en) Systems and methods for performing multi-modal video datastream segmentation
US7860872B2 (en) Automated media analysis and document management system
US7533399B2 (en) Programming guide content collection and recommendation system for viewing on a portable device
US8869205B2 (en) Method and system for video collection management, invalid video replacement and continuous video replay
US20140074866A1 (en) System and method for enhancing metadata in a video processing environment
US20030093794A1 (en) Method and system for personal information retrieval, update and presentation
US20040117405A1 (en) Relating media to information in a workflow system
CN104219575A (zh) 相关视频推荐方法及系统
KR101404585B1 (ko) 구간 작성 장치, 구간 작성 방법 및, 구간 작성 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
CN112348602B (zh) 一种基于大数据的广告自动化投放管理系统
JP2010536233A (ja) マルチメディアコンテンツの推薦キーワード生成システム及びその方法
US20170193531A1 (en) Intelligent Digital Media Content Creator Influence Assessment
CN101515267A (zh) 网络媒体智能编目系统
CN106604068B (zh) 一种更新媒体节目的方法及其系统
CN111931022A (zh) Ai热点内容智能编辑系统
CN109874032B (zh) 智能电视的节目专题个性化推荐系统与方法
CN117319576A (zh) 一种基于全媒体多维数据融合的电视节目提质系统和方法
US20090287677A1 (en) Streaming media instant answer on internet search result page
Messina et al. Creating rich metadata in the TV broadcast archives environment: The Prestospace project
Montagnuolo et al. Automatic Segmentation, Aggregation and Indexing of Multimodal News Information from Television and the Internet.
CN116017070B (zh) 基于运营策略提升电视主页点击率的方法
Kim et al. Ontology-based recommender system of TV programmes for personalisation service in smart TV

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination