CN113158065A - 一种云合数据的弹幕抓取和分析系统 - Google Patents

一种云合数据的弹幕抓取和分析系统 Download PDF

Info

Publication number
CN113158065A
CN113158065A CN202110513634.7A CN202110513634A CN113158065A CN 113158065 A CN113158065 A CN 113158065A CN 202110513634 A CN202110513634 A CN 202110513634A CN 113158065 A CN113158065 A CN 113158065A
Authority
CN
China
Prior art keywords
video
module
bullet screen
barrage
bullet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110513634.7A
Other languages
English (en)
Inventor
刘浩
吴凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Two Bit Beijing Technology Co ltd
Original Assignee
Two Bit Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Two Bit Beijing Technology Co ltd filed Critical Two Bit Beijing Technology Co ltd
Priority to CN202110513634.7A priority Critical patent/CN113158065A/zh
Publication of CN113158065A publication Critical patent/CN113158065A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种云合数据的弹幕抓取和分析系统,包括后台控制模块,所述后台控制模块线连接有电视剧作品,其电视剧作品内设有弹幕模块,其中弹幕模块包括弹幕内容、弹幕数量以及弹幕展示时间点,所述弹幕总量数对接影视APP客户端,所述后台模块还连接有核对模块,所述核对模块与影视APP客户端线连接,本发明通过设置后台控制模块,抓取弹幕数量和弹幕内容,来分析该电视剧的受欢迎程度,从而对此电视剧进行分析,提高对电视剧的监控,同时也能提高怎么去改善电视剧,非常完善。

Description

一种云合数据的弹幕抓取和分析系统
技术领域
本发明涉及弹幕抓取系统技术领域,特别涉及一种云合数据的弹幕抓取和分析系统。
背景技术
电影,是由活动照相术和幻灯放映术结合发展起来的一种连续的影像画面,是一门视觉和听觉的现代艺术,也是一门可以容纳戏剧、摄影、绘画、动画、音乐、舞蹈、文字、雕塑、建筑等多种艺术的现代科技与艺术的综合体。
随着现在传媒行业的发展,影视作品已经越来越多了,而且现有的影视APP中在播放影视剧时,为了能够更加吸引观众,特地增加了弹幕功能能够让观众互动,而对于弹幕而言,除了一些聊天还有很多对电视剧的评价,其评价能够影响影视剧的收视率,因此需要一种可以抓取弹幕系统并且能够对其进行分析。
现有技术中缺乏一种完善对弹幕的抓取和分析系统,只能单纯的通过单集的查看,影响观影效果,直接导致观影量下降,因此需要一种云合数据的弹幕抓取和分析系统解决上述问题。
发明内容
本发明的目的在于提供一种云合数据的弹幕抓取和分析系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种云合数据的弹幕抓取和分析系统,包括后台控制模块,所述后台控制模块线连接有电视剧作品,其电视剧作品内设有弹幕模块,其中弹幕模块包括弹幕内容、弹幕数量以及弹幕展示时间点,所述弹幕总量数对接影视APP客户端,所述后台模块还连接有核对模块,所述核对模块与影视APP客户端线连接。
作为优选的,所述弹幕模块包括各大影视APP内的弹幕,其影视APP包括爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频,其中弹幕模块会抓取爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中的弹幕总量、弹幕内容和弹幕展示时间点,其中在爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中电视剧每集的弹幕数都会进入到弹幕模块内。
作为优选的,其后台控制模块还电连接有操作模块、显示模块、统计模块以及分析模块,其中操作模块用于对整个弹幕抓取系统进行操作、制取表格以及其他操作,显示模块用于显示每个对应影视APP中电视剧的弹幕内容、弹幕数量以及弹幕展示时间点,统计模块用于统计影视APP中的电视剧弹幕内容、弹幕数量以及弹幕展示时间点,所述分析模块用于分析统计模块统计的数据。
作为优选的,在显示模块中,其显示内容包括电视剧名称、弹幕大概总数、截止时间、弹幕具体总数、对应影视APP弹幕总数、对应剧集合集选项、对应每集标注、表格以及弹幕内容。
作为优选的,其核对模块与对应的影视APP爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频之间相互关联,其核对模块与弹幕模块相对应,用于接收器其爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频内的弹幕内容、弹幕数量和弹幕展示时间点,将核对模块与弹幕模块收集的弹幕内容、弹幕数量以及弹幕展示时间点同时发送至后台控制模块,然后进行核对,如果出现错误,后台显示模块就会提醒其错误,并立即修正,重新获取。
作为优选的,其影视APP包括分级弹幕数量抓取以及分集弹幕内容。
作为优选的,该弹幕抓取系统的方法如下:
S1:抓取各视频APP的弹幕具体为基于弹幕文本量大的特点,先对视频仅进行弹幕数量的初步抓取;
弹幕量大的视频进行分集文本抓取,减少持续抓取带来的风险;
S2:将同一电视剧的同一分集弹幕整合到一起具体为抓取结果结果进行初步去重处理后入库到h ive,便于后续分析处理对h ive中的弹幕进行分集和总集的聚合处理,对抓取存在问题的弹幕进行重新抓取;
S3:计算每分钟出现的弹幕热点话题以及弹幕总数具体为对聚合后的数据进行分析计算,得出弹幕热点内容和话题点,并且针对热点和话题点,进行重点宣传,加强剧集的播放和宣传效果。
本发明的有益效果为:
本发明通过设置后台控制模块,抓取弹幕数量和弹幕内容,来分析该电视剧的受欢迎程度,从而对此电视剧进行分析,提高对电视剧的监控,同时也能提高怎么去改善电视剧,追踪热点,辅助宣传来吸引观众,提升影视剧的播放效果非常完善。
附图说明
图1为本发明一种云合数据的弹幕抓取和分析系统的系统框图一;
图2为本发明一种云合数据的弹幕抓取和分析系统的系统框图二;
图3为本发明一种云合数据的弹幕抓取和分析系统的趋势图。
附图标记说明无。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1-3,本发明提供一种技术方案:
一种云合数据的弹幕抓取和分析系统,包括后台控制模块,所述后台控制模块线连接有电视剧作品,其电视剧作品内设有弹幕模块,其中弹幕模块包括弹幕内容、弹幕数量以及弹幕展示时间点,所述弹幕总量数对接影视APP客户端,所述后台模块还连接有核对模块,所述核对模块与影视APP客户端线连接。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,所述弹幕模块包括各大影视APP内的弹幕,其影视APP包括爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频,其中弹幕模块会抓取爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中的弹幕总量、弹幕内容和弹幕展示时间点,其中在爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中电视剧每集的弹幕数都会进入到弹幕模块内。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,其后台控制模块还电连接有操作模块、显示模块、统计模块以及分析模块,其中操作模块用于对整个弹幕抓取系统进行操作、制取表格以及其他操作,显示模块用于显示每个对应影视APP中电视剧的弹幕内容、弹幕数量以及弹幕展示时间点,统计模块用于统计影视APP中的电视剧弹幕内容、弹幕数量以及弹幕展示时间点,所述分析模块用于分析统计模块统计的数据。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,在显示模块中,其显示内容包括电视剧名称、弹幕大概总数、截止时间、弹幕具体总数、对应影视APP弹幕总数、对应剧集合集选项、对应每集标注、表格以及弹幕内容。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,其核对模块与对应的影视APP爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频之间相互关联,其核对模块与弹幕模块相对应,用于接收器其爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频内的弹幕内容、弹幕数量和弹幕展示时间点,将核对模块与弹幕模块收集的弹幕内容、弹幕数量以及弹幕展示时间点同时发送至后台控制模块,然后进行核对,如果出现错误,后台显示模块就会提醒其错误,并立即修正,重新获取。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,其影视APP包括分级弹幕数量抓取以及分集弹幕内容。
为了进一步提高一种云合数据的弹幕抓取和分析系统的使用功能,该弹幕抓取系统的方法如下:
S1:抓取各视频APP的弹幕具体为基于弹幕文本量大的特点,先对视频仅进行弹幕数量的初步抓取;
弹幕量大的视频进行分集文本抓取,减少持续抓取带来的风险;
S2:将同一电视剧的同一分集弹幕整合到一起具体为抓取结果结果进行初步去重处理后入库到h ive,便于后续分析处理对h ive中的弹幕进行分集和总集的聚合处理,对抓取存在问题的弹幕进行重新抓取;
S3:计算每分钟出现的弹幕热点话题以及弹幕总数具体为对聚合后的数据进行分析计算,得出弹幕热点内容和话题点,并且针对热点和话题点,进行重点宣传,加强剧集的播放和宣传效果。
综上所述,本发明通过设置后台控制模块,抓取弹幕数量和弹幕内容,来分析该电视剧的受欢迎程度,从而对此电视剧进行分析,提高对电视剧的监控,同时也能提高怎么去改善电视剧,非常完善。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其效物界定。

Claims (8)

1.一种云合数据的弹幕抓取和分析系统,包括后台控制模块,其特征在于,所述后台控制模块线连接有电视剧作品,其电视剧作品内设有弹幕模块,其中弹幕模块包括弹幕内容、弹幕数量以及弹幕展示时间点,所述弹幕总量数对接影视APP客户端,所述后台模块还连接有核对模块,所述核对模块与影视APP客户端线连接。
2.根据权利要求1所述的一种云合数据的弹幕抓取和分析系统,其特征在于,所述弹幕模块包括各大影视APP内的弹幕,其影视APP包括爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频,其中弹幕模块会抓取爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中的弹幕总量、弹幕内容和弹幕展示时间点,其中在爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频中电视剧每集的弹幕数都会进入到弹幕模块内。
3.根据权利要求1所述的一种云合数据的弹幕抓取和分析系统,其特征在于,其后台控制模块还电连接有操作模块、显示模块、统计模块以及分析模块,其中操作模块用于对整个弹幕抓取系统进行操作、制取表格以及其他操作,显示模块用于显示每个对应影视APP中电视剧的弹幕内容、弹幕数量以及弹幕展示时间点,统计模块用于统计影视APP中的电视剧弹幕内容、弹幕数量以及弹幕展示时间点,所述分析模块用于分析统计模块统计的数据。
4.根据权利要求3所述的一种云合数据的弹幕抓取和分析系统,其特征在于,在显示模块中,其显示内容包括电视剧名称、弹幕大概总数、截止时间、弹幕具体总数、对应影视APP弹幕总数、对应剧集合集选项、对应每集标注、表格以及弹幕内容。
5.根据权利要求1所述的一种云合数据的弹幕抓取和分析系统,其特征在于,其核对模块与对应的影视APP爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频之间相互关联,其核对模块与弹幕模块相对应,用于接收器其爱奇艺视频、腾讯视频、西瓜视频、优酷视频、PPTV视频、搜狐视频、芒果TV以及其它视频内的弹幕内容、弹幕数量和弹幕展示时间点,将核对模块与弹幕模块收集的弹幕内容、弹幕数量以及弹幕展示时间点同时发送至后台控制模块,然后进行核对,如果出现错误,后台显示模块就会提醒其错误,并立即修正,重新获取。
6.根据权利要求1所述的一种云合数据的弹幕抓取和分析系统,其特征在于,其影视APP包括分级弹幕数量抓取以及分集弹幕内容。
7.根据权利要求1所述的一种云合数据的弹幕抓取和分析系统,其特征在于,该弹幕抓取系统的方法如下:
S1:抓取各视频APP的弹幕具体为基于弹幕文本量大的特点,先对视频仅进行弹幕数量的初步抓取;
弹幕量大的视频进行分集文本抓取,减少持续抓取带来的风险;
S2:将同一电视剧的同一分集弹幕整合到一起具体为抓取结果结果进行初步去重处理后入库到hive,便于后续分析处理对hive中的弹幕进行分集和总集的聚合处理,对抓取存在问题的弹幕进行重新抓取;
S3:计算每分钟出现的弹幕热点话题以及弹幕总数具体为对聚合后的数据进行分析计算,得出弹幕热点内容和话题点,并且针对热点和话题点,进行重点宣传,加强剧集的播放和宣传效果。
8.一种云合数据的弹幕抓取和分析系统,包括分析模块、统计模块以及后台控制模块,其特征在于:其后台控制模块在接收到弹幕后将其发送至统计模块,然后回传至后台控制模块,后台控制模块再将其发送至分析模块进行分析。
CN202110513634.7A 2021-05-11 2021-05-11 一种云合数据的弹幕抓取和分析系统 Pending CN113158065A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110513634.7A CN113158065A (zh) 2021-05-11 2021-05-11 一种云合数据的弹幕抓取和分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110513634.7A CN113158065A (zh) 2021-05-11 2021-05-11 一种云合数据的弹幕抓取和分析系统

Publications (1)

Publication Number Publication Date
CN113158065A true CN113158065A (zh) 2021-07-23

Family

ID=76874723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110513634.7A Pending CN113158065A (zh) 2021-05-11 2021-05-11 一种云合数据的弹幕抓取和分析系统

Country Status (1)

Country Link
CN (1) CN113158065A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103645939A (zh) * 2013-11-29 2014-03-19 北京奇虎科技有限公司 一种图片抓取的方法和系统
CN106028176A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种确定流媒体中内容爆点的方法及装置
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN110309391A (zh) * 2018-03-21 2019-10-08 腾讯科技(深圳)有限公司 内容抓取任务的调度、处理方法、装置、存储介质和设备
CN110418176A (zh) * 2018-11-05 2019-11-05 腾讯科技(深圳)有限公司 弹幕信息处理方法、装置、服务器及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103645939A (zh) * 2013-11-29 2014-03-19 北京奇虎科技有限公司 一种图片抓取的方法和系统
CN106028176A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种确定流媒体中内容爆点的方法及装置
CN110309391A (zh) * 2018-03-21 2019-10-08 腾讯科技(深圳)有限公司 内容抓取任务的调度、处理方法、装置、存储介质和设备
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN110418176A (zh) * 2018-11-05 2019-11-05 腾讯科技(深圳)有限公司 弹幕信息处理方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN105898375B (zh) 一种弹幕推送系统及推送方法
EP2901631B1 (en) Enriching broadcast media related electronic messaging
CN103442262B (zh) 基于电视终端视频节目的用户收视行为分析方法及系统
CN109429103B (zh) 推荐信息的方法、装置及计算机可读存储介质、终端设备
US7876381B2 (en) Telop collecting apparatus and telop collecting method
CN104581388B (zh) 播放状态的处理方法、装置及系统
KR20130050983A (ko) 시청 콘텍스트를 구축하기 위해 비디오 및 대화를 분석하는 기법 및 장치
EP2559237A1 (en) Platform-independent interactivity with media broadcasts
CN1993909A (zh) 用于识别与数字媒体设备相关联的收视信息的方法和装置
CN107959863A (zh) 一种视频审核方法及系统
CN109729429B (zh) 视频播放方法、装置、设备和介质
US20230283821A1 (en) Data translation for video-viewing activity
CN102111577B (zh) 一种股票资讯信息实时播出字幕系统
CN109874023A (zh) 动态视频海报的排名方法、系统、装置及存储介质
CN111339357A (zh) 基于直播用户行为的推荐方法及装置
CN113158065A (zh) 一种云合数据的弹幕抓取和分析系统
CN103530301A (zh) 虚拟社群建立系统及方法
CN108881119A (zh) 一种视频浓缩的方法、装置和系统
CN103369352A (zh) 一种实现视频搜索和点播的方法
CN111612986A (zh) 监测方法、装置、存储柜及存储介质
CN109587522A (zh) 动态切换广告视频清晰度处理方法、播放终端及存储介质
CN110430468A (zh) 基于用户行为的智能截取短视频的方法
CN113158066A (zh) 一种云合数据影视剧播放效果分析系统
CN207897051U (zh) 信息发布系统
CN201639702U (zh) 一种rfid视频处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination