CN109361962A - 互联网流媒体大数据弹幕信息处理系统及处理方法 - Google Patents

互联网流媒体大数据弹幕信息处理系统及处理方法 Download PDF

Info

Publication number
CN109361962A
CN109361962A CN201811419910.8A CN201811419910A CN109361962A CN 109361962 A CN109361962 A CN 109361962A CN 201811419910 A CN201811419910 A CN 201811419910A CN 109361962 A CN109361962 A CN 109361962A
Authority
CN
China
Prior art keywords
barrage
priority
text information
information
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811419910.8A
Other languages
English (en)
Other versions
CN109361962B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jixun Information Technology Co ltd
Original Assignee
Beijing Luo Da Da Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Luo Da Da Technology Co Ltd filed Critical Beijing Luo Da Da Technology Co Ltd
Priority to CN201811419910.8A priority Critical patent/CN109361962B/zh
Publication of CN109361962A publication Critical patent/CN109361962A/zh
Application granted granted Critical
Publication of CN109361962B publication Critical patent/CN109361962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server

Abstract

本发明互联网流媒体大数据弹幕信息处理系统包括弹幕输入模块、第一删除模块、声音转换文字模块、文本成分分析模块、弹幕关联匹配模块、弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕、流媒体合成模块、用户终端。本发明通过上述方式可先过滤掉违法的、不良的弹幕,再根据弹幕实际与流媒体中的音频的关联程度而输出最后的第三弹幕,从而使用户能够在浏览到流媒体的具体内容时,第一时间观看到与其最为关联的弹幕内容,以保证弹幕信息的及时性关联性,从而提升用户体验,加强用户粘性。

Description

互联网流媒体大数据弹幕信息处理系统及处理方法
技术领域
本发明涉及一种大数据处理系统,特别是涉及一种用于处理流媒体大数据的信息处理系统。
背景技术
弹幕(barrage),中文流行词语,指的是在网络上观看视频时弹出的评论性字幕。
现如今,视频行业蓬勃发展,不管是长视频录像、短视频录像、视频直播、音频直播,观众均可发布弹幕与其他观众进行分享。
然而,弹幕系统的信息的量过于庞大,如果弹幕信息不受管控,而任由用户发送,则会使黄色弹幕、反动弹幕、传播不良信息弹幕猖獗。而很多弹幕有是实时发送,实时浏览的。
因此,目前急需一种能够用于治理弹幕的互联网流媒体大数据弹幕信息处理系统。
发明内容
本发明要解决的技术问题是提供一种结构简单、成本低、操作简便的互联网流媒体大数据弹幕信息处理系统。
本发明互联网流媒体大数据弹幕信息处理系统,包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
声音转换文字模块,其用于流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
第一删除模块、声音转换文字模块、文本成分分析模块、弹幕关联匹配模块、弹幕输出模块、流媒体合成模块可均为弹幕服务器。
本发明互联网流媒体大数据弹幕信息处理系统,其中文本成分分析模块与第二数据库连接,所述文本成分分析模块用于将所述第一文本信息、第二文本信息中的每1或2个连续的字与所述第二数据库中的第三信息对比,若匹配,则将第一文本信息、第二文本信息中的匹配的1或2个连续的字定义为谓语,将所述第一文本信息、第二文本信息中的匹配的1或2个连续的字之前的字定义为主语,将所述文本信息中的匹配的1或2个连续的字之后的字定义为宾语。
本发明互联网流媒体大数据弹幕信息处理系统,其中所述弹幕关联匹配模块与第三数据库连接,所述第三数据库为同义词数据库,第三数据库与弹幕输入模块连接,所述第三数据库用于存储第一优先级、第二优先级、第三优先级的第二弹幕,当所述弹幕关联匹配模块检测到弹幕输入模块输入的第一弹幕与所述第一优先级、第二优先级、第三优先级的第二弹幕相匹配时,将所述第一弹幕的文本信息的同义词转化为第三文本信息,并以第一时间信息生成第三弹幕。
本发明互联网流媒体大数据弹幕信息处理系统的处理方法,包括如下步骤:
输入第一弹幕;
删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
将流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端,以显示弹幕、显示流媒体。
本发明一种互联网流媒体大数据弹幕信息处理系统,其中包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
视频转换文字模块,其用于流媒体的视频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
本发明互联网流媒体大数据弹幕信息处理系统与现有技术不同之处在于本发明互联网流媒体大数据弹幕信息处理系统通过上述方式可先过滤掉违法的、不良的弹幕,再根据弹幕实际与流媒体中的音频的关联程度而输出最后的第三弹幕,从而使用户能够在浏览到流媒体的具体内容时,第一时间观看到与其最为关联的弹幕内容,以保证弹幕信息的及时性关联性,从而提升用户体验,加强用户粘性。
下面结合附图对本发明的互联网流媒体大数据弹幕信息处理系统作进一步说明。
附图说明
图1是互联网流媒体大数据弹幕信息处理系统的电路连接图。
具体实施方式
如图1所示,本发明互联网流媒体大数据弹幕信息处理系统包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
声音转换文字模块,其用于流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
本发明通过上述方式可先过滤掉违法的、不良的弹幕,再根据弹幕实际与流媒体中的音频的关联程度而输出最后的第三弹幕,从而使用户能够在浏览到流媒体的具体内容时,第一时间观看到与其最为关联的弹幕内容,以保证弹幕信息的及时性关联性,从而提升用户体验,加强用户粘性。
其中,所述流媒体可为录像、录音、视频直播、音频直播。
其中,第一弹幕、第二弹幕的第一时间信息、第三弹幕的第三时间信息可为同一个时间信息,也就是说,是此弹幕发送时候的时间信息。
需要说明的是,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,随机的其他第二弹幕主要是为了能够保证第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕之和等于预设最大弹幕显示量,并在用户设置预设最大弹幕显示量时,不会使显示的弹幕数量出现明显的断层。
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,随机的第三优先等级的第二弹幕与第一优先级、第二优先级的第二弹幕之和等于预设最大弹幕显示量。
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,第一优先级的第二弹幕与随机的第二优先等级的第二弹幕之和等于预设最大弹幕显示量。
当所述预设最大弹幕显示量小于第一优先级时,随机的第一优先级的弹幕等于预设最大弹幕显示量。
其中单位时间应显示的第二弹幕的数量可为在不过滤的情况下,第二弹幕在标准速度的情况下在用户终端上以截图形式而可数出的第二弹幕的数量,而预设最大弹幕显示量是上述可数出的第二弹幕的数量的上限,以保证各个弹幕不会重叠而使用户无法看清弹幕。上述预设最大弹幕显示量、弹幕的标准速度可根据优酷、斗鱼平台获取,此处不赘述。
其中,当所述预设最大弹幕显示量大于第一优先级、第二优先级、第三优先级的第二弹幕时,则发送第一优先级、第二优先级、第三优先级的第二弹幕和随机抽取的第二弹幕,
其中,预设最大弹幕显示量可为屏幕上同时出现1、2、3、4、5、6、7、8、9、10、12、13、15、20、25、30、35条弹幕。
其中,所述第一预设时间可3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20秒,也就是说,弹幕关联匹配模块可将第二弹幕输入前的20秒至输入时的任意一句第二文本信息与第一文本信息相对比,若其宾语相匹配,则该第二弹幕为第一优先级,并在用户屏幕较小或用户选择弹幕量较少的时候,仅仅将第一优先级的第二弹幕与流媒体合成发送至用户终端。
其中,所述时间轨道可以理解为直播、录播的视频、音频的进度条。
用户终端,其用于发送弹幕和浏览弹幕;
其中,所述文本成分分析模块可根据现有技术中的翻译软件而得出,也就是说,翻译软件可以识别主谓宾,并将其翻译成外文,那么,只用其标注第一文本信息、第二文本信息那就是现有技术。
弹幕输入模块可为用户终端。
第一删除模块、声音转换文字模块、文本成分分析模块、弹幕关联匹配模块、弹幕输出模块、流媒体合成模块可均为弹幕服务器。
优选地,所述文本成分分析模块与第二数据库连接,所述文本成分分析模块用于将所述第一文本信息、第二文本信息中的每1或2个连续的字与所述第二数据库中的第三信息对比,若匹配,则将第一文本信息、第二文本信息中的匹配的1或2个连续的字定义为谓语,将所述第一文本信息、第二文本信息中的匹配的1或2个连续的字之前的字定义为主语,将所述文本信息中的匹配的1或2个连续的字之后的字定义为宾语。
本发明通过上述方式可更加简单、快速地将所述第一文本的信息、第二文本信息的谓语找到,并将其相邻的主语、宾语找到,从而可以相同的识别方法对于第一文本信息、第二文本信息进行相应的主语、宾语识别,从而使其更加容易被判定是否匹配。例如,第二数据库中的谓语有“爱”、“打”、“吃”,当第一文本信息或第二文本信息为“我爱你”时,所述文本成分分析模块将“我”、“爱”、“你”,分别与“爱”进行对比,其中“爱”与“爱”匹配,则将“爱”定义为谓语,“我”定义为主语,“你”定义为宾语,从而将所述识别上述语句成分。需要说明的是,本发明的识别方式中不排除会出现被动、状语、定语的部分,其都可认为是主语或宾语的一部分,而进行第一文本信息、第二文本信息之间的匹配。
优选地,所述弹幕关联匹配模块与第三数据库连接,所述第三数据库为同义词数据库,第三数据库与弹幕输入模块连接,所述第三数据库用于存储第一优先级、第二优先级、第三优先级的第二弹幕,当所述弹幕关联匹配模块检测到弹幕输入模块输入的第一弹幕与所述第一优先级、第二优先级、第三优先级的第二弹幕相匹配时,将所述第一弹幕的文本信息的同义词转化为第三文本信息,并以第一时间信息生成第三弹幕。
本发明通过上述方式可将本系统具有自我学习能力,也就是说,可将最终匹配出的第一优先级、第二优先级、第三优先级的第二弹幕作为一个标准而将与其相同的信息的同义词自动转化为第三弹幕。一方面说,直接将其转化为第三弹幕可降低其他模块的工作量并且适合更大数据弹幕的处理,另一方面说,不直接将其转化为第三弹幕,而是将其转化为其同义词,可让用户有着更好、更丰富的弹幕内容体验。
第一弹幕的文本信息可以理解为第一文本信息。
当所述弹幕关联匹配模块检测到弹幕输入模块输入的第一弹幕与所述第一优先级、第二优先级、第三优先级的第二弹幕相匹配时,所述匹配可理解为相同。
使用时,如果弹幕关联匹配模块判定“我爱你”为第一优先级的第二弹幕,那么在弹幕输入模块再次输入“我爱你”时,所述弹幕关联匹配模块根据第三数据库而将“我爱你”生成为“我喜欢你”并将其输出为第三弹幕。
本发明互联网流媒体大数据弹幕信息处理系统的处理方法,包括如下步骤:
输入第一弹幕;
删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
将流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端,以显示弹幕、显示流媒体。
当然,本发明的一种变形还可为:一种互联网流媒体大数据弹幕信息处理系统,包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
视频转换文字模块,其用于流媒体的视频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
其中,所述视频转换文字模块,其用于流媒体的视频内容实时转换为第二信息可理解为,将所述视频上出现的可转化为文字信息的东西转化为带有第二时间信息的第二文本信息,也就是第二信息。
其中,所述可实时转换的流媒体的视频内容超过1秒、2秒、3秒、4秒、或5秒才可实际转换为第二信息,也就避免了视频上突然出现的,复杂的图像被判定为第二信息而被匹配,从而降低了弹幕关联匹配模块的工作量。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (5)

1.一种互联网流媒体大数据弹幕信息处理系统,其特征在于:包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
声音转换文字模块,其用于流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
2.根据权利要求1所述的互联网流媒体大数据弹幕信息处理系统,其特征在于:所述文本成分分析模块与第二数据库连接,所述文本成分分析模块用于将所述第一文本信息、第二文本信息中的每1或2个连续的字与所述第二数据库中的第三信息对比,若匹配,则将第一文本信息、第二文本信息中的匹配的1或2个连续的字定义为谓语,将所述第一文本信息、第二文本信息中的匹配的1或2个连续的字之前的字定义为主语,将所述文本信息中的匹配的1或2个连续的字之后的字定义为宾语。
3.根据权利要求2所述的互联网流媒体大数据弹幕信息处理系统,其特征在于:所述弹幕关联匹配模块与第三数据库连接,所述第三数据库为同义词数据库,第三数据库与弹幕输入模块连接,所述第三数据库用于存储第一优先级、第二优先级、第三优先级的第二弹幕,当所述弹幕关联匹配模块检测到弹幕输入模块输入的第一弹幕与所述第一优先级、第二优先级、第三优先级的第二弹幕相匹配时,将所述第一弹幕的文本信息的同义词转化为第三文本信息,并以第一时间信息生成第三弹幕。
4.利用权利要求3所述的互联网流媒体大数据弹幕信息处理系统的处理方法,其特征在于包括如下步骤:
输入第一弹幕;
删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
将流媒体的音频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端,以显示弹幕、显示流媒体。
5.一种互联网流媒体大数据弹幕信息处理系统,其特征在于:包括
弹幕输入模块,其用于输入第一弹幕;
第一删除模块,其用于删除第一弹幕中与第一数据库的内容相同的第一弹幕,而生成第二弹幕,所述第二弹幕包括第一文本信息和输入所述第一文本信息位于时间轨道的第一时间信息;
视频转换文字模块,其用于流媒体的视频内容实时转换为第二信息,所述第二信息包括第二文本信息和生成所述第二文本信息位于时间轨道的第二时间信息;
文本成分分析模块,其用于识别所述第一文本信息、第二文本信息的主语、谓语、宾语;
弹幕关联匹配模块,其将所述第二文本信息之前的第一预设时间内的第二弹幕进行对比,其将第一文本信息与第二文本信息的宾语相匹配的第二弹幕定义为第一优先级,其将第一文本信息与第二文本信息的谓语相匹配的第二弹幕定义为第二优先级,其将第一文本信息与第二文本信息的主语相匹配的第二弹幕定义为第三优先级;
弹幕输出模块,其根据预设最大弹幕显示量而判定以更少弹幕而输出第三弹幕,其中,
当所述预设最大弹幕显示量大于单位时间应显示的第二弹幕的数量时,则将第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于单位时间应显示的第二弹幕的数量时,则将第一优先级、第二优先级、第三优先级的第二弹幕和随机的其他第二弹幕转换为第三弹幕,
当所述预设最大弹幕显示量小于第一优先级、第二优先级、第三优先级之和的第二弹幕数量时,则将所述第一优先等级、第二优先等级的第二弹幕和随机的第三优先等级的第二弹幕转换为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级、第二优先级之和的第二弹幕数量时,则将所述第一优先级的第二弹幕与随机的第二优先等级的第二弹幕转化为第三弹幕;
当所述预设最大弹幕显示量小于第一优先级时,则将随机将第一优先级的弹幕转化为第三弹幕,其中,所述第三弹幕包括第三文本信息生成所述第三文本信息位于时间轨道的第三时间信息;
流媒体合成模块,其将所述第三弹幕的第三时间信息转化为第二时间信息,与所述流媒体合并发送至用户终端;
用户终端,其用于显示弹幕、显示流媒体。
CN201811419910.8A 2018-11-26 2018-11-26 互联网流媒体大数据弹幕信息处理系统及处理方法 Active CN109361962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811419910.8A CN109361962B (zh) 2018-11-26 2018-11-26 互联网流媒体大数据弹幕信息处理系统及处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811419910.8A CN109361962B (zh) 2018-11-26 2018-11-26 互联网流媒体大数据弹幕信息处理系统及处理方法

Publications (2)

Publication Number Publication Date
CN109361962A true CN109361962A (zh) 2019-02-19
CN109361962B CN109361962B (zh) 2019-08-16

Family

ID=65342873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811419910.8A Active CN109361962B (zh) 2018-11-26 2018-11-26 互联网流媒体大数据弹幕信息处理系统及处理方法

Country Status (1)

Country Link
CN (1) CN109361962B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110351596A (zh) * 2019-07-17 2019-10-18 刘进 一种互联网流媒体大数据弹幕处理系统及处理方法
CN110460899A (zh) * 2019-06-28 2019-11-15 咪咕视讯科技有限公司 弹幕内容的展示方法、终端设备及计算机可读存储介质
CN110475134A (zh) * 2019-08-27 2019-11-19 北京达佳互联信息技术有限公司 一种评论内容显示方法、装置、电子设备及存储介质
CN110505530A (zh) * 2019-07-17 2019-11-26 刘彩霞 一种流媒体互联网大数据弹幕处理系统及方法
CN111046651A (zh) * 2019-12-27 2020-04-21 淄博职业学院 一种中文评论分析方法
CN111064974A (zh) * 2019-12-16 2020-04-24 潘利娟 基于黑白名单设置的视频直播中弹幕拦截系统及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105357586A (zh) * 2015-09-28 2016-02-24 北京奇艺世纪科技有限公司 视频弹幕过滤方法及装置
CN106101747A (zh) * 2016-06-03 2016-11-09 腾讯科技(深圳)有限公司 一种弹幕内容处理方法及应用服务器、用户终端
CN106960042A (zh) * 2017-03-29 2017-07-18 中国科学技术大学苏州研究院 基于弹幕语义分析的网络直播监督方法
CN107645686A (zh) * 2017-09-22 2018-01-30 广东欧珀移动通信有限公司 信息处理方法、装置、终端设备及存储介质
CN108304442A (zh) * 2017-11-20 2018-07-20 腾讯科技(深圳)有限公司 一种文本信息处理方法、装置及存储介质
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析系统及方法、存储介质
CN108401175A (zh) * 2017-12-20 2018-08-14 广州虎牙信息科技有限公司 一种弹幕消息的处理方法、装置、存储介质及电子设备
CN108419139A (zh) * 2018-02-05 2018-08-17 李秀荣 互联网大数据弹幕处理系统
CN108471541A (zh) * 2018-02-01 2018-08-31 北京奇艺世纪科技有限公司 一种视频弹幕显示的方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105357586A (zh) * 2015-09-28 2016-02-24 北京奇艺世纪科技有限公司 视频弹幕过滤方法及装置
CN106101747A (zh) * 2016-06-03 2016-11-09 腾讯科技(深圳)有限公司 一种弹幕内容处理方法及应用服务器、用户终端
CN106960042A (zh) * 2017-03-29 2017-07-18 中国科学技术大学苏州研究院 基于弹幕语义分析的网络直播监督方法
CN107645686A (zh) * 2017-09-22 2018-01-30 广东欧珀移动通信有限公司 信息处理方法、装置、终端设备及存储介质
CN108304442A (zh) * 2017-11-20 2018-07-20 腾讯科技(深圳)有限公司 一种文本信息处理方法、装置及存储介质
CN108401175A (zh) * 2017-12-20 2018-08-14 广州虎牙信息科技有限公司 一种弹幕消息的处理方法、装置、存储介质及电子设备
CN108471541A (zh) * 2018-02-01 2018-08-31 北京奇艺世纪科技有限公司 一种视频弹幕显示的方法及装置
CN108419139A (zh) * 2018-02-05 2018-08-17 李秀荣 互联网大数据弹幕处理系统
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析系统及方法、存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460899A (zh) * 2019-06-28 2019-11-15 咪咕视讯科技有限公司 弹幕内容的展示方法、终端设备及计算机可读存储介质
CN110351596A (zh) * 2019-07-17 2019-10-18 刘进 一种互联网流媒体大数据弹幕处理系统及处理方法
CN110505530A (zh) * 2019-07-17 2019-11-26 刘彩霞 一种流媒体互联网大数据弹幕处理系统及方法
CN110505530B (zh) * 2019-07-17 2021-07-06 深圳市中鹏教育科技股份有限公司 一种流媒体互联网大数据弹幕处理系统
CN110351596B (zh) * 2019-07-17 2021-07-27 上海播呗网络科技有限公司 一种互联网流媒体大数据弹幕处理系统及处理方法
CN110475134A (zh) * 2019-08-27 2019-11-19 北京达佳互联信息技术有限公司 一种评论内容显示方法、装置、电子设备及存储介质
CN111064974A (zh) * 2019-12-16 2020-04-24 潘利娟 基于黑白名单设置的视频直播中弹幕拦截系统及方法
CN113660507A (zh) * 2019-12-16 2021-11-16 潘利娟 基于黑白名单设置的视频直播中弹幕拦截系统
CN113660507B (zh) * 2019-12-16 2022-09-13 广州随手播网络科技有限公司 基于黑白名单设置的视频直播中弹幕拦截系统
CN111046651A (zh) * 2019-12-27 2020-04-21 淄博职业学院 一种中文评论分析方法
CN111046651B (zh) * 2019-12-27 2023-04-28 淄博职业学院 一种中文评论分析方法

Also Published As

Publication number Publication date
CN109361962B (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN109361962B (zh) 互联网流媒体大数据弹幕信息处理系统及处理方法
US20180007409A1 (en) Video recommending method, server, and storage media
US8495003B2 (en) System and method for scoring stream data
CN111541910B (zh) 一种基于深度学习的视频弹幕评论自动生成方法及系统
JP4920395B2 (ja) 動画要約自動作成装置、方法、及びコンピュータ・プログラム
US10652592B2 (en) Named entity disambiguation for providing TV content enrichment
JP2020102228A (ja) メディアアセットに関するコンテクスト上関係する情報を表示するための方法およびシステム
EP2555131A2 (en) Segmentation of video according to narrative theme
US20090063157A1 (en) Apparatus and method of generating information on relationship between characters in content
JP2002297630A (ja) インデックス生成方法、インデックス生成装置、インデックス付加システム、プログラム、および記憶媒体
CN111479169A (zh) 一种视频评论显示方法、电子设备以及计算机存储介质
US9563704B1 (en) Methods, systems, and media for presenting suggestions of related media content
KR20030007727A (ko) 자동 비디오 리트리버 제니
CN112860939A (zh) 音视频数据处理方法、装置、设备和存储介质
CN113347498A (zh) 一种视频播放方法、装置及计算机可读存储介质
CN112507163A (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
US10743085B2 (en) Automatic annotation of audio-video sequences
EP2869546B1 (en) Method and system for providing access to auxiliary information
CN106294321A (zh) 一种特定领域的对话挖掘方法及装置
US20170139933A1 (en) Electronic Device, And Computer-Readable Storage Medium For Quickly Searching Video Segments
CN115438222A (zh) 一种用于回答视频相关问题的情境感知方法,设备和系统
CN114339300A (zh) 字幕处理方法、装置、电子设备及计算机可读介质及产品
CN109284364B (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
KR102090720B1 (ko) 게임내용 기반 e 스포츠 경기 영상 정보 검색 시스템 및 방법
CN106488299A (zh) 视频文件展示方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190718

Address after: Room 4929, No. 2, 1800 Panyuan Road, Changxing Town, Chongming County, Shanghai (Shanghai Tai and Economic Development Zone)

Applicant after: Shanghai Jixun Information Technology Co.,Ltd.

Address before: 100061 No. 1-3-402 Yingfang West Street, Dongcheng District, Beijing

Applicant before: BEIJING LUOBIDA TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Floor 3, Building 2, No. 200 Zhangheng Road, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, 2019

Patentee after: Shanghai Jixun Information Technology Co.,Ltd.

Country or region after: China

Address before: 201913 room 4929, building 2, No. 1800, Panyuan Road, Changxing Town, Chongming County, Shanghai (Shanghai Taihe Economic Development Zone)

Patentee before: Shanghai Jixun Information Technology Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address