CN106960042A - 基于弹幕语义分析的网络直播监督方法 - Google Patents

基于弹幕语义分析的网络直播监督方法 Download PDF

Info

Publication number
CN106960042A
CN106960042A CN201710196845.6A CN201710196845A CN106960042A CN 106960042 A CN106960042 A CN 106960042A CN 201710196845 A CN201710196845 A CN 201710196845A CN 106960042 A CN106960042 A CN 106960042A
Authority
CN
China
Prior art keywords
barrage
text
direct broadcasting
theme
supervision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710196845.6A
Other languages
English (en)
Inventor
黄刘生
马国帅
杨威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Institute for Advanced Study USTC
Original Assignee
Suzhou Institute for Advanced Study USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Institute for Advanced Study USTC filed Critical Suzhou Institute for Advanced Study USTC
Priority to CN201710196845.6A priority Critical patent/CN106960042A/zh
Publication of CN106960042A publication Critical patent/CN106960042A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于弹幕语义分析的网络直播监督方法,包括:实时爬取直播间弹幕,并进行预处理;对弹幕语句进行分词处理,并去除停用词,构建LDA主题模型,提取弹幕隐含主题;将得到的主题与敏感主题进行相似度比较,识别具体的敏感主题。能自动识别敏感话题并向管理员发出预警,提高了网络直播平台监管的效率,减少了人工管理的成本,也保证监督的可靠性与实时性,简单高效。

Description

基于弹幕语义分析的网络直播监督方法
技术领域
本发明属于视频内容监督技术领域,具体地涉及一种基于弹幕语义分析的网络直播监督方法。
背景技术
网络直播行业是近些年迅速发展起来的一种新的互联网文化产业。弹幕式分享网站是其中一种重要的形式,直播间播放视频,观众在线观看,主播和观众通过弹幕进行交流。其中比较著名直播平台有斗鱼、虎牙、全民、熊猫、战旗、YY等。据统计,仅在2016年,全国在线直播平台数量接近200家,网络直播的市场规模约90亿,网络直播平台用户数量已经达到3.25亿,一个知名主播在高峰时段的在线观众可达400万,一个平台同时直播的房间数目超过3000个。
网络直播一个显著的特点是观众可以通过弹幕和主播或其他观众交流。在形式上,弹幕明显不同于书面语言,更接近于口语,一条弹幕一般控制在30个中文字符内。在内容上,弹幕所讨论的内容一般都与视频直播内容实时同步,具有一致性。在语法结构上深入研究弹幕可以发现它具有以下特点:①内容特点:多变性、多元性、情绪性、独特性、碎片化;②形式特点:即时性、共时性、互动性;③趋势特点:玩乐性、吐槽性、内容趋同性。因此分析其语义需要使用特殊的方式。
相对于网络直播行业的繁荣,目前对网络直播的监督方式比较落后,各个直播平台均是采用委任超级管理员人工监督或由群众监督举报。随着直播房间和观众的激增,人工监督的方式显然不能满足管理的需求。因此,市场上迫切需要一种能够自动监督直播、自动识别敏感话题、自动预警、全天24小时工作的网络直播监督新方法出现。
以LDA(latent dirichlet allocation)模型为代表的主题模型是自然语言文本挖掘领域的一个比较成熟的技术。由美国学者Blei于2003年提出它是一种“文档-主题-词项”三层贝叶斯网络的概率模型,具有优秀的降维能力、发现隐藏主题能力和良好的扩展性。利用主题建模挖掘出的主题可以帮助人们理解海量文本背后隐藏的语义,可以完成文本分类、话题检测、文本自动摘要等多方面的文本挖掘任务。LDA主题模型已经在文本挖掘及相关领域中得到广泛应用,并且在以新闻类数据为主的传统网络文本挖掘方面获得了很大成功。本发明因此而来。
发明内容
针对上述存在的技术问题,本发明目的是:提供了一种基于弹幕语义分析的网络直播监督方法,能自动识别敏感话题并向管理员发出预警,提高了网络直播平台监管的效率,减少了人工管理的成本,也保证监督的可靠性与实时性,简单高效。
本发明的技术方案是:
一种基于弹幕语义分析的网络直播监督方法,包括以下步骤:
S01:实时爬取直播间弹幕,并进行预处理;
S02:对弹幕语句进行分词处理,并去除停用词,构建LDA主题模型,提取弹幕隐含主题;
S03:将得到的主题与敏感主题进行相似度比较,识别具体的敏感主题。
优选的,所述步骤S01具体包括:
S11:登录直播间,获取其UML地址;使用爬虫程序每隔一定时间爬取该直播间的弹幕数据作为弹幕文本保存;
S12:对弹幕文本进行预处理,删除无意义的礼物赠送提示信息、答谢提示信息、房间公告、广告刷屏弹幕;
S13:对正常用户所发的弹幕,删除用户名、时间,只保留发言语句信息。
优选的,所述步骤S02具体包括:
S21:创建弹幕分词词典,对预处理后的语句进行分词处理,将语句分割为独立的字或词汇;
S22:创建弹幕停用词词典,去除分词后的弹幕文本中的停用词;
S23:将去除停用词后的弹幕文本运行于构建的LDA主题模型,获得弹幕文本隐含的主题信息。
优选的,所述步骤S03中,按顺序筛选对照文本;计算弹幕文本和对照文本主题间的距离DKL,计算公式为:
式中,P(x)和Q(x)分别为文本集中某两个文本的主题概率分布,X为文本集;
若DKL大于设定阈值,则认为无敏感主题,反之,弹幕文本含有与对照文本相同的敏感主题,并进行预警。
与现有技术相比,本发明的优点是:
1、通过对直播视频实时相关的弹幕进行语义分析,可以清楚地了解到直播内容,然后通过敏感话题识别,即可发现播放不良内容的直播间,达到了自动监督的目的。
2、实时获取直播间最新信息作为判断依据,能够快速识别出含有敏感主题并向管理员发出警报,实时高效。
3、对监督的直播间的播放内容没有限制,只要是含有弹幕的视频都可以用本发明进行监督,应用范围广。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明方法的流程图;
图2为本发明直播间弹幕爬取流程图;
图3为本发明弹幕隐含主题挖掘流程图;
图4为本发明敏感话题识别流程图。
具体实施方式
以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。
实施例:
本发明基于弹幕语义分析的网络直播监督方法,其中弹幕是指直播间播放视频内容上实时显示的观众输入的弹幕语句。对照文本是指管理员根据以前的管理经验预先挑选的含有敏感内容的直播间当时记录的弹幕文本集,可以有多个对照文本。LDA主题模型产生的主题形式是得到该主题在数学上的概率分布。
如图1所示,本发明基于弹幕语义分析的网络直播监督方法,包括以下步骤:
一、直播间弹幕爬取及预处理。
如图2所示,从网络直播间爬取弹幕文字后,以5分钟为一个时间片,判断该爬取过程是否已够5分钟。对于未满足5分钟的弹幕文本,继续爬取,对于已够5分钟的弹幕文本,保存下来。具体的,当对某一具体直播间开启监督后,程序开始爬取第一条弹幕,弹幕语句格式中包含时间信息,记录这个时间为start_time,第二条及以后的弹幕的时间为end_time,比较两者的时间差,如果:
end_time - start_time≤5,采集下一条弹幕,并跟新end_time。
end_time - start_time>5,保存弹幕该文本。
得到原始弹幕文本后,使用Python语言编程对其进行预处理,删除无意义的礼物赠送提示信息、答谢提示信息、房间公告、广告刷屏弹幕。对正常用户所发的每条弹幕,删除用户名、时间,只保留发言语句信息。
二、弹幕内容隐含主题挖掘。
如图3所示,根据弹幕语言特点对弹幕原始文本进行预处理,使用正则表达式去除用户名、纯数字语句、纯拼音语句、纯符号语句、无意义刷屏的语言噪音,得到纯汉字文本的弹幕文本。
然后使用Python自带的jieba分词系统对其进行中文分词、去停用词等操作,特别地,此步骤需要使用自定义的分词库和停用词库,以提高准确率。
分词库和停用词库可以根据先验知识进行创建。
对分词后的文本使用LDA主题模型,挖掘文本隐含主题,输入适当的参数,经过若干次迭代过程后输出趋于稳定,能够获得弹幕文本隐含的主题信息。
本实施例LDA模型的参数设置为:主题数目K=5,每个主题下的词汇数设置为10个,α=50/K=0.1、β=0.01,Gibbs抽样的迭代次数为1000次。本实验的LDA模型为C++版本,运行环境为Linux操作系统。
三、敏感话题识别。
如图4所示,首先创建对照弹幕文本集,对照弹幕文本集是管理员根据以往管理经验从数据库中人工筛选含有敏感主题的对照弹幕文本,文本的时间跨度也为5分钟,一篇文档中只包含一个敏感主题。但某敏感主题的对照文本集可以包含若干篇含有此敏感主题的文档。本实施例中,含有色情主题的对照文本10篇,含有暴力主题的对照文本10篇。
把对照文本进行与爬取的实验弹幕文本一样的主题提取操作,即分别进行预处理、分词、去停用词、应用LDA主题模型,最后得到对照文本的主题分布。
然后使用KL距离(Kullback-Leibler Divergence)计算实验弹幕文本和对照文本主题间的距离,其计算公式如下图所示:
式中,P(x)和Q(x)分别为实验文本集中某两个文本的主题概率分布,X为实验文本集。DKL距离越接近0,代表两个主题越相似。
设置阈值,如果相似度小于等于阈值,则判定两个主题相似,实验弹幕文本含有和对照文本相同的敏感主题,向管理员发出预警;如果相似度大于阈值,则丢弃实验弹幕文本,重新爬取新的实验弹幕文本,重复以上步骤,继续监督直播间。本实验阈值设为0.2。
上述实例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于弹幕语义分析的网络直播监督方法,其特征在于,包括以下步骤:
S01:实时爬取直播间弹幕,并进行预处理;
S02:对弹幕语句进行分词处理,并去除停用词,构建LDA主题模型,提取弹幕隐含主题;
S03:将得到的主题与敏感主题进行相似度比较,识别具体的敏感主题。
2.根据权利要求1所述的基于弹幕语义分析的网络直播监督方法,其特征在于,所述步骤S01具体包括:
S11:登录直播间,获取其UML地址;使用爬虫程序每隔一定时间爬取该直播间的弹幕数据作为弹幕文本保存;
S12:对弹幕文本进行预处理,删除无意义的礼物赠送提示信息、答谢提示信息、房间公告、广告刷屏弹幕;
S13:对正常用户所发的弹幕,删除用户名、时间,只保留发言语句信息。
3.根据权利要求1所述的基于弹幕语义分析的网络直播监督方法,其特征在于,所述步骤S02具体包括:
S21:创建弹幕分词词典,对预处理后的语句进行分词处理,将语句分割为独立的字或词汇;
S22:创建弹幕停用词词典,去除分词后的弹幕文本中的停用词;
S23:将去除停用词后的弹幕文本运行于构建的LDA主题模型,获得弹幕文本隐含的主题信息。
4.根据权利要求3所述的基于弹幕语义分析的网络直播监督方法,其特征在于,所述步骤S03中,按顺序筛选对照文本;计算弹幕文本和对照文本主题间的距离DKL,计算公式为:
式中,P(x)和Q(x)分别为文本集中某两个文本的主题概率分布,X为文本集;
若DKL大于设定阈值,则认为无敏感主题,反之,弹幕文本含有与对照文本相同的敏感主题,并进行预警。
CN201710196845.6A 2017-03-29 2017-03-29 基于弹幕语义分析的网络直播监督方法 Pending CN106960042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710196845.6A CN106960042A (zh) 2017-03-29 2017-03-29 基于弹幕语义分析的网络直播监督方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710196845.6A CN106960042A (zh) 2017-03-29 2017-03-29 基于弹幕语义分析的网络直播监督方法

Publications (1)

Publication Number Publication Date
CN106960042A true CN106960042A (zh) 2017-07-18

Family

ID=59471626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710196845.6A Pending CN106960042A (zh) 2017-03-29 2017-03-29 基于弹幕语义分析的网络直播监督方法

Country Status (1)

Country Link
CN (1) CN106960042A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107592578A (zh) * 2017-09-22 2018-01-16 广东欧珀移动通信有限公司 信息处理方法、装置、终端设备及存储介质
CN107896338A (zh) * 2017-12-06 2018-04-10 任明和 基于用户点评的视频内容侦测和评级方法
CN107944019A (zh) * 2017-12-11 2018-04-20 中广在线(北京)文化传媒有限公司 一种基于爬虫技术的境外舆情监测装置、系统及方法
CN108021604A (zh) * 2017-10-24 2018-05-11 山东科技大学 一种爬取斗鱼直播网站主播房间里弹幕的网络爬虫方法
CN108108353A (zh) * 2017-12-19 2018-06-01 北京邮电大学 一种基于弹幕的视频语义标注方法、装置及电子设备
CN108184148A (zh) * 2018-01-08 2018-06-19 武汉斗鱼网络科技有限公司 一种用于识别用户的方法、装置及计算机设备
CN108280059A (zh) * 2018-01-09 2018-07-13 武汉斗鱼网络科技有限公司 直播间内容标签提取方法、存储介质、电子设备及系统
CN108537176A (zh) * 2018-04-11 2018-09-14 武汉斗鱼网络科技有限公司 目标弹幕的识别方法、装置、终端及存储介质
CN108566565A (zh) * 2018-03-30 2018-09-21 科大讯飞股份有限公司 弹幕展示方法及装置
CN109062905A (zh) * 2018-09-04 2018-12-21 武汉斗鱼网络科技有限公司 一种弹幕文本价值评价方法、装置、设备及介质
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN109327715A (zh) * 2018-08-01 2019-02-12 阿里巴巴集团控股有限公司 一种视频风险识别方法、装置及设备
CN109361962A (zh) * 2018-11-26 2019-02-19 北京洛必达科技有限公司 互联网流媒体大数据弹幕信息处理系统及处理方法
CN109540160A (zh) * 2018-10-18 2019-03-29 深圳壹账通智能科技有限公司 一种基于语音交互的最佳路径分析方法及相关设备
CN109657241A (zh) * 2018-12-13 2019-04-19 南京邮电大学 面向网络直播场景的用户言论语义分析方法
CN110312166A (zh) * 2018-03-20 2019-10-08 香港乐蜜有限公司 直播间消息过滤方法、装置、电子设备及存储介质
CN110418176A (zh) * 2018-11-05 2019-11-05 腾讯科技(深圳)有限公司 弹幕信息处理方法、装置、服务器及存储介质
CN110856016A (zh) * 2019-11-18 2020-02-28 百度在线网络技术(北京)有限公司 视频直播的监控方法、装置、电子设备及存储介质
CN111695974A (zh) * 2020-06-18 2020-09-22 上海适享文化传播有限公司 在直播中随时随地使用零售知识数据库的方法
CN113365091A (zh) * 2021-06-03 2021-09-07 上海哔哩哔哩科技有限公司 直播间礼物赠送方法及装置
CN114598899A (zh) * 2022-03-15 2022-06-07 中科大数据研究院 一种基于爬虫的弹幕播报分析方法
CN115630644A (zh) * 2022-11-09 2023-01-20 哈尔滨工业大学 基于lda主题模型的直播用户弹幕的话题挖掘方法
CN117395470A (zh) * 2023-08-31 2024-01-12 江苏初辰文化发展有限公司 一种基于弹幕分享的直播内容评价检测方法
US11928117B2 (en) 2021-06-23 2024-03-12 International Business Machines Corporation Live comment management

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140065596A1 (en) * 2006-07-11 2014-03-06 Erwin Ernest Sniedzins Real time learning and self improvement educational system and method
CN105872773A (zh) * 2016-06-01 2016-08-17 北京奇虎科技有限公司 视频直播的监控方法及监控装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140065596A1 (en) * 2006-07-11 2014-03-06 Erwin Ernest Sniedzins Real time learning and self improvement educational system and method
CN105872773A (zh) * 2016-06-01 2016-08-17 北京奇虎科技有限公司 视频直播的监控方法及监控装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李金兰: "直播平台如何有效进行弹幕管理", 《HTTP://WWW.CAC.GOV.CN/2017­02/21/C_1120499123.HTM》 *
许震 等: "基于KL距离的非平衡数据半监督学习算法", 《计算机研究与发展》 *
钟荣飞: "基于主题模型的网络舆情监控研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107592578B (zh) * 2017-09-22 2019-05-07 Oppo广东移动通信有限公司 信息处理方法、装置、终端设备及存储介质
CN107592578A (zh) * 2017-09-22 2018-01-16 广东欧珀移动通信有限公司 信息处理方法、装置、终端设备及存储介质
CN108021604A (zh) * 2017-10-24 2018-05-11 山东科技大学 一种爬取斗鱼直播网站主播房间里弹幕的网络爬虫方法
CN107896338B (zh) * 2017-12-06 2020-11-17 重庆智韬信息技术中心 基于用户点评的视频内容侦测和评级方法
CN107896338A (zh) * 2017-12-06 2018-04-10 任明和 基于用户点评的视频内容侦测和评级方法
CN107944019A (zh) * 2017-12-11 2018-04-20 中广在线(北京)文化传媒有限公司 一种基于爬虫技术的境外舆情监测装置、系统及方法
CN108108353A (zh) * 2017-12-19 2018-06-01 北京邮电大学 一种基于弹幕的视频语义标注方法、装置及电子设备
CN108108353B (zh) * 2017-12-19 2020-11-10 北京邮电大学 一种基于弹幕的视频语义标注方法、装置及电子设备
CN108184148A (zh) * 2018-01-08 2018-06-19 武汉斗鱼网络科技有限公司 一种用于识别用户的方法、装置及计算机设备
WO2019134284A1 (zh) * 2018-01-08 2019-07-11 武汉斗鱼网络科技有限公司 一种用于识别用户的方法、装置及计算机设备
CN108280059A (zh) * 2018-01-09 2018-07-13 武汉斗鱼网络科技有限公司 直播间内容标签提取方法、存储介质、电子设备及系统
CN110312166B (zh) * 2018-03-20 2021-09-24 卓米私人有限公司 直播间消息过滤方法、装置、电子设备及存储介质
CN110312166A (zh) * 2018-03-20 2019-10-08 香港乐蜜有限公司 直播间消息过滤方法、装置、电子设备及存储介质
CN108566565A (zh) * 2018-03-30 2018-09-21 科大讯飞股份有限公司 弹幕展示方法及装置
CN108537176A (zh) * 2018-04-11 2018-09-14 武汉斗鱼网络科技有限公司 目标弹幕的识别方法、装置、终端及存储介质
CN109327715A (zh) * 2018-08-01 2019-02-12 阿里巴巴集团控股有限公司 一种视频风险识别方法、装置及设备
CN109308487B (zh) * 2018-08-06 2021-03-30 同济大学 一种基于弹幕数据分析的广告投放方法
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN109062905B (zh) * 2018-09-04 2022-06-24 武汉斗鱼网络科技有限公司 一种弹幕文本价值评价方法、装置、设备及介质
CN109062905A (zh) * 2018-09-04 2018-12-21 武汉斗鱼网络科技有限公司 一种弹幕文本价值评价方法、装置、设备及介质
CN109540160A (zh) * 2018-10-18 2019-03-29 深圳壹账通智能科技有限公司 一种基于语音交互的最佳路径分析方法及相关设备
CN110418176B (zh) * 2018-11-05 2021-12-14 腾讯科技(深圳)有限公司 弹幕信息处理方法、装置、服务器及存储介质
CN110418176A (zh) * 2018-11-05 2019-11-05 腾讯科技(深圳)有限公司 弹幕信息处理方法、装置、服务器及存储介质
CN109361962A (zh) * 2018-11-26 2019-02-19 北京洛必达科技有限公司 互联网流媒体大数据弹幕信息处理系统及处理方法
CN109361962B (zh) * 2018-11-26 2019-08-16 上海竑讯信息科技有限公司 互联网流媒体大数据弹幕信息处理系统及处理方法
CN109657241A (zh) * 2018-12-13 2019-04-19 南京邮电大学 面向网络直播场景的用户言论语义分析方法
CN110856016A (zh) * 2019-11-18 2020-02-28 百度在线网络技术(北京)有限公司 视频直播的监控方法、装置、电子设备及存储介质
CN111695974A (zh) * 2020-06-18 2020-09-22 上海适享文化传播有限公司 在直播中随时随地使用零售知识数据库的方法
CN111695974B (zh) * 2020-06-18 2024-01-23 上海适享文化传播有限公司 在直播中随时随地使用零售知识数据库的方法
CN113365091B (zh) * 2021-06-03 2023-03-24 上海哔哩哔哩科技有限公司 直播间礼物赠送方法及装置
CN113365091A (zh) * 2021-06-03 2021-09-07 上海哔哩哔哩科技有限公司 直播间礼物赠送方法及装置
US11928117B2 (en) 2021-06-23 2024-03-12 International Business Machines Corporation Live comment management
CN114598899A (zh) * 2022-03-15 2022-06-07 中科大数据研究院 一种基于爬虫的弹幕播报分析方法
CN115630644A (zh) * 2022-11-09 2023-01-20 哈尔滨工业大学 基于lda主题模型的直播用户弹幕的话题挖掘方法
CN117395470A (zh) * 2023-08-31 2024-01-12 江苏初辰文化发展有限公司 一种基于弹幕分享的直播内容评价检测方法

Similar Documents

Publication Publication Date Title
CN106960042A (zh) 基于弹幕语义分析的网络直播监督方法
CN107169430B (zh) 基于图像处理语义分析的阅读环境音效增强系统及方法
CN100536532C (zh) 自动加配字幕的方法和系统
Boykin et al. Machine learning of event segmentation for news on demand
Essid et al. Smooth nonnegative matrix factorization for unsupervised audiovisual document structuring
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
Ellis et al. Why we watch the news: a dataset for exploring sentiment in broadcast video news
CN114465737B (zh) 一种数据处理方法、装置、计算机设备及存储介质
US20180352280A1 (en) Apparatus and method for programming advertisement
US11735203B2 (en) Methods and systems for augmenting audio content
CN109299277A (zh) 舆情分析方法、服务器及计算机可读存储介质
Dupuy et al. Is incremental cross-show speaker diarization efficient for processing large volumes of data?
Li et al. Unsupervised classification of speaker roles in multi-participant conversational speech
Berlage et al. Improving automated segmentation of radio shows with audio embeddings
Jitaru et al. Lrro: a lip reading data set for the under-resourced romanian language
KR102328234B1 (ko) 소셜 네트워크에서 연관 문서 분석을 통한 지역 이벤트 검출 시스템 및 방법
Saz et al. Background-tracking acoustic features for genre identification of broadcast shows
CN111681680B (zh) 视频识别物体获取音频方法、系统、装置及可读存储介质
Wu et al. Interactive Visualization of AI-based Speech Recognition Texts
Bigot et al. Exploiting speaker segmentations for automatic role detection. An application to broadcast news documents
Chaisorn et al. Story boundary detection in news video using global rule induction technique
Ma et al. Finding speaker identities with a conditional maximum entropy model
KR20220085219A (ko) 유튜브의 영상의 메타데이터를 이용한 광고 필터링 방법
CN115705705A (zh) 基于机器学习的视频识别方法、装置、服务器和存储介质
Wang et al. Video Captioning Based on Joint Image–Audio Deep Learning Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170718

RJ01 Rejection of invention patent application after publication