CN114598899B - 一种基于爬虫的弹幕播报分析方法 - Google Patents
一种基于爬虫的弹幕播报分析方法 Download PDFInfo
- Publication number
- CN114598899B CN114598899B CN202210250170.XA CN202210250170A CN114598899B CN 114598899 B CN114598899 B CN 114598899B CN 202210250170 A CN202210250170 A CN 202210250170A CN 114598899 B CN114598899 B CN 114598899B
- Authority
- CN
- China
- Prior art keywords
- data
- barrage
- live broadcast
- voice
- broadcasting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 230000005540 biological transmission Effects 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 238000007418 data mining Methods 0.000 claims abstract description 6
- 238000013486 operation strategy Methods 0.000 claims abstract description 5
- 238000003860 storage Methods 0.000 claims abstract description 5
- 238000004140 cleaning Methods 0.000 claims description 8
- 230000008451 emotion Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 abstract 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于数据挖掘和语音识别技术领域,具体涉及一种基于爬虫的弹幕播报分析方法。该方法通过分析直播源的弹幕消息传输协议,采用爬虫采集弹幕并将数据推送至消息队列,然后本地轮询接收消息队列数据并进行语音转换和存储,按序读取语音文件进行语音播报,最后通过数据挖掘算法对存储数据进行分析,实现实时监控弹幕并播报,提高直播热度和直播场景中的互动性,同时还能分析用户画像、直播热点和舆情演化,提高直播内容和运营策略的优化。
Description
技术领域
本发明属于数据挖掘和语音识别技术领域,具体涉及一种基于爬虫的弹幕播报分析方法。
背景技术
弹幕指直接显现在视频上的评论,是观看视频的人发送的简短评论。然而目前在进行游戏直播、手机直播或者虚拟主播直播的时候,由于弹幕播放比较迅速,主播无法高效的参与弹幕互动。另外由于现有方法为对直播中的数据流进行统计,无法根据直播时的用户舆情去优化直播策略。
发明内容
针对目前直播中的数据流无法进行统计,无法根据直播时的用户舆情去优化直播策略的缺陷和问题,本发明提供一种基于爬虫的弹幕播报分析方法。
本发明解决其技术问题所采用的方案是:一种基于爬虫的弹幕播报分析方法,其特征在于:包括以下步骤:
步骤一、选择直播平台,准备抓包工具,打开平台网页或APP向直播源发起请求,查看弹幕数据的响应内容,从数据包提取出消息传输协议类型;
步骤二、通过爬虫采集弹幕并将数据推送至消息列队;
步骤三、本地轮询接收消息队列数据并进行语音转换和存储;
步骤四、按需读取文件并进行语音播报;
步骤五、提取出指定时间段的弹幕数据,通过数据挖掘算法对用户画像、直播热点以及舆情演化进行分析。
上述的基于爬虫的弹幕播报分析方法,步骤二中通过爬虫采集弹幕并将数据推送推送至消息列队,具体步骤为:
(1)先创建一个消息队列接收和推送弹幕数据;
(2)根据获得的数据包信息,通过编程语言构建出相同的请求报文;
(3)通过编程语言的请求库向服务端发起模拟请求;
(4)接收服务端返回的响应信息,构建解析规则从中提取出每一条弹幕文字信息;
(5)将每一条弹幕推送到消息队列中,等待服务端接收。
上述的基于爬虫的弹幕播报分析方法,步骤(2)中所述编程语言为Python语言、java语言、go语言的任一种,其中Python语言可以使用requests请求库,java语言可以使用httpclient请求库,go语言可以使用req请求库。
上述的基于爬虫的弹幕播报分析方法,步骤三本地轮询接收消息队列数据并进行语音转换和存储的方法为:
(1)在本地创建一个接收消息队列中数据的服务;
(2)等待消息队列推送数据,对接收到的弹幕数据进行清洗并标注上当前时间戳,标注后的数据存储到数据库中等待后续分析;
(3)把每一条弹幕信息分别进行文字语音转换;
(4)根据标注的时间戳按序生成本地语音文件。
上述的基于爬虫的弹幕播报分析方法,步骤(2)中对弹幕数据进行清洗是根据自定义的风险词典,过滤掉包含风险词汇的弹幕;同时根据清洗规则过滤掉一些噪音数据。
上述的基于爬虫的弹幕播报分析方法,步骤(2)中对弹幕数据进行标注是根据消息队列的推送时间对弹幕信息进行标注,以时间戳为标注信息。
上述的基于爬虫的弹幕播报分析方法,步骤四中读取文件并进行语音播报的规则是:当语音目录不为空或者每当有语音文件生成时扫描本地语音文件,根据标注的顺序播放语音文件,播放后根据标注对播报后的语音文件进行删除。
上述的基于爬虫的弹幕播报分析方法,步骤五中通过词频统计和分组统计分析用户画像和直播热点;其中词频统计方法为:先通过jieba进行文本分词,然后通过文本遍历提取出现次数较多的词汇,最后通过 TF/IDF算法计算出现次数较多词汇的词频,
式中:KW为待计算词频的词汇;WN为某段直播弹幕中KW出现的次数;WA为某段直播弹幕的总词数;DA为总直播数;ZN为出现KW的直播数;WF为词频;
分组统计方法为:根据时间戳对每分钟内的弹幕数量进行分组统计,统计出数量最多的分组中出现的弹幕词汇,然后将其和词频统计中计算的词汇和词频进行匹配,得出直播中的热点词汇即为直播热点。
上述的基于爬虫的弹幕播报分析方法,步骤五中通过AdaBoost算法对每条弹幕进行情绪分类,将情绪分类结果按照时间形成时间序列来直观的查看在不同时间节点中用户对直播状态的舆情演化,然后通过LSTM模型进行时间序列预测,预测下段直播中舆情演化趋势较大的时间段,根据预测结果可让从业人员提前制定运行策略和优化直播效果。
本发明的有益效果:
本发明的基于爬虫的弹幕播报方法,首先通过分析直播协议,通过爬虫采集弹幕,解析出每一条弹幕数据,当本地服务接受到弹幕后进行数据清洗和过滤,然后通过语音合成引擎将文字转为语音播放出来,一方面减少了直播弹幕中的无用信息和风险信息,提高用户信息获取效率;另一方面可以让主播脱离屏幕的同时掌握弹幕情况,提高直播交互性和趣味性;另一方面通过分析直播弹幕数据,提取出用户画像、直播热点和舆情演化,来帮助从业人员提高直播内容和运营策略的优化。
附图说明
图1为本发明整体流程图。
图2为对直播源的弹幕消息传输协议分析流程图。
图3为弹幕采集及推送流程图。
图4为数据转换及存储流程图。
图5为语音读取及播报流程图。
图6为存储数据分析流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
实施例1:本实施例提供一种基于爬虫的弹幕播报分析方法,参见图1,该方法包括以下步骤:
步骤一、分析直播源的弹幕消息传输协议:
目前常见的消息传输协议有http/https和ws/wss两种,但是每个直播平台的传输协议都不相同,所以需要先确定直播平台,然后抓包分析传输协议。具体参见图2,
1、选择直播平台,任何现有平台都可以,比如斗鱼、虎牙、抖音、快手、bilibili等。
2、准备抓包工具,任何抓包工具都可以,比如Charles、Fiddler、Wireshark等。
3、打开平台网页或APP向直播源发起请求,查看弹幕数据的响应内容,从数据包提取出消息传输协议类型。
步骤二、通过爬虫采集弹幕并将数据推送至消息列队,参见图3,具体步骤为:
1、先创建一个消息队列,比如Redis或RabbitMQ,用于接收和推送弹幕数据;
2、根据获得的数据包信息,通过编程语言构建出相同的请求报文;
3、通过编程语言的请求库向服务端发起模拟请求;所述编程语言为Python语言、java语言、go语言的任一种,其中Python语言可以使用requests请求库,java语言可以使用httpclient请求库,go语言可以使用req请求库。
4、接收服务端返回的响应信息,构建解析规则从中提取出每一条弹幕文字信息;
5、将每一条弹幕推送到消息队列中,等待服务端接收。
步骤三、本地轮询接收消息队列数据并进行语音转换和存储,参见图4,具体为:
1、在本地创建一个接收消息队列中数据的服务。
2、等待消息队列推送数据,对接收到的弹幕数据进行清洗并标注上当前时间戳,标注后的数据存储到数据库中等待后续分析。
其中数据清洗是根据自定义的风险词典,过滤掉包含风险词汇的弹幕;同时根据清洗规则过滤掉一些噪音数据;而标注则是根据消息队列的推送时间对弹幕信息进行标注,以时间戳为标注信息。
3、把每一条弹幕信息分别进行文字语音转换,可以通过SAPI5、DeepSpeech2、Wav2Letter等语音识别引擎将文字转为语音;
4、根据标注的时间戳按序生成本地语音文件。
步骤四、按需读取文件并进行语音播报,具体如图5所示:
1、当语音目录不为空或者每当有语音文件生成时扫描本地语音文件,根据步骤三中标注的顺序播放语音文件;
2、播放后根据标注对播报后的语音文件进行删除;
3、再次执行1,重新扫描本地语音文件。
步骤五、通过数据挖掘算法对存储数据进行分析,具体如图6所示。
1、提取出指定时间段的弹幕数据;
2、通过词频统计和分组统计分析用户画像和直播热点;
其中词频统计具体方法为:先通过jieba进行文本分词,然后通过文本遍历提取出现次数较多的词汇,最后通过 TF/IDF算法计算出现次数较多词汇的词频。词频越高和直播内容的相关性越高,也越能突出用户喜好和热点信息。
其中直播弹幕词频计算公式为:
式中:KW为待计算词频的词汇;WN为某段直播弹幕中KW出现的次数;WA为某段直播弹幕的总词数;DA为总直播数;ZN为出现KW的直播数;WF为词频。
分组统计具体方法为:根据时间戳对每分钟内的弹幕数量进行分组统计,统计出数量最多的分组中出现的弹幕词汇,然后将其和词频统计中计算的词汇和词频进行匹配,得出直播中的热点词汇,即直播热点。
3、舆情演化分析
(1)通过AdaBoost算法对每条弹幕进行情绪分类,根据直播特征归为like(喜欢)、hate(厌恶)、sorrow(悲伤)、quiet(宁静)四类情绪;
(2)将情绪分类结果按照时间形成时间序列,时间序列可以直观的查看到在不同时间节点中用户对直播状态的舆情演化。
(3)通过LSTM模型进行时间序列预测,预测下段直播中舆情演化趋势较大的时间段,根据预测结果可让从业人员提前制定运行策略和优化直播效果。
Claims (4)
1.一种基于爬虫的弹幕播报分析方法,其特征在于:包括以下步骤:
步骤一、选择直播平台,准备抓包工具,打开平台网页或APP向直播源发起请求,查看弹幕数据的响应内容,从数据包提取出消息传输协议类型;
步骤二、通过爬虫采集弹幕并将数据推送至消息列队,具体步骤为:
(1)先创建一个消息队列接收和推送弹幕数据;
(2)根据获得的数据包信息,通过编程语言构建出相同的请求报文;
(3)通过编程语言的请求库向服务端发起模拟请求;
(4)接收服务端返回的响应信息,构建解析规则从中提取出每一条弹幕文字信息;
(5)将每一条弹幕推送到消息队列中,等待服务端接收;
步骤三、本地轮询接收消息队列数据并进行语音转换和存储,具体步骤为:
(1)在本地创建一个接收消息队列中数据的服务;
(2)等待消息队列推送数据,对接收到的弹幕数据进行清洗并标注上当前时间戳,标注后的数据存储到数据库中等待后续分析;
(3)把每一条弹幕信息分别进行文字语音转换;
(4)根据标注的时间戳按序生成本地语音文件;
步骤四、按需读取文件并进行语音播报;其中读取文件并进行语音播报的规则是:当语音目录不为空或者每当有语音文件生成时扫描本地语音文件,根据标注的顺序播放语音文件,播放后根据标注对播报后的语音文件进行删除;
步骤五、提取出指定时间段的弹幕数据,通过数据挖掘算法对用户画像、直播热点以及舆情演化进行分析;具体的:
通过词频统计和分组统计分析用户画像和直播热点;其中词频统计方法为:先通过jieba进行文本分词,然后通过文本遍历提取出现次数较多的词汇,最后通过 TF/IDF算法计算出现次数较多词汇的词频
其中,当 KW 为待计算词频的词汇时,WN为某段直播弹幕中KW出现的次数,WA为某段直播弹幕的总词数,DA为总直播数,ZN为出现KW的直播数,WF为词频;
分组统计方法为:根据时间戳对每分钟内的弹幕数量进行分组统计,统计出数量最多的分组中出现的弹幕词汇,然后将其和词频统计中计算的词汇和词频进行匹配,得出直播中的热点词汇即为直播热点;
通过AdaBoost算法对每条弹幕进行情绪分类,将情绪分类结果按照时间形成时间序列来直观的查看在不同时间节点中用户对直播状态的舆情演化,然后通过LSTM模型进行时间序列预测,预测下段直播中舆情演化趋势较大的时间段,根据预测结果可让从业人员提前制定运行策略和优化直播效果。
2.根据权利要求1所述的基于爬虫的弹幕播报分析方法,其特征在于:步骤二中的步骤(2)中所述编程语言为Python语言、java语言、go语言的任一种,其中Python语言使用requests请求库,java语言使用httpclient请求库,go语言使用req请求库。
3.根据权利要求1所述的基于爬虫的弹幕播报分析方法,其特征在于:步骤三中的步骤(2)中对弹幕数据进行清洗是根据自定义的风险词典,过滤掉包含风险词汇的弹幕;同时根据清洗规则过滤掉一些噪音数据。
4.根据权利要求1所述的基于爬虫的弹幕播报分析方法,其特征在于:步骤三中的步骤(2)中对弹幕数据进行标注是根据消息队列的推送时间对弹幕信息进行标注,以时间戳为标注信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210250170.XA CN114598899B (zh) | 2022-03-15 | 2022-03-15 | 一种基于爬虫的弹幕播报分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210250170.XA CN114598899B (zh) | 2022-03-15 | 2022-03-15 | 一种基于爬虫的弹幕播报分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114598899A CN114598899A (zh) | 2022-06-07 |
CN114598899B true CN114598899B (zh) | 2023-06-16 |
Family
ID=81816715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210250170.XA Active CN114598899B (zh) | 2022-03-15 | 2022-03-15 | 一种基于爬虫的弹幕播报分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114598899B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116567341B (zh) * | 2023-07-11 | 2023-10-10 | 奥视(天津)科技有限公司 | 一种基于golang的高并发信号处理平台 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105959810A (zh) * | 2016-04-19 | 2016-09-21 | 乐视控股(北京)有限公司 | 一种弹幕的生成方法和装置、服务器 |
CN106878823A (zh) * | 2016-12-29 | 2017-06-20 | 武汉斗鱼网络科技有限公司 | 一种过滤文字弹幕并转换为语音弹幕的方法及系统 |
CN106960042A (zh) * | 2017-03-29 | 2017-07-18 | 中国科学技术大学苏州研究院 | 基于弹幕语义分析的网络直播监督方法 |
CN108965916B (zh) * | 2017-05-25 | 2021-05-25 | 腾讯科技(深圳)有限公司 | 一种直播视频评估的方法、模型建立的方法、装置及设备 |
CN108401175B (zh) * | 2017-12-20 | 2020-03-06 | 广州虎牙信息科技有限公司 | 一种弹幕消息的处理方法、装置、存储介质及电子设备 |
CN109168051B (zh) * | 2018-09-11 | 2021-02-09 | 天津理工大学 | 一种基于蓝光存储的网络直播平台监管取证系统 |
CN109918656B (zh) * | 2019-02-28 | 2022-12-23 | 武汉斗鱼鱼乐网络科技有限公司 | 一种直播热点获取方法、装置、服务器及存储介质 |
CN110020437B (zh) * | 2019-04-11 | 2023-04-07 | 江南大学 | 一种视频和弹幕相结合的情感分析及可视化方法 |
-
2022
- 2022-03-15 CN CN202210250170.XA patent/CN114598899B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114598899A (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
CN108694236B (zh) | 视频数据处理方法、装置及电子设备 | |
CN110149361B (zh) | 一种互联网业务操作过程回溯方法、系统以及装置 | |
US8566880B2 (en) | Device and method for providing a television sequence using database and user inputs | |
CN111817943A (zh) | 一种基于即时通讯应用的数据处理方法和装置 | |
CN113486833B (zh) | 多模态特征提取模型训练方法、装置、电子设备 | |
CN114598899B (zh) | 一种基于爬虫的弹幕播报分析方法 | |
CN110377908B (zh) | 语义理解方法、装置、设备及可读存储介质 | |
CN104050221A (zh) | 用于在虚拟会议中自动记笔记的方法和系统 | |
CN108419138A (zh) | 直播互动装置、方法及计算机可读存储介质 | |
CN109918656B (zh) | 一种直播热点获取方法、装置、服务器及存储介质 | |
CN110414404A (zh) | 基于即时通讯的图像数据处理方法、装置以及存储介质 | |
CN104615627B (zh) | 一种基于微博平台的事件舆情信息提取方法及系统 | |
CN110166811B (zh) | 弹幕信息的处理方法、装置及设备 | |
CN111372116B (zh) | 视频播放提示信息处理方法、装置、电子设备及存储介质 | |
CN107229710A (zh) | 一种基于局部特征描述符的视频分析方法 | |
CN102084645A (zh) | 关联场景赋予装置以及关联场景赋予方法 | |
EP4209929A1 (en) | Video title generation method and apparatus, electronic device and storage medium | |
CN106407287A (zh) | 一种推送多媒体资源的方法及系统 | |
CN111488813B (zh) | 视频的情感标注方法、装置、电子设备及存储介质 | |
KR20190118904A (ko) | 영상 분석 기반 토픽 모델링 영상 검색 시스템 및 방법 | |
JP2014153977A (ja) | コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム | |
CN106372083B (zh) | 一种有争议性新闻线索自动发现的方法及系统 | |
CN104901939A (zh) | 多媒体文件播放方法和终端及服务器 | |
CN112764988B (zh) | 一种数据分段采集方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
OL01 | Intention to license declared | ||
OL01 | Intention to license declared |