CN113051484A - 确定热点社交类信息的方法及装置 - Google Patents
确定热点社交类信息的方法及装置 Download PDFInfo
- Publication number
- CN113051484A CN113051484A CN201911382122.0A CN201911382122A CN113051484A CN 113051484 A CN113051484 A CN 113051484A CN 201911382122 A CN201911382122 A CN 201911382122A CN 113051484 A CN113051484 A CN 113051484A
- Authority
- CN
- China
- Prior art keywords
- social information
- target
- increment
- information
- target social
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000003993 interaction Effects 0.000 claims abstract description 152
- 238000012549 training Methods 0.000 claims description 55
- 238000004422 calculation algorithm Methods 0.000 claims description 54
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000003066 decision tree Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 abstract description 7
- 238000012552 review Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种确定热点社交类信息的方法及装置,涉及数据处理技术领域,其目的在于提高确定社交类信息是否为热点社交类信息的准确率。本发明的方法包括:获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数;根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值;获取多个参考社交类信息,并对多个目标社交类信息与多个参考社交类信息进行聚类处理,以获得每个目标社交类信息对应的话题参数;根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个目标社交类信息是否为热点社交类信息。本发明适用于确定社交类信息是否为热点社交类信息的过程中。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种确定热点社交类信息的方法及装置。
背景技术
随着互联网技术的日益发展,新浪微博、微信、知乎、百度贴吧等社交类应用已经成为人们日常生活中不可或缺的一部分,人们随时随地都可以通过发表微博、文章、帖子、短视频等社交类信息来分享自己的生活、表达自己的观点。当某个社交类信息在短时间内被大量点赞、转发及评论时,该社交类信息极大可能与某个突发热点事件相关;由于,提前预测突发热点事件,不仅能够预防重大安全事件发生,在某些商业场景下还能带来高额的收益,因此,如何从大量社交类信息中找出热点社交类信息,从而根据热点社交类信息预测突发热点事件是至关重要的。
目前,通常是通过判断某个社交类信息在预设时段内的点赞增量、评论增量或转发增量是否大于预设阈值,来确定该社交类信息是否为热点社交类信息。然而,当某个社交账号具有大量粉丝时,即使是该社交账号发表的社交类信息与突发热点事件无关,该社交类信息也会在短时间内被大量点赞、转发及评论,从而被认定为热点社交类信息;而当某个社交账号只有很少的粉丝时,即使是该社交账号发表的社交类信息与突发热点事件有关,该社交类信息也不会被认定为热点社交类信息。因此,通过判断某个社交类信息在预设时段内的点赞增量、评论增量或转发增量是否大于预设阈值,来确定该社交类信息是否为热点社交类信息的准确率较差。
发明内容
有鉴于此,本发明提供一种确定热点社交类信息的方法及装置,主要目的在于提高确定社交类信息是否为热点社交类信息的准确率。
为了解决上述问题,本发明主要提供如下技术方案:
第一方面,本发明提供了一种确定热点社交类信息的方法,该方法包括:
获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
获取多个参考社交类信息,并对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
可选的,所述目标社交类信息对应的互动指标值包括:所述目标社交类信息对应的价值度值和增长度值;所述目标社交类信息对应的互动参数包括:所述目标社交类信息对应的点赞数、评论数、转发数、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度;所述根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值,包括:
对每个所述目标社交类信息对应的点赞数、评论数及转发数进行求和计算,以获得每个所述目标社交类信息对应的互动热度;
分别将每个所述目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法,计算每个所述目标社交类信息对应的价值度值;
分别将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法,计算每个所述目标社交类信息对应的增长度值。
可选的,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取每个所述目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量;
分别将每个所述目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,计算每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量;
获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量,其中,所述目标社交类信息对应的多个历史社交类信息为所述目标社交类信息所属账号在历史时段内发表的多个社交类信息;
根据每个所述目标社交类信息对应的多个历史点赞数、多个历史评论数及多个历史转发数,计算每个所述目标社交类信息对应的历史总点赞数、历史总评论数及历史总转发数;
分别将每个所述目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个所述目标社交类信息对应的账号热度;
分别对每个所述目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量、多个第一预设时段评论增量和多个第二预设时段评论增量及多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,以获得每个所述目标社交类信息对应的目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量;
将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储;
在所述获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量之后,还包括:
按照预设规则去除多个所述历史社交类信息中的异常历史社交类信息。
可选的,所述对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数,包括:
分别提取每个所述目标社交类信息对应的关键词和每个所述参考社交类信息对应的关键词;
获取多组第一关键词和第二关键词,其中,所述第一关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,所述第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词;
按照预设相似度算法计算每组所述第一关键词和第二关键词之间的相似度值,以获得多个相似度值;
当任意一个所述相似度值大于预设阈值时,将所述相似度值对应的两个社交类信息划分为同一分组,以获得多个分组,所述两个社交类信息为两个目标社交类信息,或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息;
将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,以获得多个话题;
在多个所述话题中提取每个所述目标社交类信息对应的话题参数。
可选的,所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息,包括:
将每个所述目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,以获得每个所述目标社交类信息对应的热点判断结果;
根据每个所述目标社交类信息对应的热点判断结果,确定每个所述目标社交类信息是否为热点社交类信息。
可选的,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取多个训练社交类信息以及每个所述训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果;
根据预设决策树算法建立所述热点判断模型;
将每个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个所述训练社交类信息对应的热点判断结果作为输出,对所述热点判断模型进行训练;
当将任意一个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,所述热点判断模型准确输出所述训练社交类信息对应的热点判断结果时,停止对所述热点判断模型的训练。
可选的,所述目标社交类信息对应的内容参数包括:所述目标社交类信息中的图片数量、所述目标社交类信息中的URL数量;所述目标社交类信息对应的话题参数包括:所述目标社交类信息在其所属话题内的发表顺序号;在所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息之后,所述方法还包括:
分别将每个所述热点社交类信息对应的价值度值、发表顺序号、图片数量和URL数量代入第五预设算法,计算每个所述热点社交类信息对应的热度值;
根据每个所述热点社交类信息对应的热度值,对多个所述热点社交类信息进行降序排列;
将排序后的前N个所述热点社交内容对应的话题,确定为热点话题;
将排序后的多个所述热点社交类信息和多个所述热点话题进行输出显示。
第二方面,本发明还提供一种确定热点社交类信息的装置,该装置包括:
第一获取单元,用于获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
第一计算单元,用于根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
第二获取单元,用于获取多个参考社交类信息;
聚类单元,用于对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
第一确定单元,用于根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
可选的,所述目标社交类信息对应的互动指标值包括:所述目标社交类信息对应的价值度值和增长度值;所述目标社交类信息对应的互动参数包括:所述目标社交类信息对应的点赞数、评论数、转发数、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度;所述第一计算单元包括:
第一计算模块,用于对每个所述目标社交类信息对应的点赞数、评论数及转发数进行求和计算,以获得每个所述目标社交类信息对应的互动热度;
第二计算模块,用于分别将每个所述目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法,计算每个所述目标社交类信息对应的价值度值;
第三计算模块,用于分别将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法,计算每个所述目标社交类信息对应的增长度值。
可选的,所述装置还包括:
第三获取单元,用于在所述第一获取单元获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,获取每个所述目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量;
第二计算单元,用于分别将每个所述目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,计算每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量;
第四获取单元,用于获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量,其中,所述目标社交类信息对应的多个历史社交类信息为所述目标社交类信息所属账号在历史时段内发表的多个社交类信息;
第三计算单元,用于根据每个所述目标社交类信息对应的多个历史点赞数、多个历史评论数及多个历史转发数,计算每个所述目标社交类信息对应的历史总点赞数、历史总评论数及历史总转发数;
第四计算单元,用于分别将每个所述目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个所述目标社交类信息对应的账号热度;
第五计算单元,用于分别对每个所述目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量、多个第一预设时段评论增量和多个第二预设时段评论增量及多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,以获得每个所述目标社交类信息对应的目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量;
存储单元,用于将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储;
去除单元,用于在所述第四获取单元获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量之后,按照预设规则去除多个所述历史社交类信息中的异常历史社交类信息。
可选的,所述聚类单元包括:
第一提取模块,用于分别提取每个所述目标社交类信息对应的关键词和每个所述参考社交类信息对应的关键词;
获取模块,用于获取多组第一关键词和第二关键词,其中,所述第一关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,所述第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词;
第四计算模块,用于按照预设相似度算法计算每组所述第一关键词和第二关键词之间的相似度值,以获得多个相似度值;
第一划分模块,用于当任意一个所述相似度值大于预设阈值时,将所述相似度值对应的两个社交类信息划分为同一分组,以获得多个分组,所述两个社交类信息为两个目标社交类信息,或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息;
第二划分模块,用于将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,以获得多个话题;
第二提取模块,用于在多个所述话题中提取每个所述目标社交类信息对应的话题参数。
可选的,所述第一确定单元包括:
输入模块,用于将每个所述目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,以获得每个所述目标社交类信息对应的热点判断结果;
确定模块,用于根据每个所述目标社交类信息对应的热点判断结果,确定每个所述目标社交类信息是否为热点社交类信息。
可选的,所述装置还包括:
第五获取单元,用于在所述第一获取单元获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,获取多个训练社交类信息以及每个所述训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果;
建立单元,用于根据预设决策树算法建立所述热点判断模型;
训练单元,用于将每个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个所述训练社交类信息对应的热点判断结果作为输出,对所述热点判断模型进行训练;
停止单元,用于当将任意一个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,所述热点判断模型准确输出所述训练社交类信息对应的热点判断结果时,停止对所述热点判断模型的训练。
可选的,所述目标社交类信息对应的内容参数包括:所述目标社交类信息中的图片数量、所述目标社交类信息中的URL数量;所述目标社交类信息对应的话题参数包括:所述目标社交类信息在其所属话题内的发表顺序号;所述装置还包括:
第六计算单元,用于在所述第一确定单元根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息之后,分别将每个所述热点社交类信息对应的价值度值、发表顺序号、图片数量和URL数量代入第五预设算法,计算每个所述热点社交类信息对应的热度值;
排序单元,用于根据每个所述热点社交类信息对应的热度值,对多个所述热点社交类信息进行降序排列;
第二确定单元,用于将排序后的前N个所述热点社交内容对应的话题,确定为热点话题;
输出单元,用于将排序后的多个所述热点社交类信息和多个所述热点话题进行输出显示。
为了实现上述目的,根据本发明的第三方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述第一方面所述的确定热点社交类信息的方法。
为了实现上述目的,根据本发明的第四方面,提供了一种电子设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述第一方面所述的确定热点社交类信息的方法。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的一种确定热点社交类信息的方法及装置,与现有技术中,通过判断某个社交类信息在预设时段内的点赞增量、评论增量或转发增量是否大于预设阈值,来确定该社交类信息是否为热点社交类信息,本发明能够在热点确定应用程序获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数后,由热点确定应用程序根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值,并在获取得到多个参考社交类信息后,对多个目标社交类信息与多个参考社交类信息进行聚类处理,从而将多个目标社交类信息和多个参考社交类信息聚类为多个话题,再从多个话题中提取每个目标社交类信息对应的话题参数,最终根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定各个目标社交类信息是否为热点社交类信息。由于,在本发明中是,基于社交类信息对应的互动参数、内容参数和话题参数,确定社交类信息是否为热点社交类信息,而并非是仅根据社交类信息对应的互动参数,确定社交类信息是否为热点社交类信息,因此,能够有效提高确定社交类信息是否为热点社交类信息的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种确定热点社交类信息的方法流程图;
图2示出了本发明实施例提供的另一种确定热点社交类信息的方法流程图;
图3示出了本发明实施例提供的一种确定热点社交类信息的装置的组成框图;
图4示出了本发明实施例提供的另一种确定热点社交类信息的装置的组成框图;
图5示出了本发明实施例提供的一种设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种确定热点社交类信息的方法,如图1所示,该方法包括:
101、获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数。
其中,目标社交类信息可以但不限于为:微博、文章、帖子或短视频等;目标社交类信息为发表时间处于设定时段内的社交类信息,设定时段可以但不限于为“当前时间前6小时-当前时间”、“当前时间前9小时-当前时间”、“当前时间前12小时-当前时间”等等,例如,当设定时段为“当前时间前6小时-当前时间”,当前时间为2019年12月23日12:00时,多个目标社交类信息为发表时间处于“2019年12月23日6:00-2019年12月23日12:00”内的社交类信息。
在本发明实施例中,各个步骤中的执行主体为运行在终端设备中的热点确定应用程序,其中,终端设备可以但不限于为:计算机、智能手机、平板电脑等等。在本发明实施例中,热点确定应用程序首先需要获取多个满足要求的目标社交类信息(即发表时间处于设定时段内的社交类信息)以及每个目标社交类信息对应的互动参数和内容参数,以便后续基于每个目标社交类信息对应的互动参数和内容参数,确定各个目标社交类信息是否为热点社交类信息。
需要进行说明的是,在实际应用过程中,当设定时段为“当前时间前6小时-当前时间”时,热点确定应用程序可以每间隔6小时,执行一次获取多个目标社交类信息,并确定各个目标社交类信息是否为热点社交类信息的操作;当设定时段为“当前时间前9小时-当前时间”时,热点确定应用程序可以每间隔9小时,执行一次获取多个目标社交类信息,并确定各个目标社交类信息是否为热点社交类信息的操作;当设定时段为“当前时间前12小时-当前时间”时,热点确定应用程序可以每间隔12小时,执行一次获取多个目标社交类信息,并确定各个目标社交类信息是否为热点社交类信息的操作等等;也可以在接收到用户发送的查询请求时,执行获取多个目标社交类信息,并确定各个目标社交类信息是否为热点社交类信息的操作,本发明实施例对此不进行具体限定。
102、根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值。
其中,目标社交类信息对应的互动指标值可以但不限于包括:目标社交类信息对应的价值度值和增长度值;其中,目标社交类信息对应的价值度值用于表明目标社交类信息所具有的价值,目标社交类信息对应的增长度值用于表明目标社交类信息在目标时段内点赞数、评论数和转发数的增长情况。
在本发明实施例中,热点确定应用程序在获取得到多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数后,需要根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值。
具体的,在本步骤中,热点确定应用程序可以将每个目标社交类信息对应的、各个类别的互动参数代入预设算法中,从而计算每个目标社交类信息对应的互动指标值,但不限于此。
103、获取多个参考社交类信息,并对多个目标社交类信息与多个参考社交类信息进行聚类处理,以获得每个目标社交类信息对应的话题参数。
其中,参考社交类信息为发表时间处于参考时段内、除目标社交类信息以外的社交类信息,参考时段可以但不限于为“当前时间前24小时-当前时间”、“当前时间前48小时-当前时间”、“当前时间前72小时-当前时间”等等。
在本发明实施例中,热点确定应用程序在根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值后,还需要获取多个满足要求的参考社交类信息(即发表时间处于参考时段内、除目标社交类信息以外的社交类信息),并对多个目标社交类信息与多个参考社交类信息进行聚类处理,将多个目标社交类信息和多个参考社交类信息聚类为多个话题,再从多个话题中提取每个目标社交类信息对应的话题参数:目标社交类信息在所属话题内的发表顺序号、目标社交类信息所属话题内包含的社交类信息(目标社交类信息和参考社交类信息)的数量、目标社交类信息所属话题内多个社交类信息对应的最高增长度值(多个增长度值中的最大值)、目标社交类信息所属话题内多个社交类信息对应的总价值度值等等。
104、根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个目标社交类信息是否为热点社交类信息。
在本发明实施例中,热点确定应用程序在经过步骤101-步骤103获取得到每个目标社交类信息对应的互动指标值、内容参数和话题参数后,便可根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定各个目标社交类信息是否为热点社交类信息。
本发明实施例提供的一种确定热点社交类信息的方法,与现有技术中,通过判断某个社交类信息在预设时段内的点赞增量、评论增量或转发增量是否大于预设阈值,来确定该社交类信息是否为热点社交类信息,本发明实施例能够在热点确定应用程序获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数后,由热点确定应用程序根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值,并在获取得到多个参考社交类信息后,对多个目标社交类信息与多个参考社交类信息进行聚类处理,从而将多个目标社交类信息和多个参考社交类信息聚类为多个话题,再从多个话题中提取每个目标社交类信息对应的话题参数,最终根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定各个目标社交类信息是否为热点社交类信息。由于,在本发明实施例中是,基于社交类信息对应的互动参数、内容参数和话题参数,确定社交类信息是否为热点社交类信息,而并非是仅根据社交类信息对应的互动参数,确定社交类信息是否为热点社交类信息,因此,能够有效提高确定社交类信息是否为热点社交类信息的准确率。
以下为了更加详细地说明,本发明实施例提供了另一种确定热点社交类信息的方法,具体如图2所示,该方法包括:
201、获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数。
其中,关于步骤201、获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数,可以参考图1对应部分的描述,本发明实施例此处将不再赘述。
202、根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值。
其中,目标社交类信息对应的互动参数包括:目标社交类信息对应的点赞数(即当前时间的总点赞数)、评论数(即当前时间的总评论数)、转发数(即当前时间的总转发数)、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度等等;目标社交类信息对应的内容参数可以但不限于包括:目标社交类信息中的图片数量、目标社交类信息中的URL数量等。
在本发明实施例中,热点确定应用程序在获取得到多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数后,需要根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值。以下将对热点确定应用程序如何根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值进行详细说明。
(1)对每个目标社交类信息对应的点赞数、评论数及转发数进行求和计算,从而计算获得每个目标社交类信息对应的互动热度。
(2)分别将每个目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法中,从而计算每个目标社交类信息对应的价值度值,其中,第一预设算法具体如下:
Xi=(0.2*Ai/Bi+0.25*10*Ci/Ai+0.45*10*Di/Ai+0.1*10*Ei/Ai)*Ai
其中,Xi为第i个目标社交类信息对应的价值度值、Ai为第i个目标社交类信息对应的互动热度、Bi为第i个目标社交类信息对应的粉丝数、Ci为第i个目标社交类信息对应的转发数、Di为第i个目标社交类信息对应的评论数、Ei为第i个目标社交类信息对应的点赞数。
(3)分别将每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法中,从而计算每个目标社交类信息对应的增长度值,其中,目标时段可以但不限于为“当前时间最近半点时间前1小时-当前时间最近半点时间”、“当前时间最近半点时间前2小时-当前时间最近半点时间”等,例如,当前时间为2019年12月23日12:05,目标时段“当前时间最近半点时间前1小时-当前时间最近半点时间”具体为:“2019年12月23日11:00-2019年12月23日12:00”;第二预设算法具体如下:
Yi=(0.4*ai/bi+0.5*ci/di+0.1*ei/fi)*gi
其中,Yi为第i个目标社交类信息对应的增长度值、ai为第i个目标社交类信息对应的目标时段转发增长量、bi为第i个目标社交类信息对应的目标时段转发基准增量、ci为第i个目标社交类信息对应的目标时段评论增长量、di为第i个目标社交类信息对应的目标时段评论基准增量、ei为第i个目标社交类信息对应的目标时段点赞增长量、fi为第i个目标社交类信息对应的目标时段点赞基准增量、gi为第i个目标社交类信息对应的账号热度。
进一步的,在本发明实施例中,为了保证在计算每个目标社交类信息对应的增长度值时,能够直接获取得到每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度,热点确定应用程序需要预先计算每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度:
(1)获取每个目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量。
其中,当目标时段为“当前时间最近半点时间前1小时-当前时间最近半点时间”时,第一时段为“当前时间最近半点时间前1小时-当前时间最近半点时间前30分钟”,第二时段为“当前时间最近半点时间前30分钟-当前时间最近半点时间”;当目标时段为“当前时间最近半点时间前2小时-当前时间最近半点时间”时,第一时段为“当前时间最近半点时间前2小时-当前时间最近半点时间前1小时”,第二时段为“当前时间最近半点时间前1小时-当前时间最近半点时间”,但不限于此。
(2)分别将每个目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,从而计算每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量,其中,第三预设算法具体如下:
Mi=2K*(Ai+Bi) K=(Ai-Bi)/[(Ai+Bi)/2]
其中,当Ai为第i个目标社交类信息对应的第二时段点赞增量,Bi为第i个目标社交类信息对应的第一时段点赞增量时,Mi为第i个目标社交类信息对应的目标时段点赞增长量;当Ai为第i个目标社交类信息对应的第二时段评论增量,Bi为第i个目标社交类信息对应的第一时段评论增量时,Mi为第i个目标社交类信息对应的目标时段评论增长量;当Ai为第i个目标社交类信息对应的第二时段转发增量,Bi为第i个目标社交类信息对应的第一时段转发增量时,Mi为第i个目标社交类信息对应的目标时段转发增长量。
(3)获取每个目标社交类信息对应的多个历史社交类信息以及每个历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量。
其中,目标社交类信息对应的多个历史社交类信息为目标社交类信息所属账号在历史时段内发表的多个社交类信息,历史时段可以但不限于为:当前日期的前1个自然月,当前日期的前2个自然月等;历史社交类信息对应的历史点赞数、历史评论数和历史转发数为历史社交类信息在历史时段内的点赞数、评论数和转发数;第一预设时段为历史时段内每一天中对应第一时段的时段,例如,当第一时段为“2019年12月23日11:00-2019年12月23日11:30”,历史时段为2019年11月时,第一预设时段为“2019年11月01日11:00-2019年11月01日11:30”、“2019年11月02日11:00-2019年11月02日11:30”…“2019年11月30日11:00-2019年11月30日11:30”;第二预设时段为历史时段内每一天中对应第二时段的时段,例如,当第二时段为“2019年12月23日11:30-2019年12月23日12:00”,历史时段为2019年11月时,第二预设时段为“2019年11月01日11:30-2019年11月01日12:00”、“2019年11月02日11:30-2019年11月02日12:00”…“2019年11月30日11:30-2019年11月30日12:00”;历史社交类信息对应的第一预设时段点赞增量为历史社交类信息在历史时段内每一天的第一预设时段中的点赞增量的总和、历史社交类信息对应的第二预设时段点赞增量为历史社交类信息在历史时段内每一天的第二预设时段中的点赞增量的总和、历史社交类信息对应的第一预设时段评论增量为历史社交类信息在历史时段内每一天的第一预设时段中的评论增量的总和、历史社交类信息对应的第二预设时段评论增量为历史社交类信息在历史时段内每一天的第二预设时段中的评论增量的总和、历史社交类信息对应的第一预设时段转发增量为历史社交类信息在历史时段内每一天的第一预设时段中的转发增量的总和、历史社交类信息对应的第二预设时段转发增量为历史社交类信息在历史时段内每一天的第二预设时段中的转发增量的总和。
需要进行说明的是,在实际应用过程中,在获取得到每个目标社交类信息对应的多个历史社交类信息后,热点确定应用程序可以按照预设规则去除每个目标社交类信息对应的多个历史社交类信息中的异常历史社交类信息,其中,预设规则具体可以为:1、去除历史转发数+历史评论数小于阈值的历史社交类信息;2、去除历史转发数和历史点赞数为零的历史社交类信息;3、去除历史转发数+历史评论数+历史点赞数排名前X的历史社交类信息,X为正整数,但不限于此。
(4)分别对每个目标社交类信息对应的多个历史社交类信息的历史点赞数进行求和计算,从而计算获得每个目标社交类信息对应的历史总点赞数;分别对每个目标社交类信息对应的多个历史社交类信息的历史评论数进行求和计算,从而计算获得每个目标社交类信息对应的历史总评论数;分别对每个目标社交类信息对应的多个历史社交类信息的历史转发数进行求和计算,从而计算获得每个目标社交类信息对应的历史总转发数。
(5)分别将每个目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个目标社交类信息对应的账号热度,其中,第四预设算法具体如下:
Ni=(0.3*Ai+0.5*Bi+0.2*Ci)/Di
其中,Ni为第i个目标社交类信息对应的账号热度、Ai为第i个目标社交类信息对应的历史总转发数、Bi为第i个目标社交类信息对应的历史总评论数、Ci为第i个目标社交类信息对应的历史总点赞数、Di为第i个目标社交类信息对应的多个历史社交类信息的数量。
(6)分别对每个目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量进行求和计算,从而计算获得每个目标社交类信息对应的目标时段点赞基准增量;分别对每个目标社交类信息对应的多个第一预设时段评论增量和多个第二预设时段评论增量进行求和计算,从而计算获得每个目标社交类信息对应的目标时段评论基准增量;分别对每个目标社交类信息对应的多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,从而计算获得每个目标社交类信息对应的目标时段转发基准增量。
(7)将每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储,以便在计算每个目标社交类信息对应的增长度值时,能够直接获取得到每个目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度。
203、获取多个参考社交类信息,并对多个目标社交类信息与多个参考社交类信息进行聚类处理,以获得每个目标社交类信息对应的话题参数。
在本发明实施例中,热点确定应用程序在根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值后,还需要获取多个满足要求的参考社交类信息,并对多个目标社交类信息与多个参考社交类信息进行聚类处理,将多个目标社交类信息和多个参考社交类信息聚类为多个话题,再从多个话题中提取每个目标社交类信息对应的话题参数。以下将对热点确定应用程序如何对多个目标社交类信息与多个参考社交类信息进行聚类处理,从而获得每个目标社交类信息对应的话题参数进行详细说明。
(1)分别提取每个目标社交类信息对应的关键词和每个参考社交类信息对应的关键词。
需要进行说明的是,在实际应用过程中,在分别提取每个目标社交类信息对应的关键词和每个参考社交类信息对应的关键词之前,还需要分别对每个目标社交类信息和每个参考社交类信息进行去噪处理、去停用词处理以及分词处理。
(2)获取多组第一关键词和第二关键词,其中,第一关键词为任意一个目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词。
(3)按照预设相似度算法计算每组第一关键词和第二关键词之间的相似度值,从而获取得到多个相似度值。
其中,预设相似度算法可以但不限于为:SimHash算法、Jaccard算法、余弦距离算法等。
(4)当多个相似度值中的任意一个相似度值大于预设阈值时,将该相似度值对应的两个目标社交类信息(或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息)划分为同一分组,从而获得多个分组;
(5)将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,从而获得多个话题,此时,便可在多个话题中提取每个目标社交类信息对应的话题参数:目标社交类信息在所属话题内的发表顺序号、目标社交类信息所属话题内包含的社交类信息(目标社交类信息和参考社交类信息)的数量、目标社交类信息所属话题内多个社交类信息对应的最高增长度值(多个增长度值中的最大值)、目标社交类信息所属话题内多个社交类信息对应的总价值度值等等。
204、根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个目标社交类信息是否为热点社交类信息。
在本发明实施例中,热点确定应用程序在经过步骤201-步骤203获取得到每个目标社交类信息对应的互动指标值、内容参数和话题参数后,便可分别将每个目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,热点判断模型根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,便能输出每个目标社交类信息对应的热点判断结果,此时,热点确定应用程序便能获取得到每个目标社交类信息对应的热点判断结果,根据每个目标社交类信息对应的热点判断结果,便能确定各个目标社交类信息是否为热点社交类信息;其中,目标社交类信息对应的热点判断结果用于表明该目标社交类信息是否为热点社交类信息。
进一步的,在本发明实施例中,为了保证热点确定应用程序能够根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,准确确定各个目标社交类信息是否为热点社交类信息,热点确定应用程序需要预先建立并训练热点判断模型:
(1)获取多个训练社交类信息以及每个训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果。
(2)根据预设决策树算法建立热点判断模型。
其中,预设决策树算法可以为任意一种现有的决策树算法,本发明实施例中对此不进行限定。
(3)将每个训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个训练社交类信息对应的热点判断结果作为输出,对热点判断模型进行训练。
在本发明实施例中,由于,已知任意一个训练社交类信息对应的互动指标值、内容参数和话题参数与该训练社交类信息对应的热点判断结果之间的对应关系,即已知将某个训练社交类信息对应的互动指标值、内容参数和话题参数作为输入时,热点判断模型应该将怎样的热点判断结果输出,因此,将任意一个训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将该训练社交类信息对应的热点判断结果作为输出,根据该训练社交类信息对应的互动指标值、内容参数和话题参数与该训练社交类信息对应的热点判断结果之间的对应关系,对热点判断模型中的参数不断的优化、调整,便能达到对热点判断模型进行训练的效果。
(4)当将任意一个训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,热点判断模型能够准确输出该训练社交类信息对应的热点判断结果时,便可停止对热点判断模型的训练,此时,热点判断模型训练完毕。
205、根据多个热点社交类信息确定多个热点话题,并将多个热点社交类信息和多个热点话题进行输出显示。
其中,目标社交类信息对应的内容参数包括:目标社交类信息中的图片数量、目标社交类信息中的URL数量。
在本发明实施例中,热点确定应用程序在根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定各个目标社交类信息是否为热点社交类信息后,便能获取得到多个热点社交类信息,此时,根据多个热点社交类信息确定多个热点话题:
(1)分别将每个热点社交类信息对应的价值度值、发表顺序号(即热点社交类信息在其所属话题内的发表顺序号)、图片数量和URL数量代入第五预设算法,计算每个热点社交类信息对应的热度值,其中,第五预设算法具体如下:
Pi=exi/(1+exi)
xi=-3.18491+0.15161*Ai-0.46466*Bi+0.12512*Ci+0.54097*Di
其中,Pi为第i个热点社交类信息对应的热度值、Ai为第i个热点社交类信息对应的价值度值、Bi为第i个热点社交类信息对应的发表顺序号、Ci为第i个热点社交类信息对应的图片数量、Di为第i个热点社交类信息对应的URL数量;
(2)根据每个热点社交类信息对应的热度值,对多个热点社交类信息进行降序排列,将排序后的前N个热点社交内容对应的话题,确定为热点话题,其中,N为正整数;
此时,热点确定应用程序便可将排序后的多个热点社交类信息和多个热点话题进行输出显示。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的确定热点社交类信息的方法。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种电子设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述所述的确定热点社交类信息的方法。
进一步的,作为对上述图1及图2所示方法的实现,本发明另一实施例还提供了一种确定热点社交类信息的装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置应用于提高确定社交类信息是否为热点社交类信息的准确率,具体如图3所示,该装置包括:
第一获取单元301,用于获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
第一计算单元302,用于根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
第二获取单元303,用于获取多个参考社交类信息;
聚类单元304,用于对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
第一确定单元305,用于根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
进一步的,如图4所示,所述目标社交类信息对应的互动指标值包括:所述目标社交类信息对应的价值度值和增长度值;所述目标社交类信息对应的互动参数包括:所述目标社交类信息对应的点赞数、评论数、转发数、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度;第一计算单元302包括:
第一计算模块3021,用于对每个所述目标社交类信息对应的点赞数、评论数及转发数进行求和计算,以获得每个所述目标社交类信息对应的互动热度;
第二计算模块3022,用于分别将每个所述目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法,计算每个所述目标社交类信息对应的价值度值;
第三计算模块3023,用于分别将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法,计算每个所述目标社交类信息对应的增长度值。
进一步的,如图4所示,该装置还包括:
第三获取单元306,用于在第一获取单元301获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,获取每个所述目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量;
第二计算单元307,用于分别将每个所述目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,计算每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量;
第四获取单元308,用于获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量,其中,所述目标社交类信息对应的多个历史社交类信息为所述目标社交类信息所属账号在历史时段内发表的多个社交类信息;
第三计算单元309,用于根据每个所述目标社交类信息对应的多个历史点赞数、多个历史评论数及多个历史转发数,计算每个所述目标社交类信息对应的历史总点赞数、历史总评论数及历史总转发数;
第四计算单元310,用于分别将每个所述目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个所述目标社交类信息对应的账号热度;
第五计算单元311,用于分别对每个所述目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量、多个第一预设时段评论增量和多个第二预设时段评论增量及多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,以获得每个所述目标社交类信息对应的目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量;
存储单元312,用于将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储;
去除单元313,用于在第四获取单元308获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量之后,按照预设规则去除多个所述历史社交类信息中的异常历史社交类信息。
进一步的,如图4所示,聚类单元304包括:
第一提取模块3041,用于分别提取每个所述目标社交类信息对应的关键词和每个所述参考社交类信息对应的关键词;
获取模块3042,用于获取多组第一关键词和第二关键词,其中,所述第一关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,所述第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词;
第四计算模块3043,用于按照预设相似度算法计算每组所述第一关键词和第二关键词之间的相似度值,以获得多个相似度值;
第一划分模块3044,用于当任意一个所述相似度值大于预设阈值时,将所述相似度值对应的两个社交类信息划分为同一分组,以获得多个分组,所述两个社交类信息为两个目标社交类信息,或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息;
第二划分模块3045,用于将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,以获得多个话题;
第二提取模块3046,用于在多个所述话题中提取每个所述目标社交类信息对应的话题参数。
进一步的,如图4所示,第一确定单元305包括:
输入模块3051,用于将每个所述目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,以获得每个所述目标社交类信息对应的热点判断结果;
确定模块3052,用于根据每个所述目标社交类信息对应的热点判断结果,确定每个所述目标社交类信息是否为热点社交类信息。
进一步的,如图4所示,该装置还包括:
第五获取单元314,用于在第一获取单元301获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,获取多个训练社交类信息以及每个所述训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果;
建立单元315,用于根据预设决策树算法建立所述热点判断模型;
训练单元316,用于将每个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个所述训练社交类信息对应的热点判断结果作为输出,对所述热点判断模型进行训练;
停止单元317,用于当将任意一个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,所述热点判断模型准确输出所述训练社交类信息对应的热点判断结果时,停止对所述热点判断模型的训练。
进一步的,如图4所示,所述目标社交类信息对应的内容参数包括:所述目标社交类信息中的图片数量、所述目标社交类信息中的URL数量;所述目标社交类信息对应的话题参数包括:所述目标社交类信息在其所属话题内的发表顺序号;该装置还包括:
第六计算单元318,用于在第一确定单元305根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息之后,分别将每个所述热点社交类信息对应的价值度值、发表顺序号、图片数量和URL数量代入第五预设算法,计算每个所述热点社交类信息对应的热度值;
排序单元319,用于根据每个所述热点社交类信息对应的热度值,对多个所述热点社交类信息进行降序排列;
第二确定单元320,用于将排序后的前N个所述热点社交内容对应的话题,确定为热点话题;
输出单元321,用于将排序后的多个所述热点社交类信息和多个所述热点话题进行输出显示。
本发明实施例提供的一种确定热点社交类信息的方法及装置,与现有技术中,通过判断某个社交类信息在预设时段内的点赞增量、评论增量或转发增量是否大于预设阈值,来确定该社交类信息是否为热点社交类信息,本发明实施例能够在热点确定应用程序获取多个目标社交类信息以及每个目标社交类信息对应的互动参数和内容参数后,由热点确定应用程序根据每个目标社交类信息对应的互动参数,计算每个目标社交类信息对应的互动指标值,并在获取得到多个参考社交类信息后,对多个目标社交类信息与多个参考社交类信息进行聚类处理,从而将多个目标社交类信息和多个参考社交类信息聚类为多个话题,再从多个话题中提取每个目标社交类信息对应的话题参数,最终根据每个目标社交类信息对应的互动指标值、内容参数和话题参数,确定各个目标社交类信息是否为热点社交类信息。由于,在本发明实施例中是,基于社交类信息对应的互动参数、内容参数和话题参数,确定社交类信息是否为热点社交类信息,而并非是仅根据社交类信息对应的互动参数,确定社交类信息是否为热点社交类信息,因此,能够有效提高确定社交类信息是否为热点社交类信息的准确率。
所述确定热点社交类信息的装置包括处理器和存储器,上述第一获取单元、第一计算单元、第二获取单元、聚类单元和第一确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高确定社交类信息是否为热点社交类信息的准确率。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述的确定热点社交类信息的方法。
本发明实施例提供了一种电子设备40,如图5所示,电子设备40包括至少一个处理器401、以及与处理器连接的至少一个存储器402、总线403;其中,处理器401、存储器402通过总线403完成相互间的通信;处理器401用于调用存储器402中的程序指令,以执行上述的确定热点社交类信息的方法。本文中的电子设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
获取多个参考社交类信息,并对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
进一步的,所述目标社交类信息对应的互动指标值包括:所述目标社交类信息对应的价值度值和增长度值;所述目标社交类信息对应的互动参数包括:所述目标社交类信息对应的点赞数、评论数、转发数、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度;所述根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值,包括:
对每个所述目标社交类信息对应的点赞数、评论数及转发数进行求和计算,以获得每个所述目标社交类信息对应的互动热度;
分别将每个所述目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法,计算每个所述目标社交类信息对应的价值度值;
分别将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法,计算每个所述目标社交类信息对应的增长度值。
进一步的,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取每个所述目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量;
分别将每个所述目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,计算每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量;
获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量,其中,所述目标社交类信息对应的多个历史社交类信息为所述目标社交类信息所属账号在历史时段内发表的多个社交类信息;
根据每个所述目标社交类信息对应的多个历史点赞数、多个历史评论数及多个历史转发数,计算每个所述目标社交类信息对应的历史总点赞数、历史总评论数及历史总转发数;
分别将每个所述目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个所述目标社交类信息对应的账号热度;
分别对每个所述目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量、多个第一预设时段评论增量和多个第二预设时段评论增量及多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,以获得每个所述目标社交类信息对应的目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量;
将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储;
在所述获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量之后,还包括:
按照预设规则去除多个所述历史社交类信息中的异常历史社交类信息。
进一步的,所述对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数,包括:
分别提取每个所述目标社交类信息对应的关键词和每个所述参考社交类信息对应的关键词;
获取多组第一关键词和第二关键词,其中,所述第一关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,所述第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词;
按照预设相似度算法计算每组所述第一关键词和第二关键词之间的相似度值,以获得多个相似度值;
当任意一个所述相似度值大于预设阈值时,将所述相似度值对应的两个社交类信息划分为同一分组,以获得多个分组,所述两个社交类信息为两个目标社交类信息,或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息;
将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,以获得多个话题;
在多个所述话题中提取每个所述目标社交类信息对应的话题参数。
进一步的,所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息,包括:
将每个所述目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,以获得每个所述目标社交类信息对应的热点判断结果;
根据每个所述目标社交类信息对应的热点判断结果,确定每个所述目标社交类信息是否为热点社交类信息。
进一步的,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取多个训练社交类信息以及每个所述训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果;
根据预设决策树算法建立所述热点判断模型;
将每个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个所述训练社交类信息对应的热点判断结果作为输出,对所述热点判断模型进行训练;
当将任意一个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,所述热点判断模型准确输出所述训练社交类信息对应的热点判断结果时,停止对所述热点判断模型的训练。
进一步的,所述目标社交类信息对应的内容参数包括:所述目标社交类信息中的图片数量、所述目标社交类信息中的URL数量;所述目标社交类信息对应的话题参数包括:所述目标社交类信息在其所属话题内的发表顺序号;在所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息之后,所述方法还包括:
分别将每个所述热点社交类信息对应的价值度值、发表顺序号、图片数量和URL数量代入第五预设算法,计算每个所述热点社交类信息对应的热度值;
根据每个所述热点社交类信息对应的热度值,对多个所述热点社交类信息进行降序排列;
将排序后的前N个所述热点社交内容对应的话题,确定为热点话题;
将排序后的多个所述热点社交类信息和多个所述热点话题进行输出显示。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种确定热点社交类信息的方法,其特征在于,包括:
获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
获取多个参考社交类信息,并对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
2.根据权利要求1所述的方法,其特征在于,所述目标社交类信息对应的互动指标值包括:所述目标社交类信息对应的价值度值和增长度值;所述目标社交类信息对应的互动参数包括:所述目标社交类信息对应的点赞数、评论数、转发数、目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量,所述目标社交类信息所属账号对应的粉丝数、账号热度;所述根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值,包括:
对每个所述目标社交类信息对应的点赞数、评论数及转发数进行求和计算,以获得每个所述目标社交类信息对应的互动热度;
分别将每个所述目标社交类信息对应的互动热度、点赞数、评论数、转发数及粉丝数代入第一预设算法,计算每个所述目标社交类信息对应的价值度值;
分别将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度代入第二预设算法,计算每个所述目标社交类信息对应的增长度值。
3.根据权利要求2所述的方法,其特征在于,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取每个所述目标社交类信息对应的第一时段点赞增量、第一时段评论增量、第一时段转发增量、第二时段点赞增量、第二时段评论增量、第二时段转发增量;
分别将每个所述目标社交类信息对应的第一时段点赞增量和第二时段点赞增量、第一时段评论增量和第二时段评论增量及第一时段转发增量和第二时段转发增量代入第三预设算法中,计算每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量;
获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量,其中,所述目标社交类信息对应的多个历史社交类信息为所述目标社交类信息所属账号在历史时段内发表的多个社交类信息;
根据每个所述目标社交类信息对应的多个历史点赞数、多个历史评论数及多个历史转发数,计算每个所述目标社交类信息对应的历史总点赞数、历史总评论数及历史总转发数;
分别将每个所述目标社交类信息对应的历史总点赞数、历史总评论数、历史总转发数及多个历史社交类信息的数量代入第四预设算法中,计算每个所述目标社交类信息对应的账号热度;
分别对每个所述目标社交类信息对应的多个第一预设时段点赞增量和多个第二预设时段点赞增量、多个第一预设时段评论增量和多个第二预设时段评论增量及多个第一预设时段转发增量和多个第二预设时段转发增量进行求和计算,以获得每个所述目标社交类信息对应的目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量;
将每个所述目标社交类信息对应的目标时段点赞增长量、目标时段评论增长量、目标时段转发增长量、目标时段点赞基准增量、目标时段评论基准增量、目标时段转发基准增量、账号热度进行存储;
在所述获取每个所述目标社交类信息对应的多个历史社交类信息以及每个所述历史社交类信息对应的历史点赞数、历史评论数、历史转发数、第一预设时段点赞增量、第一预设时段评论增量、第一预设时段转发增量、第二预设时段点赞增量、第二预设时段评论增量、第二预设时段转发增量之后,还包括:
按照预设规则去除多个所述历史社交类信息中的异常历史社交类信息。
4.根据权利要求3所述的方法,其特征在于,所述对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数,包括:
分别提取每个所述目标社交类信息对应的关键词和每个所述参考社交类信息对应的关键词;
获取多组第一关键词和第二关键词,其中,所述第一关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词,所述第二关键词为任意一个所述目标社交类信息对应的关键词或任意一个所述参考社交类信息对应的关键词;
按照预设相似度算法计算每组所述第一关键词和第二关键词之间的相似度值,以获得多个相似度值;
当任意一个所述相似度值大于预设阈值时,将所述相似度值对应的两个社交类信息划分为同一分组,以获得多个分组,所述两个社交类信息为两个目标社交类信息,或两个参考社交类信息,或一个目标社交类信息和一个参考社交类信息;
将包含相同目标社交类信息或包含相同参考社交类信息的多个分组划分为同一话题,以获得多个话题;
在多个所述话题中提取每个所述目标社交类信息对应的话题参数。
5.根据权利要求1所述的方法,其特征在于,所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息,包括:
将每个所述目标社交类信息对应的互动指标值、内容参数和话题参数输入至热点判断模型中,以获得每个所述目标社交类信息对应的热点判断结果;
根据每个所述目标社交类信息对应的热点判断结果,确定每个所述目标社交类信息是否为热点社交类信息。
6.根据权利要求5所述的方法,其特征在于,在所述获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数之前,所述方法还包括:
获取多个训练社交类信息以及每个所述训练社交类信息对应的互动指标值、内容参数、话题参数和热点判断结果;
根据预设决策树算法建立所述热点判断模型;
将每个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入、将每个所述训练社交类信息对应的热点判断结果作为输出,对所述热点判断模型进行训练;
当将任意一个所述训练社交类信息对应的互动指标值、内容参数和话题参数作为输入,所述热点判断模型准确输出所述训练社交类信息对应的热点判断结果时,停止对所述热点判断模型的训练。
7.根据权利要求2所述的方法,其特征在于,所述目标社交类信息对应的内容参数包括:所述目标社交类信息中的图片数量、所述目标社交类信息中的URL数量;所述目标社交类信息对应的话题参数包括:所述目标社交类信息在其所属话题内的发表顺序号;在所述根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息之后,所述方法还包括:
分别将每个所述热点社交类信息对应的价值度值、发表顺序号、图片数量和URL数量代入第五预设算法,计算每个所述热点社交类信息对应的热度值;
根据每个所述热点社交类信息对应的热度值,对多个所述热点社交类信息进行降序排列;
将排序后的前N个所述热点社交内容对应的话题,确定为热点话题;
将排序后的多个所述热点社交类信息和多个所述热点话题进行输出显示。
8.一种确定热点社交类信息的装置,其特征在于,包括:
第一获取单元,用于获取多个目标社交类信息以及每个所述目标社交类信息对应的互动参数和内容参数;
第一计算单元,用于根据每个所述目标社交类信息对应的互动参数,计算每个所述目标社交类信息对应的互动指标值;
第二获取单元,用于获取多个参考社交类信息;
聚类单元,用于对多个所述目标社交类信息与多个所述参考社交类信息进行聚类处理,以获得每个所述目标社交类信息对应的话题参数;
第一确定单元,用于根据每个所述目标社交类信息对应的互动指标值、内容参数和话题参数,确定每个所述目标社交类信息是否为热点社交类信息。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任一项所述的确定热点社交类信息的方法。
10.一种电子设备,其特征在于,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;
其中,所述处理器、所述存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至权利要求7中任一项所述的确定热点社交类信息的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911382122.0A CN113051484A (zh) | 2019-12-27 | 2019-12-27 | 确定热点社交类信息的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911382122.0A CN113051484A (zh) | 2019-12-27 | 2019-12-27 | 确定热点社交类信息的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113051484A true CN113051484A (zh) | 2021-06-29 |
Family
ID=76507101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911382122.0A Pending CN113051484A (zh) | 2019-12-27 | 2019-12-27 | 确定热点社交类信息的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113051484A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455269A (zh) * | 2022-08-22 | 2022-12-09 | 华云天下(南京)科技有限公司 | 文章热度分析方法、装置、数据处理架构和分析系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100191742A1 (en) * | 2009-01-27 | 2010-07-29 | Palo Alto Research Center Incorporated | System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes |
CN102982157A (zh) * | 2012-12-03 | 2013-03-20 | 北京奇虎科技有限公司 | 用于挖掘微博热点话题的装置及方法 |
CN103345524A (zh) * | 2013-07-19 | 2013-10-09 | 中国地质大学(武汉) | 微博热点话题检测方法及系统 |
CN104834632A (zh) * | 2015-05-13 | 2015-08-12 | 北京工业大学 | 一种基于语义扩充的微博话题检测和热度评估方法 |
CN106503209A (zh) * | 2016-10-26 | 2017-03-15 | Tcl集团股份有限公司 | 一种话题热度预测方法及系统 |
CN107436877A (zh) * | 2016-05-25 | 2017-12-05 | 北京京东尚科信息技术有限公司 | 热点话题推送方法和装置 |
-
2019
- 2019-12-27 CN CN201911382122.0A patent/CN113051484A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100191742A1 (en) * | 2009-01-27 | 2010-07-29 | Palo Alto Research Center Incorporated | System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes |
CN102982157A (zh) * | 2012-12-03 | 2013-03-20 | 北京奇虎科技有限公司 | 用于挖掘微博热点话题的装置及方法 |
CN103345524A (zh) * | 2013-07-19 | 2013-10-09 | 中国地质大学(武汉) | 微博热点话题检测方法及系统 |
CN104834632A (zh) * | 2015-05-13 | 2015-08-12 | 北京工业大学 | 一种基于语义扩充的微博话题检测和热度评估方法 |
CN107436877A (zh) * | 2016-05-25 | 2017-12-05 | 北京京东尚科信息技术有限公司 | 热点话题推送方法和装置 |
CN106503209A (zh) * | 2016-10-26 | 2017-03-15 | Tcl集团股份有限公司 | 一种话题热度预测方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455269A (zh) * | 2022-08-22 | 2022-12-09 | 华云天下(南京)科技有限公司 | 文章热度分析方法、装置、数据处理架构和分析系统 |
CN115455269B (zh) * | 2022-08-22 | 2023-08-29 | 华云天下(南京)科技有限公司 | 文章热度分析方法、装置、数据处理架构和分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10015128B2 (en) | Social content features based on user tracking | |
Xu et al. | Analyzing user retweet behavior on twitter | |
CN108170692B (zh) | 一种热点事件信息处理方法和装置 | |
US10747771B2 (en) | Method and apparatus for determining hot event | |
CN110598157B (zh) | 目标信息识别方法、装置、设备及存储介质 | |
CN111460153B (zh) | 热点话题提取方法、装置、终端设备及存储介质 | |
CN102902775B (zh) | 互联网实时计算的方法和系统 | |
US20130006996A1 (en) | Clustering E-Mails Using Collaborative Information | |
JP2017533531A (ja) | フォーカスト・センチメント分類 | |
CN107808346B (zh) | 一种潜在目标对象的评估方法及评估装置 | |
CN115862088A (zh) | 一种身份识别方法及装置 | |
CN110825868A (zh) | 一种基于话题热度的文本推送方法、终端设备及存储介质 | |
CN106878242B (zh) | 一种确定用户身份类别的方法及装置 | |
CN108509545B (zh) | 一种文章的评论处理方法及系统 | |
US10324962B1 (en) | Unstructured data valuation | |
CN105989066A (zh) | 一种信息处理方法和装置 | |
US20170324822A1 (en) | Finding potentially viral media items | |
WO2017095413A1 (en) | Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors | |
CN107038193B (zh) | 一种文本信息的处理方法和装置 | |
CN113901037A (zh) | 数据管理方法、装置及存储介质 | |
CN113051484A (zh) | 确定热点社交类信息的方法及装置 | |
CN110674383B (zh) | 舆情查询方法、装置及设备 | |
US10237226B2 (en) | Detection of manipulation of social media content | |
CN110866085A (zh) | 数据反馈方法与装置 | |
US20160125061A1 (en) | System and method for content selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |