CN116319379B - 一种基于传播链的网络信息引导干预方法及系统 - Google Patents
一种基于传播链的网络信息引导干预方法及系统 Download PDFInfo
- Publication number
- CN116319379B CN116319379B CN202310554775.2A CN202310554775A CN116319379B CN 116319379 B CN116319379 B CN 116319379B CN 202310554775 A CN202310554775 A CN 202310554775A CN 116319379 B CN116319379 B CN 116319379B
- Authority
- CN
- China
- Prior art keywords
- propagation
- node
- nodes
- information
- propagator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000005540 biological transmission Effects 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于传播链的网络信息引导干预方法及系统,该方法包括:从当前平台获取话题,并从所述话题中提取若干关键词;从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,根据算法得到独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预。本发明的基于传播链的网络信息引导干预方法通过对每个话题传播者的传播属性、上级节点ID、下级节点ID等信息进行分析,通过分析独立节点以及群落中节点的数量等特征得到传播影响度,不需要得到完整传播路径便能够判断该话题在当前平台的传播情况,从而能够基于传播影响度进行信息干预。
Description
技术领域
本发明具体涉及网络信息处理技术领域,具体是一种基于传播链的网络信息引导干预方法及系统。
背景技术
随着互联网的日益普及,网络论坛、专业领域的网络社区成为人们获取专业信息、交流专业信息的重要渠道。目前网络新闻报道通常来说形式各异,并且分散在不同的平台,但是不同平台之间的数据又是相互保密的,使得每个平台均不能获取到所有平台的数据,例如,用户A可能是在A平台获取的网络信息,但又在B平台进行传播,此时B平台就无法获知A用户的传播路径,从而在数据不完整的情况下难以准确的预估传播影响,无法对本平台上传播的网络信息进行干预。
发明内容
本发明的目的在于提供一种基于传播链的网络信息引导干预方法及系统。为实现上述目的,本发明提供如下技术方案:
一种基于传播链的网络信息引导干预方法,包括以下步骤:
S1、从当前平台获取话题,并从所述话题中提取若干关键词;
S2、从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;
S3、根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
S4、依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
S5、直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
S6、根据独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预。
在本发明的一个实施例中,所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定。
在本发明的一个实施例中,所述传播影响度计算公式为:,且,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度,α表示独立节点个数的影响因子,β表示传播链的影响因子;
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
在本发明的一个实施例中,所述话题中提取若干关键词,包括:
从所述话题中提取若干话题语句;
对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
本发明同时公开了一种基于传播链的网络信息引导干预系统,包括:
关键词获取模块,用于从当前平台获取话题,并从所述话题中提取若干关键词;
传播节点确定模块,用于从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;
传播节点处理模块,用于根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
传播节点更新模块,用于依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
群落生成模块,用于直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
干预模块,用于根据独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预。
在本发明的一个实施例中,所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定。
在本发明的一个实施例中,所述传播影响度计算公式为:,且,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度,α表示独立节点个数的影响因子,β表示传播链的影响因子;
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
在本发明的一个实施例中,所述关键词获取模块,包括:
话题语句提取单元,用于从所述话题中提取若干话题语句;
关键词获取单元,用于对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
与现有技术相比,本发明的有益效果是:
本发明的基于传播链的网络信息引导干预方法通过对每个话题传播者的传播属性、上级节点ID、下级节点ID等信息进行分析,通过分析独立节点以及群落中节点的数量等特征得到传播影响度,不需要得到完整传播路径便能够判断该话题在当前平台的传播情况,从而能够基于传播影响度进行信息干预。
附图说明
图1为本发明提供的一种基于传播链的网络信息引导干预方法的流程图;
图2为本发明提供的一种基于传播链的网络信息引导干预系统的模块框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。
请参阅图1,本发明实施例中,一种基于传播链的网络信息引导干预方法,包括以下步骤:
S1、从当前平台获取话题,并从所述话题中提取若干关键词;
本实施例中的平台指的是具备信息传播能力的独立运行的媒体平台。平台内部可以获取到用户的使用档案,但无法获知该用户在平台之外的信息。一般的,话题可以是当前传播较为热门的话题,也可以是任意想要进行分析话题。需要说明的,当前传播较为热门的话题不一定为在该平台传播热门的话题。
S2、从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;本实施例的预设数据库为根据关键词确定的传播者信息,系统根据该关键词从平台中抓取与该关键词相关的用户作为传播者信息,由于尚未进行传播者分析,因此,此时的传播节点中填充内容的字段仅包括传播ID和传播时间。在实际场景中,由于数据量巨大,因此从预设数据库中随机获取一部分传播节点进行后续分析。
S3、根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
为了得到传播节点的上级节点ID、下级节点ID,需要对传播者的浏览记录进行分析,例如当传播节点在传播之前的浏览记录中包含关键词,则说明该用户是阅读了其他用户的内容之后才进行的传播,因此可以确定上级节点ID,需要说明的是,用户可能在此之前阅读了多次相关信息,也就是说,浏览记录可能志向多个上级节点ID,为了便于分析,本实施例将多个上级节点ID中能够使得传播链加长的上级节点ID作为该节点的上级节点ID,否则,将首次浏览的用户确定上级节点ID,从而避免出现一对多的或者多对一的情况,导致传播链产生混乱。由于是遍历执行,在当前执行节点的独立节点也有可能称为后续节点的上级节点。
S4、依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
在本步骤中,首先判断上一步骤中确定的上级节点的传播ID是否是随机获取若干传播节点之一,若是则说明该传播节点具有下级节点,更新该传播节点中下级节点ID的记录内容。
S5、直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
S6、根据独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预。
在本发明的一个实施例中,所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定。
在本发明的一个实施例中,所述传播影响度计算公式为:,且,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度,α表示独立节点个数的影响因子,β表示传播链的影响因子;
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
需要说明的是,群落中传播节点的个数越多,传播链越长,则说明信息传播越活跃,此时需要进行一定的干预。例如,当所有节点均为群落中传播节点、并且传播链达到了最长,此时根据公式可以得到W=1,即传播影响度最大。而当独立节点个数越多,传播链越小时,则说明信息传播在本平台未形成完整的传播形态,此时可以不进行干预,或者进行少量干预。例如,当所述节点均为独立节点时,表明该话题的传播源均不来自于本平台,本平台的用户的传播行为皆为从其他平台获取后传播到本平台中,并且也未在本平台形成有效传播链,此时根据公式可以得到W=0。当然,在一般情况下,同时存在独立节点和群落,并且群落中的节点的传播链也有多有少,因此需要考虑独立节点个数的影响因子和传播链的影响因子的印象,具体数值根据实际情况进行确定即可。
在本发明的一个实施例中,所述话题中提取若干关键词,包括:
从所述话题中提取若干话题语句;
对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
本实施例的基于传播链的网络信息引导干预方法通过对每个话题传播者的传播属性、上级节点ID、下级节点ID等信息进行分析,通过分析独立节点以及群落中节点的数量等特征得到传播影响度,不需要得到完整传播路径便能够判断该话题在当前平台的传播情况,从而能够基于传播影响度进行信息干预。
请参见图2,本发明同时公开了一种基于传播链的网络信息引导干预系统,包括:
关键词获取模块,用于从当前平台获取话题,并从所述话题中提取若干关键词;
传播节点确定模块,用于从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;
传播节点处理模块,用于根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
传播节点更新模块,用于依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
群落生成模块,用于直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
干预模块,用于根据独立节点个数、群落中传播节点的个数以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预。
在本发明的一个实施例中,所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定。
在本发明的一个实施例中,所述传播影响度计算公式为:,且,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度。
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
在本发明的一个实施例中,所述关键词获取模块,包括:
话题语句提取单元,用于从所述话题中提取若干话题语句;
关键词获取单元,用于对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
本实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,其中,该计算机程序指令被处理器执行时用于实现本实施例的一种基于传播链的网络信息引导干预方法的步骤。
此外,一些实施例可包括具有用于在计算机上执行本说明书中记载的方法的程序的存储介质,其上存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集被处理器加载并执行时实现上述各方法实施例中的步骤,计算机可读记录介质的示例包括为了存储并执行程序命令而专门构成的硬件装置:诸如硬盘、软盘及磁带的磁介质、诸如CD-ROM、DVD的光记录介质、诸如软盘的磁光介质及ROM、RAM、闪存等。程序命令的示例可包括:由编译器编写的机器语言代码以及使用解释器等而由计算机来执行的高级语言代码。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过至少一条指令、至少一段程序、代码集或指令集来指令相关的硬件来完成,的至少一条指令、至少一段程序、代码集或指令集可存储于一非易失性计算机可读取存储介质中,该至少一条指令、至少一段程序、代码集或指令集在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。
最后需要说明的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RA可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(步骤SDRAM)、双数据速率步骤SDRAM(DDR 步骤SDRAM)、增强步骤SDRAM(E步骤SDRAM)、同步链路DRAM(步骤SLDRAM)、以及直接Rambu步骤S RAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(D步骤SP)、专用集成电路(A步骤SIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,D步骤SP和微处理器的组合、多个微处理器、一个或多个微处理器结合D步骤SP和/或任何其它这种配置。
需要说明的是,对于前述的各实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,涉及的动作和模块并不一定是本发明所必须的。
本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或通信连接可以是通过一些接口,装置或单元之间的间接耦合或通信连接,可以是电信或者其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对发明的保护范围进行限制。显然,所描述的实施例仅仅是本发明部分实施例,而不是全部实施例。基于这些实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明所要保护的范围。尽管参照上述实施例对本发明进行了详细的说明,本领域普通技术人员依然可以在不冲突的情况下,不作出创造性劳动对本发明各实施例中的特征根据情况相互组合、增删或作其他调整,从而得到不同的、本质未脱离本发明的构思的其他技术方案,这些技术方案也同样属于本发明所要保护的范围。
Claims (4)
1.一种基于传播链的网络信息引导干预方法,其特征在于,包括以下步骤:
S1、从当前平台获取话题,并从所述话题中提取若干关键词;
S2、从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;
S3、根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
S4、依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
S5、直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
S6、根据独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预;
所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定;
所述传播影响度计算公式为:,且/>,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度,α表示独立节点个数的影响因子,β表示传播链的影响因子;
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
2.根据权利要求1所述的基于传播链的网络信息引导干预方法,其特征在于,所述话题中提取若干关键词,包括:
从所述话题中提取若干话题语句;
对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
3.一种基于传播链的网络信息引导干预系统,其特征在于,包括:
关键词获取模块,用于从当前平台获取话题,并从所述话题中提取若干关键词;
传播节点确定模块,用于从预设数据库中随机获取若干对应于所述关键词的传播者信息作为传播节点,其中所述传播节点的记录内容包括传播ID、传播时间、传播属性、上级节点ID、下级节点ID;
传播节点处理模块,用于根据所述传播者信息获取该传播者的浏览信息,基于所述传播时间,以从所述浏览信息中判断是否包括所述关键词,若是,则从该包括所述关键词的浏览信息中提取前向传播者信息作为该传播者的上级节点;若否,则将该节点的上级节点标记为空节点,以表征该节点为独立节点;
传播节点更新模块,用于依次遍历每个传播节点ID与该传播者的上级节点的传播ID进行对比,若该传播节点中存在与该传播者的上级节点的传播ID相同的节点ID,则更新该传播节点中下级节点ID的记录内容;若否,则将该传播者的上级节点加入传播节点中;
群落生成模块,用于直至每一个传播节点均执行完成,将所有具有上级节点或/下级节点的传播节点组成群落,并计算群落中传播节点的个数、传播链个数、以及最大传播长度;
干预模块,用于根据独立节点个数、传播节点的个数、传播链个数、最大传播长度以及传播属性得到传播影响度,以基于所述传播影响度进行信息干预;
所述传播属性包括负面属性和非负面属性,所述传播属性根据所述关键词确定;
所述传播影响度计算公式为:,且/>,/>,其中,Ng表示群落中传播节点的个数,Ns表示独立节点的个数,Nk表示传播链个数,L表示最大传播长度,α表示独立节点个数的影响因子,β表示传播链的影响因子;
当所述传播影响度0.5<W≤1,且传播节点的传播属性中负面属性数量大于非负面属性时,删除该平台中对于所述话题的传播;
当所述传播影响度0.2<W≤0.5,删除该平台中具有负面属性的传播节点的传播;
当所述传播影响度0≤W≤0.2,不进行信息干预。
4.根据权利要求3所述的基于传播链的网络信息引导干预系统,其特征在于,所述关键词获取模块,包括:
话题语句提取单元,用于从所述话题中提取若干话题语句;
关键词获取单元,用于对每个所述话题语句进行文本划分以将所述话题语句拆分成若干话题词语,以从每个所述话题语句中确定频数最高的话题词语作为关键词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310554775.2A CN116319379B (zh) | 2023-05-17 | 2023-05-17 | 一种基于传播链的网络信息引导干预方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310554775.2A CN116319379B (zh) | 2023-05-17 | 2023-05-17 | 一种基于传播链的网络信息引导干预方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116319379A CN116319379A (zh) | 2023-06-23 |
CN116319379B true CN116319379B (zh) | 2023-08-01 |
Family
ID=86827240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310554775.2A Active CN116319379B (zh) | 2023-05-17 | 2023-05-17 | 一种基于传播链的网络信息引导干预方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116319379B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117611374B (zh) * | 2024-01-23 | 2024-05-07 | 深圳博十强志科技有限公司 | 一种基于多元化大数据分析的信息传播分析方法及系统 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126700A (zh) * | 2016-07-01 | 2016-11-16 | 复旦大学 | 一种微博谣言传播的分析方法 |
CN107945036A (zh) * | 2017-11-21 | 2018-04-20 | 中山大学 | 一种在线社交网络中有影响力传播者识别与量化的方法 |
CN108833382A (zh) * | 2018-05-31 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 网络信息检测方法、装置、存储介质和计算机设备 |
CN110798703A (zh) * | 2019-11-04 | 2020-02-14 | 云目未来科技(北京)有限公司 | 视频违规内容检测的方法、装置以及存储介质 |
CN111949853A (zh) * | 2019-04-30 | 2020-11-17 | 北京智慧星光信息技术有限公司 | 一种互联网信息的监测控制方法 |
AU2020102905A4 (en) * | 2020-01-20 | 2020-12-17 | Yunnan University | A method to measure social network influence |
CN112508726A (zh) * | 2020-12-25 | 2021-03-16 | 东北电力大学 | 一种基于信息传播特点的虚假舆论识别系统及其处理方法 |
CN112818234A (zh) * | 2021-02-02 | 2021-05-18 | 中慧绿浪科技(天津)集团有限公司 | 一种网络舆情信息分析处理方法及系统 |
AU2021102006A4 (en) * | 2021-04-19 | 2021-06-03 | Beijing Technology And Business University | A system and method for identifying online rumors based on propagation influence |
CN113254719A (zh) * | 2021-04-28 | 2021-08-13 | 西北大学 | 一种基于地位理论的在线社交网络信息传播方法 |
CN113946708A (zh) * | 2021-10-29 | 2022-01-18 | 重庆邮电大学 | 基于图像复原技术和谣言辟谣信息的话题传播预测方法 |
CN114936267A (zh) * | 2022-05-11 | 2022-08-23 | 西安交通大学医学院第二附属医院 | 基于双线性池化的多模态融合在线谣言检测方法及系统 |
CN115422738A (zh) * | 2022-08-31 | 2022-12-02 | 中国科学院计算技术研究所 | 自媒体消息传播仿真模型的建模方法、仿真方法及系统 |
CN115757983A (zh) * | 2022-10-27 | 2023-03-07 | 重庆邮电大学 | 一种考虑推动者的谣言传播模型构建方法、设备及介质 |
CN115987810A (zh) * | 2022-12-21 | 2023-04-18 | 深圳市网联安瑞网络科技有限公司 | 一种节点与社区相结合的多级传播分析方法、分析系统 |
-
2023
- 2023-05-17 CN CN202310554775.2A patent/CN116319379B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126700A (zh) * | 2016-07-01 | 2016-11-16 | 复旦大学 | 一种微博谣言传播的分析方法 |
CN107945036A (zh) * | 2017-11-21 | 2018-04-20 | 中山大学 | 一种在线社交网络中有影响力传播者识别与量化的方法 |
CN108833382A (zh) * | 2018-05-31 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 网络信息检测方法、装置、存储介质和计算机设备 |
CN111949853A (zh) * | 2019-04-30 | 2020-11-17 | 北京智慧星光信息技术有限公司 | 一种互联网信息的监测控制方法 |
CN110798703A (zh) * | 2019-11-04 | 2020-02-14 | 云目未来科技(北京)有限公司 | 视频违规内容检测的方法、装置以及存储介质 |
AU2020102905A4 (en) * | 2020-01-20 | 2020-12-17 | Yunnan University | A method to measure social network influence |
CN112508726A (zh) * | 2020-12-25 | 2021-03-16 | 东北电力大学 | 一种基于信息传播特点的虚假舆论识别系统及其处理方法 |
CN112818234A (zh) * | 2021-02-02 | 2021-05-18 | 中慧绿浪科技(天津)集团有限公司 | 一种网络舆情信息分析处理方法及系统 |
AU2021102006A4 (en) * | 2021-04-19 | 2021-06-03 | Beijing Technology And Business University | A system and method for identifying online rumors based on propagation influence |
CN113254719A (zh) * | 2021-04-28 | 2021-08-13 | 西北大学 | 一种基于地位理论的在线社交网络信息传播方法 |
CN113946708A (zh) * | 2021-10-29 | 2022-01-18 | 重庆邮电大学 | 基于图像复原技术和谣言辟谣信息的话题传播预测方法 |
CN114936267A (zh) * | 2022-05-11 | 2022-08-23 | 西安交通大学医学院第二附属医院 | 基于双线性池化的多模态融合在线谣言检测方法及系统 |
CN115422738A (zh) * | 2022-08-31 | 2022-12-02 | 中国科学院计算技术研究所 | 自媒体消息传播仿真模型的建模方法、仿真方法及系统 |
CN115757983A (zh) * | 2022-10-27 | 2023-03-07 | 重庆邮电大学 | 一种考虑推动者的谣言传播模型构建方法、设备及介质 |
CN115987810A (zh) * | 2022-12-21 | 2023-04-18 | 深圳市网联安瑞网络科技有限公司 | 一种节点与社区相结合的多级传播分析方法、分析系统 |
Non-Patent Citations (1)
Title |
---|
基于特定主题的社交网络影响力评估方法;蒋沁吟;张熙;;应用科学学报(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116319379A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
WO2019136993A1 (zh) | 文本相似度计算方法、装置、计算机设备和存储介质 | |
JP6901816B2 (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
US10019484B2 (en) | Third party search applications for a search system | |
CN116319379B (zh) | 一种基于传播链的网络信息引导干预方法及系统 | |
Rekabsaz et al. | Exploration of a threshold for similarity based on uncertainty in word embedding | |
US10949424B2 (en) | Optimization technique for database application | |
US20190197166A1 (en) | Method, terminal device and storage medium for mining entity description tag | |
US20100306818A1 (en) | Computer-Implemented Method, Computer System, And Computer Program Product for Optimization Of Evaluation Of A Policy Specification | |
CN105608134A (zh) | 一种基于多线程的网络爬虫系统及其网页爬取方法 | |
CN105320775A (zh) | 数据的存取方法和装置 | |
CN109471889B (zh) | 报表加速方法、系统、计算机设备和存储介质 | |
CN111325030A (zh) | 文本标签构建方法、装置、计算机设备和存储介质 | |
CN108319628B (zh) | 一种用户兴趣确定方法及装置 | |
US9454568B2 (en) | Method, apparatus and computer storage medium for acquiring hot content | |
CN115687810A (zh) | 网页搜索方法、装置及相关设备 | |
CN111382179B (zh) | 数据处理方法、装置及电子设备 | |
BR102018074370A2 (pt) | Sistemas e métodos para segmentar texto interativo de sessão | |
CN116340365B (zh) | 一种缓存数据的匹配方法、匹配装置及终端设备 | |
US20070027918A1 (en) | Mail processing server, mail processing method, and mail processing program | |
CN110347900B (zh) | 一种关键词的重要度计算方法、装置、服务器及介质 | |
CN111414515A (zh) | 一种资源审核方法、装置、设备及存储介质 | |
CN115391188A (zh) | 一种场景测试用例生成方法、装置、设备及存储介质 | |
JP6680472B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN114461606A (zh) | 数据存储方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |