CN108833382B - 网络信息检测方法、装置、存储介质和计算机设备 - Google Patents

网络信息检测方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN108833382B
CN108833382B CN201810549608.8A CN201810549608A CN108833382B CN 108833382 B CN108833382 B CN 108833382B CN 201810549608 A CN201810549608 A CN 201810549608A CN 108833382 B CN108833382 B CN 108833382B
Authority
CN
China
Prior art keywords
propagation
node
prediction model
neural network
tree structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810549608.8A
Other languages
English (en)
Other versions
CN108833382A (zh
Inventor
宋彦
张海松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010190160.2A priority Critical patent/CN111431742B/zh
Priority to CN201810549608.8A priority patent/CN108833382B/zh
Publication of CN108833382A publication Critical patent/CN108833382A/zh
Application granted granted Critical
Publication of CN108833382B publication Critical patent/CN108833382B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种网络信息检测方法、装置、计算机可读存储介质和计算机设备,该方法包括:获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。该方法从网络信息的传播树结构对发布内容是否为谣言进行预测,同时,谣言的检测考虑了各传播节点的发布内容和特征信息,进一步提高了谣言检测所需的信息量,从而提高了谣言检测的准确率。

Description

网络信息检测方法、装置、存储介质和计算机设备
技术领域
本申请涉及互联网技术领域,特别是涉及一种网络信息检测方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着互联网的快速发展,网络已成为人们发布信息和获取资讯的重要渠道。网络信息具有传播速度快,覆盖范围广等特点。当权威的信息在网络上被发布时,能够得到及时有效的响应和关注。而当谣言在网络被传播时,容易误导人们,给群众及乃至社会造成不同程度的影响。其中,谣言是指不真实的言论。
为此,各社交网络越来越重视对网络信息的检测工作,以甄别出其中的谣言信息。传统地网络信息检测方法,都将谣言检测视为分类问题,即通过提取社交网络(例如微博/推文等)的文本内容、用户资料和消息传播等方面的特征,训练监督学习算法得到“谣言”分类器。
而多数谣言的检测仅仅考虑发布内容在特定时刻下特征的统计数值,即谣言分类时考虑的特征单一、不全面,从而导致网络信息检测的结果准确率低。
发明内容
基于此,有必要针对网络信息检测准确率低的技术问题,提供一种网络信息检测方法、装置、计算机可读存储介质和计算机设备。
一种网络信息检测方法,包括:
获取网络信息的传播树结构以及各传播节点的特征信息;
基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型;所述预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;
将所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果。
一种网络信息检测装置,包括:
获取模块,用于获取网络信息的传播树结构以及所述传播树结构中各传播节点的发布内容和特征信息;
模型生成模块,用于基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型;所述预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;
检测模块,用于将各传播节点的所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。
上述的网络信息检测方法、装置、计算机可读存储介质和计算机设备,基于传播树结构中各传播节点之间的层次关系,生成与传播树结构对应的预测模型,预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应。将传播节点的发布内容和各传播节点的特征信息输入预测模型对应的神经网络节点,通过预测模型得到网络信息的检测结果。由于预测模型的结构与网络信息的传播树结构对应,故而谣言预测时,能够基于谣言和非谣言传播结构的差异,从网络信息的传播树结构对发布内容是否为谣言进行预测,同时,谣言的检测考虑了各传播节点的发布内容和特征信息,能够获取各传播节点中有价值的信息,进一步提高了谣言检测所需的信息量,从而提高了谣言检测的准确率。
附图说明
图1为一个实施例中网络信息检测方法的应用环境图;
图2为一个实施例中网络信息检测方法的流程示意图;
图3为一个实施例中传播结构树的示意图;
图4为一个实施例中谣言的传播示意图;
图5为另一个实施例中非谣言的传播示意图;
图6为另一个实施例中对图3所示的传播树结构处理得到的预测模型的结构示意图;
图7为一个实施例中预测模型的神经网络单元的结构示意图;
图8为一个实施例中训练预测模型参数的步骤的流程示意图;
图9为一个实施例中网络信息检测方法的时序示意图;
图10为一个实施例中网络信息检测装置的结构框图;
图11为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中网络信息检测方法的应用环境示意图。参照图1,该网络信息检测方法应用于网络信息检测系统。该网络信息检测系统包括多个用户终端110、网络应用服务器120和网络信息检测服务器130。其中,多个用户终端110与网络应用服务器120连接,网络应用服务器120与网络信息检测服务器130连接。其中一个用户利用用户终端110通过网络应用服务器120发布内容,该用户的跟随者转发或回复该发布内容,通过其它跟随者转发或回复的方式发布内容,信息源在社交网络进行传播,传播的路径可用传播树结构表示。网络信息检测服务器根据传播树结构对发布内容是否为谣言进行检测,并将检测结果发送至网络应用服务器120。网络应用服务器120将网络信息的检测结果发送至用户终端110,通过用户终端110显示网络信息的检测结果。用户终端具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。网络应用服务器120和网络信息检测服务器130可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,提供一种网络信息检测方法,以该网络信息检测方法应用于社交网络为例进行说明,如图2所示,该方法包括以下步骤:
S202,获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息。
其中,传播树结构是针对信息源而言。信息源是指首次在网络发布的信息。在社交网络中,用户通过关注或加为好友,与其它用户建立关联关系。对于任意一个用户而言,社交网络的好友为其跟随者,该用户在社交网络的发布内容,都能够被其所有的跟随者看到。例如,用户A在社交网络的发布内容,用户A的所有跟随者在社交网络都能看到该发布内容,并选择是否进一步将该发布内容转播给他们的跟随者。而跟随者在选择对微博进行传播时,对于跟随者而言,也是一次内容发布,跟随者可以在上一节点用户的发布内容的基础上发表观点或进行信息补充。即跟随者的发布内容,能够表示用户对信息源的观点或态度,同时还会附加对信息源的补充信息。因此,可以将信息源在社交网络的传播过程表示为传播树结构。社交网络可以是微博、博客或微信朋友圈等。
发布内容是指在社交网络发表的信息,发布内容的载体可以是文字、视频、音频和图片等。发布内容可以是首次在社交网络发布的信息,即信息源,也可以是跟随者在信息源的基础上进行的回复或转发。通常,随着者在对信息源进行回复或转发时,可以发表表示其对信息源或其它发布内容的信息补充内容,例如信息源发布后,事件的跟进结果等,也可以发表其对信息源或其它发布内容的观点。
当社交网络的用户对发布内容通过转发、分享或回复等传播方式将发布内容传播给其它跟随者时,这种承载传播者角色的用户即传播树结构中的传播节点。即,传播节点为传播树结构中通过社交网络对发布内容进行了转发、分享或回复等预设传播操作的用户。在传播树结构中,根传播节点表示信息源的发布者,各子传播节点对应的用户直接或间接的传播该信息源。图3为一个实施例中一网络信息的部分传播树结构。
特征信息用于表示传播结点的特征,包括传播结点的用户信息。
其中,用户信息包括用户属性,例如,用户的注册信息,传播时间信息和身份信息等。用户的注册信息,包括用户的注册性别,注册时间距离发布内容的发布等。传播时间信息包括转发、回复或分享时间。身份信息包括用户是否为权威用户。权威用户的言论通常具有权威性,通常为社交网络的名人或是大V用户。大V用户即是指在社交网络上获得个人认证,拥有众多粉丝的微博用户。
S204,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应。
传播树结构中各传播节点之间的层次关系,表示信息源在各传播节点对应的用户之间的传播路径,根据传播树结构,能够确定消息如何从信息源(即发布者)在社交网络被广泛传播的,根据传播树结构的各传播节点,能够确定发布消息经过了哪些用户对发布内容进行了传播,例如对发布内容进行分享、转发或回复等操作。
通常,谣言和非谣言在社交网络的传播树结构存在结构化的差异。谣言的传播结构如图4所示,非谣言的传播结构如图5所示。如图4和图5所示,节点大小表示用户的影响力大小,同心圆环表示消息的发布时间,实线表示发布内容从高影响力用户传播给低影响力用户,虚线表示发布内容从低影响力用户传播给高影响力用户。不同的填充图案的结点表示用户在进行传播时对发布内容的态度,例如,怀疑态度,中立态度或支持态度。
对于社交网络中的谣言而言,信息源首先被某一个初始用户发布,该用户并没有大量的受众群体,但是该发布内容之所以能够被广泛传播,是因为一些具有影响力的用户(例如大V用户)转发或评论了该发布内容。如图4所示。
而在非谣言微博的传播过程中,发布内容被一个有影响力的用户发布,随后直接被一些普通用户直接转播,如图5所示。其他的特征比如参与用户的态度以及信息的传播方向,也可以反映谣言和非谣言在传播过程中的差异。其中,传播方向通过用户身份和传播路径可以确定。传播方向包括两种,一种为有高影响力的用户传播给低影响力的,另一种为低影响力的用户传播给高影响力的用户。如图4和图5,谣言通常由高影响力的用户传播给低影响力的用户,且用户在传播过程中,具有较多的怀疑态度。而非谣言在传播的过程中,用户的怀疑态度的占比较少。
本实施例中,通过传播树结构实时动态地生成对应的预测模型,能够真实地反应消息在社交网络的传播结构,从而能够从谣言和非谣言的不同传播模式上,对网络信息是否为谣言进行检测。
具体地,预测模型为循环神经网络模型,包括多个神经网络单元。传统地循环神经网络模型为线性序列结构。本实施例中,按照传播的时间序列生成的预测模型的各神经网络节点的层次关系与传播节点之间的层次关系对应,而传播树结构之间的层次为树型,即能够一个节点对应多个子节点,故而本实施例的预测模型为树形循环神经网络(Tree-RNN),即根据传播树结构动态生成的树形循环神经网络中,一个时刻的神经网络节点,可以连接下一时刻的多个神经网络节点。也就是说,在树形循环神经网络中,一个时刻到下一时刻,不再只有一个后续的神经网络节点,而是可以有多个后继的神经网络节点。树形结构的循环神经网络,对应线性结构的循环神经网络,可以克服线性网络单一的结构特点,有效针对诸如一对多的树形结构进行建模。对一个传播树结构生成的预测模型如图6所示。动态生成的预测模型有效模拟传播树结构,而发布内容是由信息源向其它用户传播,故预测模型的结构为自顶向下传播方式。
S206,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,通过预测模型得到网络信息的检测结果。
本实施例中,预设模型的参数通过对大量带标记的网络信息的传播结构树进行训练确定。根据传播树结构中各传播节点之间的层次关系和模型参数,动态地生成与传播树结构的预测模型,预测模型的各神经网络节点的连接关系与传播节点之间的层次关系对应。
具体地,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数进行预测模型的前向传播,得到网络信息的检测结果。
通过利用预测模型进行谣言检测,无需人工选择特征,可以独立于特征选择的方式自动选择特征。
上述的网络信息检测方法,基于传播树结构中各传播节点之间的层次关系,生成与传播树结构对应的预测模型,预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应。将传播节点的发布内容和各传播节点的特征信息输入预测模型对应的神经网络节点,通过预测模型得到网络信息的检测结果。由于预测模型的结构与网络信息的传播树结构对应,故而谣言预测时,能够基于谣言和非谣言传播结构的差异,从网络信息的传播树结构对发布内容是否为谣言进行预测,同时,谣言的检测考虑了各传播节点的发布内容和特征信息,能够获取各传播节点中有价值的信息,进一步提高了谣言检测所需的信息量,从而提高了谣言检测的准确率。
在另一个实施例中,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型,包括:创建预测模型的根神经网络节点;从根神经网络节点开始,根据传播树结构中当前传播节点对应的子节点,按照传播的时间序列依次添加当前神经网络节点的所有子神经网络节点,直至传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
与标准的循环神经网络结构相比,树形循环神经网络(Tree-RNN)不再依赖一个线性序列结构。标准的RNN模型一般有一个预定的RNN线性序列长度,而本申请提出的Tree-RNN模型则会根据社交媒体传播树的结构动态创建网络结构。给定一棵传播树结构,模型的创建过程会从根节点开始,按照传播的时间序列依次地添加当前节点的所有子节点,直到所有的叶子节点添加完毕。因此,基于该创建方法,每个传播树结构所创建的Tree-RNN结构都是不同的。
具体地,首先创建预测模型的根神经网络节点,如图6中的根神经网络节点X0,预测模型的根神经网络节点与传播树结构的根传播节点对应。将根神经网络节点作为当前神经网络节点,参照传播树的根传播节点的子传播结点,为根神经网络节点添加子神经网络节点。依此类推,对于传播树结构的一个时刻的每个传播节点,若该传播节点具有子传播节点,则为与其对应的神经网络节点添加子神经网络节点,直到传播树结构中所有叶子传播节点对应的叶子神经网络节点添加完毕。其中,叶子节点是指不具有子节点的节点。
上述的方法,能够动态的根据传播树结构,实时动态地生成与传播树结构类似的树形循环神经网络。
在另一个实施例中,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果,包括:将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数,在预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果。
具体地,根据传播树结构,将各传播节点的发布内容和特征信息输入预测模型对应的各神经网络节点。其中,各神经网络节点的输入信息为向量。即发各传播节点的发布内容(回复和转发内容)以及特征信息(用户信息,发布时间等)的文字进行分词预处理,并利用工具进行文字向量转换,得到发布内容和特征信息对应的特征向量,将各特征向量输入对应的神经网络节点。
预测模型采用具有记忆功能循环神经网络模型。例如,RNN(Recurrent NeuralNetworks,循环神经网络),LSTM(Long Short Term Memory networks,长短时记忆神经网络),GRU(Gated Recurrent Unit,门限循环单元)。根据神经网络模型的特点,在预测模型的前向传播的过程中,基于输入的传播树结构,信息从父节点直接传播到与其连接的各子节点,子节点的状态结合了父节点的隐含层的输出与自身对应的特征信息的输入结果。而本申请的树形循环神经网络,一个节点可能具有多个子节点,因此,当树形循环神经网络的状态从一个时刻到下一时刻,根据传播树结构,每个神经网络节点的隐含层的输出状态会直接传递给其所有的子神经网络节点。即对于后续具有多个子神经网络节点的神经网络节点而言,在前向传播的过程中,根据传播树结构,当前神经网络节点的隐含层的输出状态会传播给后续的多个子神经网络节点,即这些子神经网络节点全部都继承了上一时刻的神经网络节点的隐含层的状态。如图7所示。在树形循环神经网络中,最后一层的叶子神经网络节点连接到一个softmaxt全连接层,并使用该全连接层的输出用于谣言预测。
上述的网络信息检测方法,基于传播树结构,在前向传播的过程中,每个神经网络节点的隐含层的输入状态会直接传播给所有的神经网络子节点,真实地模拟了现实情况中信息的传播过程,并且发布内容和特征信息能够有助于发现有价格的信息,例如支持或反对态度等,从而提高谣言检测的准确度。
在另一个实施例中,根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果中,包括:根据预测模型的叶子神经网络节点的输出状态的平均值,得到网络信息的检测结果。
基于预测模型的神经网络结构,最后一层的叶子神经网络节点连接到一个softmax全连接层,并使用该全连接层的输出用于谣言预测。
Figure BDA0001680823230000091
其中,hl*表示所有叶子结点的输出状态的平均值,Wy和b表示该全连接层的参数。
在另一个实施例中,获取网络信息的传播树结构的方式,包括:根据当前传播节点的发布内容,获取信息源;将发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,依次获取与当前传播节点的用户标识关联且对信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到网络信息的传播树结构。
信息源是在社交网络首次发表后,被社交网络的其它用户传播。由于信息源在社交网络在传播过程中,其它用户对信息源进行传播时,一次传播形为即一个新的发布内容。而新的发布内容通常是对信息源或是之前传播节点的发布内容的信息补充或态度表示等。因此,各个传播节点的发布内容作为信息源的信息补充,会导致信息源的真实性发生变化,例如,在多个传播节点,多个用户提出对信息源的质疑,则说明信息源可能是谣言。因此,本申请的谣言检测是针对信息源的整个传播链路而言。
对于每一个传播节点的发布内容而言,由于传播节点是对信息源的传播,例如回复和转发,故发布内容通常带有信息源的相关信息。根据信息源的相关信息,获取信息源标识,确定该信息源标识第一次在社交网络发布的用户标识,将首次发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,获取与当前节点的用户标识关联且对信息源执行了预设操作的用户标识。
预测操作是指预设的传播操作,预设操作的具体形式根据社交网络的传播操作的实现方式相关。例如,微博平台,预设操作通常为转发或回复操作。微信朋友圈通常为分享操作。
以为根传播节点添加子传播节点为例,获取与信息源的用户标识关联且对信息源进行了回复或转发操作的用户标识,如图3所示,用户X0为信息源的发布者,用户X1、X2和X5对信息源进行了转发或回复,转发或回复时的文字内容作为对应的发布内容。其中用户X1、X2和X5为用户X0的跟随者,则将X1、X2和X5的作为用户X0的子传播节点。而用户X2在社交网络发布内容后,其跟随者X6和X7的对X2的发布内容进行了转发或回复,则将X6和X7作为用户X2的子传播节点。依次对每一个传播节点执行上述操作,从而得到网络信息的传播树结构。
考虑到社交网络中的用户间关联关系,如用户之间的跟随关系反映了用户的兴趣。一旦用户A发布了某微博,用户A的所有跟随者都会看到该消息,并选择是否进一步将该消息传播给他们的跟随者。因此信息源的传播过程表示为传播树结构,如图3所示为社交媒体的部分传播片段。整个社交媒体上的信息传播过程可以近似地认为是该图所示的多个传播树的组合。
在另一个实施例中,预先训练预测模型的参数的方式,如图8所示,包括以下步骤:
S802,初始化预测模型的参数。
S804,从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息。
训练集中包括了大量的训练样本,并标记了训练样本的属性,即该训练样本是否为谣言。
S806,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应。
具体地,预测模型为循环神经网络模型,包括多个神经网络单元。传统地循环神经网络模型为线性序列结构。本实施例中,按照传播的时间序列生成的预测模型的各神经网络节点的层次关系与传播节点之间的层次关系对应,而传播树结构之间的层次为树型,即能够一个节点对应多个子节点,故而本实施例的预测模型为树形循环神经网络(Tree-RNN),即根据传播树结构动态生成的树形循环神经网络中,一个时刻的神经网络节点,可以连接下一时刻的多个神经网络节点。也就是说,在树形循环神经网络中,一个时刻到下一时刻,不再只有一个后续的神经网络节点,而是可以有多个后续的神经网络节点。树形结构的循环神经网络,对应线性结构的循环神经网络,可以克服线性网络单一的结构特点,有效针对诸如一对多的树形结构进行建模。对一个传播树结构生成的预测模型如图6所示。动态生成的预测模型有效模拟传播树结构,而发布内容是由信息源向其它用户传播,故预测模型的结构为自顶向下传播方式。
S808,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。
本实施例中,预设模型的参数通过对大量带标记的网络信息的传播结构树进行训练确定。根据传播树结构中各传播节点之间的层次关系和模型参数,动态地生成与传播树结构的预测模型,预测模型的各神经网络节点的连接关系与传播节点之间的层次关系对应。
具体地,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数进行预测模型的前向传播,得到网络信息的检测结果。
具体地,预测模型采用具有记忆功能循环神经网络模型。由于循环神经网络模型根据传播结构树生成,因此,本申请的树形循环神经网络,一个节点可能具有多个子节点,因此,当树形循环神经网络的状态从一个时刻到下一时刻,根据传播树结构,每个神经网络节点的隐含层的输出状态会直接传递给其所有的子神经网络节点。即对于后续具有多个子神经网络节点的神经网络节点而言,在前向传播的过程中,根据传播树结构,当前神经网络节点的隐含层的输出状态会传播给后续的多个子神经网络节点,即这些子神经网络节点全部都继承了上一时刻的神经网络节点的隐含层的状态。
S810,判断是否达到训练结束条件。若否,则执行步骤S812。
训练结束条件可以为迭代次数,也可以为预测结果的准确度。与常规的模型训练无异,此处不再赘述。
S812,根据检测结果与标记的误差在预测模型进行反向传播,更新预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络的所有的子神经网络节点的更新参数进行更新。
具体地,反向传播是根据前向传播的结果与标注的误差,调整模型参数的过程。模型的参数更新过程参考了现有的结构化传播模型,与标准的RNN的模型参数更新过程相比,Tree-RNN的主要区别在于对一个状态更新的梯度来自于所有与其连接的多个后续状态,而不是只有一个后续状态。因此,从拓扑结构上来讲,Tree-RNN可以简单的理解为:每个传播路径都是一个标准的RNN结构,整个传播路径是多个标准结构组合的结果,其中某些节点被多个路径共享。沿着前述模型的描述,以GRU为例,根据标准的GRU反向传播过程,更新模型的所有参数,并在各个后续节点上将更新的结果统一发送到前面的一个节点。如图6所示,从c1到cn反馈的梯度,将会统一用来更新当前节点并进而发送至前面的p节点。
步骤S812之后,返回步骤S804,直至达到训练结束条件。
通过重复上述步骤,得到预测模型的参数。在模型参数的训练过程中,无论是前向传播还是反向传播,都与传统的RNN模型参数训练不同,充分考虑传播树结构的特点,即前向传播中各神经网络节点的隐含层的输出都将传递至其所有的子节点,反向传播中一个节点的参数考虑了其所有子节点的反馈的梯度。
该网络信息检测方法能够帮助社交网络的运营方在大量的发布内容中发现谣言,并根据过滤出的谣言进一步人工干预,从而可以减少大量人工审核标注和舆情分析的工作。人工干预可以是将发布内容删除。
在另一种实施方式中,在人工干预前,为便于帮助社交网络的用户甄别谣言,在用户请求发布内容时,还将网络信息的检测结果发送至用户终端。具体地,将网络信息和检测结果关联;当接受到终端加载请求时,将网络信息和检测结果发送至终端。
其中,终端即用户登录社交网络账号,浏览社交网相关账号的终端。加载请求具体为终端对社交网络的页面加载请求,例如,用户对关注的好友页面的加载请求,用户对热门微博的页面加载请求等等。通过将检测结果与发布内容关联,对于请求加载的页面的各发布内容,将网络信息和检测结果发送至终端。从而,终端显示的页面显示网络信息的同时,还将显示网络信息的检测结果。例如,若一个网络信息的点击率或转发率比较高,成为热门微博,那么当终端请求热门微博页面时,显示该网络信息的同时还将显示该网络信息的检测结果,以帮助社交网络的用户甄别谣言。在本实施例中,对网络信息的检测是由网络应用的后台服务器实时进行。
上述的网络信息检测方法,能够直观地让用户了解谣言检测结果。
在另一个实施例中,对网络信息是否为谣言进行检测,还可以由用户进行触发。在终端显示的网页页面,每一个发布内容设置一个检测按钮。当用户对网络信息的真实性产生怀疑时,可通过点击该检测按钮,向后台服务器请求对网络信息进行谣言检测,在得到检测结果后,将检测结果发送至终端。
具体地,在获取网络信息的传播树结构以及各传播节点的特征信息之前,还包括:当接收到终端的加载请求时,将网络信息发送至终端;获取终端发送的对网络信息的检测请求,检测请求在终端检测到用户操作显示界面上网络信息的检测按钮时发送。
网络信息检测方法还包括,将检测结果发送至终端。
其中,终端即用户登录社交网络账号,浏览社交网相关账号的终端。加载请求具体为终端对社交网络的页面加载请求,例如,用户对关注的好友页面的加载请求,用户对热门微博的页面加载请求等等。当服务器接收到终端的加载请求时,将网络信息发送至终端。本实施例中,在显示页面的各发布内容,设置了检测按钮。
当终端检测到用户操作显示界面上网络信息的检测按钮时,向服务器发送检测请求。检测请求携带有网络信息的识别标识(ID)。服务器接收到检测请求时,获取该网络信息的传播树结构及各传播节点的特征信息,进行网络信息检测。在得到检测结果后,将检测结果发送至终端。
本实施例中的网络信息检测方法,由用户触发,能够帮助用户主动甄别谣言。
下面,结合具体的应用场景对本申请的网络信息检测方法进行说明。
在实际的应用中,网络信息检测方法包括两个阶段:第一阶段为预测模型的训练阶段,通过大量标记样本,得到预测模型的参数。第二阶段为预测阶段,即实际应用阶段。
具体地,训练阶段的训练过程,如图8所示,包括:
S802,初始化预测模型的参数。
S804,从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息。
S806,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应。
S808,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。
S810,判断是否达到训练结束条件。若否,则执行步骤S812。
S812,根据检测结果与标记的误差在预测模型进行反向传播,更新预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络节点的所有的子神经网络节点的更新参数进行更新。
步骤S812之后,返回步骤S804,直至达到训练结束条件。
通过重复上述步骤,得到预测模型的参数。在模型参数的训练过程中,无论是前向传播还是反向传播,都与传统的RNN模型参数训练不同,充分考虑传播树结构的特点,即前向传播中各神经网络节点的隐含层的输出都将传递至其所有的子节点,反向传播中一个节点的参数考虑了其所有子节点的反馈的梯度。
具体的预测阶段的过程,以实时显示网络信息检测结果为例,如图9所示,包括以下步骤:
S902,获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息。
具体地,对于网络信息检测服务器而言,可获取其它服务器创建完成的传播树结构,也可以实时地创建传播树结构。以网络信息检测服务器创建传播树结构为例,包括:根据当前传播节点的发布内容,获取信息源;将发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,依次获取与当前传播节点的用户标识关联且对信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到网络信息的传播树结构。
具体地,以为根传播节点添加子传播节点为例,获取与信息源的用户标识关联且对信息源进行了回复或转发操作的用户标识,如图3所示,用户X0为信息源的发布者,用户X1、X2和X5对信息源进行了转发或回复,转发或回复时的文字内容作为对应的发布内容。其中用户X1、X2和X5为用户X0的跟随者,则将X1、X2和X5的作为用户X0的子传播节点。而用户X2在社交网络发布内容后,其跟随者X6和X7的对X2的发布内容进行了转发或回复,则将X6和X7作为用户X2的子传播节点。依次对每一个传播节点执行上述操作,从而得到网络信息的传播树结构。
S904,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应。
具体地,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型,包括:创建预测模型的根神经网络节点;从根神经网络节点开始,根据传播树结构中当前传播节点对应的子传播节点,按照传播的时间序列依次添加当前神经网络节点的所有子神经网络节点,直至传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
具体地,首先创建预测模型的根神经网络节点,如图6中的根神经网络节点X0,预测模型的根神经网络节点与传播树结构的根传播节点对应。将根神经网络节点作为当前神经网络节点,参照传播树的根传播节点的子传播结点,为根神经网络节点添加子神经网络节点。依此类推,对于传播树结构的一个时间的每个传播节点,若该传播节点具有子传播节点,则为与其对应的神经网络节点添加子神经网络节点,直到传播树结构中所有叶子传播节点对应的叶子神经网络节点添加完毕。其中,叶子节点是指不具有子节点的节点。
S906,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。
具体地,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果,包括:将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点;根据预测模型的参数,在预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;根据预测模型的叶子神经网络节点的输出状态的平均值,得到网络信息的检测结果。
具体地,根据传播树结构,将各传播节点的发布内容和特征信息输入预测模型对应的各神经网络节点。其中,各神经网络节点的输入信息为向量。即发各传播节点的发布内容(回复和转发内容)以及特征信息(用户信息,发布时间等)的文字进行分词预处理,并利用工具进行文字向量转换,得到发布内容和特征信息对应的特征向量,将各特征向量输入对应的神经网络节点。
预测模型采用具有记忆功能循环神经网络模型。例如,RNN(Recurrent NeuralNetworks,循环神经网络),LSTM(Long Short Term Memory networks,长短时记忆神经网络),GRU(Gated Recurrent Unit,门限循环单元)。根据神经网络模型的特点,在预测模型的前向传播的过程中,基于输入的传播树结构,信息从父节点直接传播到与其连接的各子节点,子节点的状态结合了父节点的隐含层的输出与自身对应的特征信息的输入结果。而本申请的树形循环神经网络,一个节点可能具有多个子节点,因此,当树形循环神经网络的状态从一个时刻到下一时刻,根据传播树结构,每个神经网络节点的隐含层的输出状态会直接传递给其所有的子神经网络节点。即对于后续具有多个神经网络子节点的神经网络节点而言,在前向传播的过程中,根据传播树结构,当前神经网络节点的隐含层的输出状态会传播给后续的多个子神经网络节点,即这些子神经网络节点全部都继承了上一时刻的神经网络节点的隐含层的状态。如图7所示。在树形循环神经网络中,最后一层的叶子神经网络节点连接到一个softmaxt全连接层,并使用该全连接层的输出用于谣言预测。
Figure BDA0001680823230000171
其中,hl*表示所有叶子结点的输出状态的平均值,Wy和b表示该全连接层的参数。
S908,将网络信息和检测结果关联。
S910,当接受到终端加载请求时,将网络信息和检测结果发送至终端。
通过将检测结果与发布内容关联,对于请求加载的页面的各发布内容,将网络信息和检测结果发送至终端。从而,终端显示的页面显示网络信息的同时,还将显示网络信息的检测结果。例如,若一个网络信息的点击率或转发率比较高,成为热门微博,那么当终端请求热门微博页面时,显示该网络信息的同时还将显示该网络信息的检测结果,以帮助社交网络的用户甄别谣言。在本实施例中,对网络信息的检测是由网络应用的后台服务器实时进行。
上述的网络信息检测方法,在谣言检测任务中,整体的前向传播过程,即从根节点到所有的叶子节点的传播,真实模拟了现实情况中的信息传播过程(即信息是如何从信息源头传播给其回复或转发节点的过程)。考虑到回复和转发的内容特征,将这些微博按照实际情况连接起来使用循环神经网络的结构非常有助于发现有价值的信息,例如支持或反对的态度等,因为这些文字内容与信息的真实性通常是高度相关的。因此,该方法能够提高谣言检测的准确率。
本申请的网络信息检测方法,可以作为自动检查谣言微博或谣言信息的一个后端处理模块,能极大地节省谣言发现和追踪的人工成本以及时间成本,极大改善内容服务的真实性,进而同步提升用户体验,可在社交网络(例如微博)产品中应用。尤其是在待处理对象上,本申请的方法可以对任意微博或社交媒体平台用户产生的短文本进行分类,初步判断候选微博是否为谣言微博,从而进一步对整个微博平台进行谣言预警。
本申请还提供一种网络信息检测装置,如图10所示,包括:
获取模块1001,用于获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
模型生成模块1002,用于基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;
检测模块1003,用于将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果.
在另一个实施例中,模型生成模块1002,用于创建预测模型的根神经网络节点;从根神经网络节点开始,根据传播树结构中当前传播节点对应的子传播节点,按照传播的时间序列依次添加当前神经网络节点的所有子神经网络节点,直至传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
在另一个实施例中,检测模块包括:
输入模块,用于将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点;
前向传播模块,用于根据预测模型的参数,在预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;
输出模块,用于根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果。
具体地,输出模块,用于根据预测模型的叶子神经网络节点的输出状态的平均值,得到网络信息的检测结果。
在另一个实施例中,获取模块包括:
信息源获取模块,用于根据当前传播节点的发布内容,获取信息源;
传播树结构获取模块,用于将发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,依次获取与当前传播节点的用户标识关联且对信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到网络信息的传播树结构。
在另一个实施例中,网络信息检测装置还包括:
关联模块,用于将网络信息和检测结果关联;
发送模块,用于当接受到终端加载请求时,将网络信息和检测结果发送至终端。
在另一个实施例中,网络信息检测装置还包括:
发送模块,用于当接收到终端的加载请求时,将网络信息发送至终端;
检测请求获取模块,用于获取终端发送的对网络信息的检测请求,检测请求在终端检测到用户操作显示界面上网络信息的检测按钮时发送;
发送模块,还用于将检测结果发送至终端。
在另一个实施例中,网络信息检测模块,还包括:
初始化模块,用于初始化预测模型的参数;
获取模块,还用于从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
生成模块,还用于基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应;
检测模块,还用于将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果;
更新模块,还用于在未达到训练结束条件时,根据检测结果与标记的误差在预测模型进行反向传播,更新预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络节点的所有的子神经网络节点的更新参数进行更新。
上述的网络信息检测装置,基于传播树结构中各传播节点之间的层次关系,生成与传播树结构对应的预测模型,预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应。将传播节点的发布内容和各传播节点的特征信息输入预测模型对应的神经网络节点,通过预测模型得到网络信息的检测结果。由于预测模型的结构与网络信息的传播树结构对应,故而谣言预测时,能够基于谣言和非谣言传播结构的差异,从网络信息的传播树结构对发布内容是否为谣言进行预测,同时,谣言的检测考虑了各传播节点的发布内容和特征信息,能够获取各传播节点中有价值的信息,进一步提高了谣言检测所需的信息量,从而提高了谣言检测的准确率。
图11示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图11中的或网络信息检测服务器130。如图11所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现网络信息检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行网络信息检测方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的网络信息检测装置可以实现为一种计算机程序的形式,计算机程序可在如图11所示的计算机设备上运行。计算机设备的存储器中可存储组成该网络信息检测装置的各个程序模块,比如,图10所示的获取模块、生成模块和检测模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的网络信息检测方法中的步骤。
例如,图11所示的计算机设备可以通过如图10所示的网络信息检测装置中的获取模块执行获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息的步骤。计算机设备可通过生成模块执行用于基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型的步骤。计算机设备可通过检测模块执行将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果的步骤。
一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。
在另一个实施例中,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型,包括:
创建预测模型的根神经网络节点;
从根神经网络节点开始,根据传播树结构中当前传播节点对应的子传播节点,依次添加当前神经网络节点的所有子神经网络节点,直至传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
在另一个实施例中,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果,包括:
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点;
根据预测模型的参数,在预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;
根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果。
在另一个实施例中,根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果中,包括:
根据预测模型的叶子神经网络节点的输出状态的平均值,得到网络信息的检测结果。
在另一个实施例中,预先训练预测模型的参数的方式,包括:
初始化预测模型的参数;
从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应;
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果;
若未达到训练结束条件,则根据检测结果与标记的误差在预测模型进行反向传播,更新预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络节点的所有的子神经网络节点的更新参数进行更新;
返回从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息的步骤,直至达到训练结束条件。
在另一个实施例中,获取网络信息的传播树结构的方式,包括:
根据当前传播节点的发布内容,获取信息源;
将发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,依次获取与当前传播节点的用户标识关联且对信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到网络信息的传播树结构。
在另一个实施例中,计算机程序被处理器执行时,使得处理器还执行以下步骤:
将网络信息和检测结果关联;
当接受到终端加载请求时,将网络信息和检测结果发送至终端。
在另一个实施例中,计算机程序被处理器执行时,使得处理器还执行以下步骤:
当接收到终端的加载请求时,将网络信息发送至终端;
获取终端发送的对网络信息的检测请求,检测请求在终端检测到用户操作显示界面上网络信息的检测按钮时发送;
将检测结果发送至终端。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果。
在另一个实施例中,基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型,包括:
创建预测模型的根神经网络节点;
从根神经网络节点开始,根据传播树结构中当前传播节点对应的子传播节点,依次添加当前神经网络节点的所有子神经网络节点,直至传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
在另一个实施例中,将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果,包括:
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点;
根据预测模型的参数,在预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;
根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果。
在另一个实施例中,根据预测模型的叶子神经网络节点的输出状态,得到网络信息的检测结果中,包括:
根据预测模型的叶子神经网络节点的输出状态的平均值,得到网络信息的检测结果。
在另一个实施例中,预先训练预测模型的参数的方式,包括:
初始化预测模型的参数;
从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息;
基于传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与传播树结构对应的预测模型;预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应;
将各传播节点的发布内容和特征信息输入预测模型对应的神经网络节点,根据预测模型的参数和预测模型得到网络信息的检测结果;
若未达到训练结束条件,则根据检测结果与标记的误差在预测模型进行反向传播,更新预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络节点的所有的子神经网络节点的更新参数进行更新;
返回从训练集中获取带标记的网络信息的传播树结构以及传播树结构中各传播节点的发布内容和特征信息的步骤,直至达到训练结束条件。
在另一个实施例中,获取网络信息的传播树结构的方式,包括:
根据当前传播节点的发布内容,获取信息源;
将发布信息源的用户标识作为传播树结构的根传播节点,从根传播节点出发,依次获取与当前传播节点的用户标识关联且对信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到网络信息的传播树结构。
在另一个实施例中,计算机程序被处理器执行时,使得处理器还执行以下步骤:
将网络信息和检测结果关联;
当接受到终端加载请求时,将网络信息和检测结果发送至终端。
在另一个实施例中,计算机程序被处理器执行时,使得处理器还执行以下步骤:
当接收到终端的加载请求时,将网络信息发送至终端;
获取终端发送的对网络信息的检测请求,检测请求在终端检测到用户操作显示界面上网络信息的检测按钮时发送;
将检测结果发送至终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (13)

1.一种网络信息检测方法,包括:
获取网络信息的传播树结构以及所述传播树结构中各传播节点的发布内容和特征信息;
基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型;所述预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;其中,预测模型的参数通过预先对带标记的网络信息的传播树结构进行训练确定;
将各传播节点的所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果;
将各传播节点的所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果,包括:
将各传播节点的所述发布内容和特征信息输入所述预测模型对应的神经网络节点;
根据预测模型的参数,在所述预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;
根据所述预测模型的叶子神经网络节点的输出状态,得到所述网络信息的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型,包括:
创建所述预测模型的根神经网络节点;
从所述根神经网络节点开始,根据所述传播树结构中当前传播节点对应的子传播节点,按照传播的时间序列依次添加当前神经网络节点的所有子神经网络节点,直至所述传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
3.根据权利要求1所述的方法,其特征在于,所述根据所述预测模型的叶子神经网络节点的输出状态,得到所述网络信息的检测结果中,包括:
根据所述预测模型的叶子神经网络节点的输出状态的平均值,得到所述网络信息的检测结果。
4.根据权利要求1所述的方法,其特征在于,预先训练预测模型的参数的方式,包括:
初始化预测模型的参数;
从训练集中获取带标记的网络信息的传播树结构以及所述传播树结构中各传播节点的发布内容和特征信息;
基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型;所述预测模型的各神经网络节点的连接关系与各传播节点之间的层次关系对应;
将各传播节点的所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果;
若未达到训练结束条件,则根据检测结果与标记的误差在所述预测模型进行反向传播,更新所述预测模型的参数,其中,当前神经网络节点的参数根据当前神经网络节点的所有的子神经网络节点的更新参数进行更新;
返回所述从训练集中获取带标记的网络信息的传播树结构以及所述传播树结构中各传播节点的发布内容和特征信息的步骤,直至达到训练结束条件。
5.根据权利要求1所述的方法,其特征在于,获取网络信息的传播树结构的方式,包括:
根据当前传播节点的发布内容,获取信息源;
将发布所述信息源的用户标识作为传播树结构的根传播节点,从所述根传播节点出发,依次获取与当前传播节点的用户标识关联且对所述信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到所述网络信息的传播树结构。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述网络信息和所述检测结果关联;
当接受到终端加载请求时,将所述网络信息和所述检测结果发送至所述终端。
7.根据权利要求1所述的方法,其特征在于,在所述获取网络信息的传播树结构以及各传播节点的特征信息之前,还包括:
当接收到终端的加载请求时,将所述网络信息发送至所述终端;
获取终端发送的对所述网络信息的检测请求,所述检测请求在所述终端检测到用户操作显示界面上所述网络信息的检测按钮时发送;
所述方法还包括,将所述检测结果发送至所述终端。
8.一种网络信息检测装置,包括:
获取模块,用于获取网络信息的传播树结构以及所述传播树结构中各传播节点的发布内容和特征信息;
模型生成模块,用于基于所述传播树结构中各传播节点之间的层次关系,按照传播的时间序列生成与所述传播树结构对应的预测模型;所述预测模型的各神经网络节点的层次关系与各传播节点之间的层次关系对应;其中,预测模型的参数通过预先对带标记的网络信息的传播树结构进行训练确定;
检测模块,用于将各传播节点的所述发布内容和所述特征信息输入所述预测模型对应的神经网络节点,根据预测模型的参数和所述预测模型得到所述网络信息的检测结果;
所述检测模块包括:
输入模块,用于将各传播节点的所述发布内容和特征信息输入所述预测模型对应的神经网络节点;
前向传播模块,用于根据预测模型的参数,在所述预测模型进行前向传播,将当前神经网络节点的隐藏层的输出状态传播至当前神经网络节点的所有子神经网络节点;
输出模块,用于根据所述预测模型的叶子神经网络节点的输出状态,得到所述网络信息的检测结果。
9.根据权利要求8所述的装置,其特征在于,所述模型生成模块,用于创建所述预测模型的根神经网络节点;从所述根神经网络节点开始,根据所述传播树结构中当前传播节点对应的子传播节点,按照传播的时间序列依次添加当前神经网络节点的所有子神经网络节点,直至所述传播树结构中的所有叶子传播节点对应的叶子神经网络节点添加完毕。
10.根据权利要求8所述的装置,其特征在于,所述输出模块,用于根据所述预测模型的叶子神经网络节点的输出状态的平均值,得到所述网络信息的检测结果。
11.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
信息源获取模块,用于根据当前传播节点的发布内容,获取信息源;
传播树结构获取模块,用于将发布所述信息源的用户标识作为传播树结构的根传播节点,从所述根传播节点出发,依次获取与当前传播节点的用户标识关联且对所述信息源执行了预设操作的用户标识,添加为当前传播节点的子传播节点,得到所述网络信息的传播树结构。
12.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
CN201810549608.8A 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备 Active CN108833382B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010190160.2A CN111431742B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备
CN201810549608.8A CN108833382B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810549608.8A CN108833382B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010190160.2A Division CN111431742B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN108833382A CN108833382A (zh) 2018-11-16
CN108833382B true CN108833382B (zh) 2020-12-15

Family

ID=64147084

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810549608.8A Active CN108833382B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备
CN202010190160.2A Active CN111431742B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010190160.2A Active CN111431742B (zh) 2018-05-31 2018-05-31 网络信息检测方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (2) CN108833382B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434684A (zh) * 2021-07-01 2021-09-24 北京中科研究院 自监督学习的谣言检测方法、系统、设备及存储介质

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685153B (zh) * 2018-12-29 2022-07-05 武汉大学 一种基于特征聚合的社交网络谣言鉴别方法
CN109918648B (zh) * 2019-01-31 2020-04-21 内蒙古工业大学 一种基于动态滑动窗口特征评分的谣言深度检测方法
CN110909125B (zh) * 2019-10-30 2022-11-15 中山大学 推文级社会媒体谣言检测方法
CN111159395B (zh) * 2019-11-22 2023-02-17 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN111277564B (zh) * 2020-01-08 2022-06-28 山东浪潮科学研究院有限公司 一种基于动态存储网络的企业网络异常检测方法及系统
CN111325340B (zh) * 2020-02-17 2023-06-02 南方科技大学 信息网络关系预测方法及系统
CN112199608B (zh) * 2020-11-03 2021-05-28 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法
CN112395511A (zh) * 2020-11-04 2021-02-23 北京大学 一种基于移动应用内消息传播路径的谣言检测与存证系统
CN112270174B (zh) * 2020-11-10 2022-04-29 清华大学深圳国际研究生院 一种谣言检测方法及计算机可读存储介质
CN112491712B (zh) * 2020-11-30 2021-08-17 复旦大学 一种基于多智能体深度强化学习的数据包路由算法
CN112541081B (zh) * 2020-12-21 2022-09-16 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN116319379B (zh) * 2023-05-17 2023-08-01 云目未来科技(湖南)有限公司 一种基于传播链的网络信息引导干预方法及系统
CN117076911B (zh) * 2023-10-17 2024-01-26 南京航空航天大学 一种基于传播结构动态保持的网络谣言检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212163A1 (en) * 2015-01-16 2016-07-21 The Trustees Of The Stevens Institute Of Technology Method and Apparatus to Identify the Source of Information or Misinformation in Large-Scale Social Media Networks
CN107391581A (zh) * 2017-06-21 2017-11-24 清华大学 社会网络信息传播行为预测方法和设备
CN107797998A (zh) * 2016-08-29 2018-03-13 腾讯科技(深圳)有限公司 含谣言用户生成内容识别方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605661B (zh) * 2013-10-18 2016-09-21 清华大学 社会网络信息传播树生成方法及系统
US20150188941A1 (en) * 2013-12-26 2015-07-02 Telefonica Digital Espana, S.L.U. Method and system for predicting victim users and detecting fake user accounts in online social networks
CN105975504A (zh) * 2016-04-28 2016-09-28 中国科学院计算技术研究所 一种基于循环神经网络的社交网络消息爆发检测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212163A1 (en) * 2015-01-16 2016-07-21 The Trustees Of The Stevens Institute Of Technology Method and Apparatus to Identify the Source of Information or Misinformation in Large-Scale Social Media Networks
CN107797998A (zh) * 2016-08-29 2018-03-13 腾讯科技(深圳)有限公司 含谣言用户生成内容识别方法和装置
CN107391581A (zh) * 2017-06-21 2017-11-24 清华大学 社会网络信息传播行为预测方法和设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434684A (zh) * 2021-07-01 2021-09-24 北京中科研究院 自监督学习的谣言检测方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN111431742A (zh) 2020-07-17
CN108833382A (zh) 2018-11-16
CN111431742B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN108833382B (zh) 网络信息检测方法、装置、存储介质和计算机设备
US11514260B2 (en) Information recommendation method, computer device, and storage medium
US20230025317A1 (en) Text classification model training method, text classification method, apparatus, device, storage medium and computer program product
US11182863B1 (en) Joint modeling of user and content feature vector data based on third party source data
US20190197176A1 (en) Identifying relationships between entities using machine learning
US20190272322A1 (en) Content editing using AI-based content modeling
US10496751B2 (en) Avoiding sentiment model overfitting in a machine language model
US10423410B1 (en) Source code rules verification method and system
CN113722493B (zh) 文本分类的数据处理方法、设备、存储介质
WO2019019385A1 (zh) 跨平台数据匹配方法、装置、计算机设备和存储介质
CN110727761B (zh) 对象信息获取方法、装置及电子设备
WO2019051962A1 (zh) 社交平台用户的现实关系匹配方法、装置及可读存储介质
CN110795641A (zh) 基于表示学习的网络谣言传播控制方法
US10817845B2 (en) Updating messaging data structures to include predicted attribute values associated with recipient entities
CN113360762A (zh) 基于人工智能的内容推荐方法及人工智能内容推荐系统
US20140279815A1 (en) System and Method for Generating Greedy Reason Codes for Computer Models
CN111079175B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
US11200284B1 (en) Optimization of feature embeddings for deep learning models
CN116595191A (zh) 一种交互式低代码知识图谱的构建方法及装置
US20220366344A1 (en) Determining section conformity and providing recommendations
CN114510627A (zh) 对象推送方法、装置、电子设备及存储介质
CN117151247B (zh) 机器学习任务建模的方法、装置、计算机设备和存储介质
CN111143773B (zh) 建立概率模型的方法、装置、计算机设备和存储介质
US11853371B1 (en) Logging information describing a type of event occurring in a mobile application received via an SDK incorporated into mobile application code of the mobile application
US20230098864A1 (en) Enabling Electronic Loan Documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant