WO2014101706A1

WO2014101706A1 - 一种用户生成内容提及的骚扰屏蔽方法、装置和系统

Info

Publication number: WO2014101706A1
Application number: PCT/CN2013/089931
Authority: WO
Inventors: 江兴才; 黄利华; 田明
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2012-12-27
Filing date: 2013-12-19
Publication date: 2014-07-03
Also published as: CN103906066A; CN103906066B; US10320729B2; US20150295870A1

Abstract

本发明实施方式提出一种用户生成内容提及的骚扰屏蔽方法、装置和系统。方法包括：接收用户生成内容发表请求；解析用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给提及对象。本发明实施方式克服了现有技术中针对提及骚扰采用事后处理的缺陷，实现了针对用户生成内容提及骚扰的事先处理，提高了用户生成内容提及骚扰的处理效率，而且本发明实施方式实现了针对用户生成内容提及骚扰的自动屏蔽，克服了现有技术中人工审核的缺陷。

Description

一种用户生成内容提及的骚扰屏蔽方法、装置和系统相关文件

本申请要求于 2012 年 12 月 27 日提交中国专利局、申请号为 2012105800201、发明名称为"一种用户生成内容提及的验扰屏蔽方法和装置"的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域

本发明实施方式涉及互联网应用技术领域，更具体地，涉及一种用户生成内容提及的验扰屏蔽方法、装置和系统。发明背景

随着计算机技术和网络技术的飞速发展，互联网（Internet )在人们的曰常生活、学习和工作中发挥的作用也越来越大。互联网上的各种应用层出不穷。

用户生成内容（UGC )是一种用户使用互联网的新方式，即由原来的以下载为主变成下载和上传并重。社区网络、视频分享、微博和博客等都是 UGC的主要应用形式。随着全球互联网业务的不断发展， UGC 业务正在日渐崛起，引起了业界的广泛关注。

微博 ( MicroBlog )是一种典型的 UGC应用，是一个基于用户关系的信息分享、传播以及获取的平台，用户可以通过各种终端在微博上以筒短的文字（一般是 140个字）发布个人所想、所做的信息，实现信息的即时分享。微博是用户在互联网进行消息分享、传播的一种新方式。由于微博弱关系链的特点，微博的消息传递非常快，这也吸引^艮多用户在微博上发表一些不利于微博生态发展的消息，例如在转播、点评名人的消息时带上自己的广告，这种与被提及用户无关的转播、点评都会进入被提及用户的收件箱，对用户造成极大骚扰，降低了微博的消息质量和用户的创作积极性，对整个微博的积极发展带来非常大的副作用。

在现有技术中，对于用户生成内容业务中提及验扰行为采取的是事后处理策略，即只有当用户投诉某个账号恶意提及时，审核的人员才会判断该账号是否对其他用户造成了骚扰，如果确认验扰，则根据严重程度对该骚扰账号进行禁言或者封号处理。

然而，对于海量的用户生成内容数据而言，人工审核并处理验扰提及行为的处理效率偏低。而且，这种事后处理方式依赖于用户的反馈，实际上 ^艮多用户不知道或者不愿意反馈，因此验扰行为经常得不到及时处理，进一步降低了用户生成内容提及验扰的处理效率。发明内容

本发明实施方式提出一种用户生成内容提及的验扰屏蔽方法，以提高用户生成内容提及验扰的处理效率。

本发明实施方式提出一种用户生成内容提及的验扰屏蔽装置，以提高用户生成内容提及验扰的处理效率。

本发明实施方式提出一种用户生成内容提及的验扰屏蔽系统，以提高用户生成内容提及验扰的处理效率。

本发明实施方式的技术方案如下：

一种用户生成内容提及的骚扰屏蔽方法，该方法包括：

接收用户生成内容发表请求；

解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

一种用户生成内容提及的骚扰屏蔽装置，该装置包括用户生成内容发表请求接收单元、用户生成内容解析单元和验扰处理单元，其中：用户生成内容发表请求接收单元，用于接收用户生成内容发表请求；用户生成内容提及处理单元，用于解析所述用户生成内容发表请求以判断是否包含提及对象；

验扰处理单元，用于当用户生成内容解析单元判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

一种用户生成内容提及的验扰屏蔽系统，包括终端和服务器，其中：终端，用于生成用户生成内容，并向服务器发送用户生成内容发表请求；

服务器，用于解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

一种存储介质，其中存储有计算机程序，该计算机程序用于执行如下方法：

接收用户生成内容发表请求；

从上述技术方案可以看出，在本发明实施方式中，接收用户生成内容发表请求；解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的验扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。由此可见，应用本发明实施方式之后实现了一种用户生成内容提及验扰的智能屏蔽策略，可以在微博发表之前对提及验扰进行智能屏蔽。本发明实施方式克服了现有技术的事后处理的缺陷，实现了针对用户生成内容提及验扰的事先处理，提高了针对用户生成内容提及验扰的处理实时性，提高了用户生成内容提及验扰的处理效率。

而且，本发明实施方式实现了针对用户生成内容提及验扰的自动屏蔽，克服了现有技术中人工审核的缺陷，节省了运营成本，而且本发明实施方式综合了消息体内容、用户特征和关系链三个大维度的特征，增加了综合得分的准确性，而且每个得分项可以调整，能够适应不断变化的恶意提及验扰模型，从而提高用户生成内容（比如微博）的整体消息质量，以及提高了用户生成内容提及验扰的处理效率。附图简要说明

以下附图仅为本发明技术方案的一些例子，本发明并不局限于图中示出的特征。以下附图中，相似的标号表示相似的元素：

图 1为现有技术中验扰提及的处理示意图；

图 2为根据本发明实施方式的用户生成内容提及骚扰屏蔽方法流程图；

图 3为根据本发明实施方式的消息内容评估示意图；

图 4为根据本发明实施方式的发起用户特征评估示意图；

图 5为根据本发明实施方式的发起用户与提及对象的关系链特征评估示意图；

图 6为根据本发明实施方式的用户生成内容提及骚扰屏蔽装置结构图；

图 7为根据本发明实施方式的用户生成内容提及骚扰屏蔽系统结构图。实施本发明的方式

为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步的详细描述。

为了描述上的筒洁和直观，下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显，本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案，一些实施方式没有进行细致地描述，而是仅给出了框架。下文中， "包括"是指 "包括但不限于"， "根据…… " 是指 "至少根据……，但不限于仅根据…… "。由于汉语的语言习惯，下文中没有特别指出一个成分的数量时，意味着该成分可以是一个也可以是多个，或可理解为至少一个。

图 1为现有技术中验扰提及的处理示意图。

如图 1所示，当有用户 A投诉用户 B恶意提及时，由投诉审核模块判断该账号 B是否对用户 A造成了验扰，如果确认验扰，则根据严重程度对该账号进行禁言或者封号处理。然而，这种方案依赖于用户的反馈，很多用户不知道或者不愿意反馈。而且投诉审核模块是由人工审核的，工作效率低。另外，骚扰的主体（即用户 B )被禁言后可能换一个账号继续进行恶意提及操作，被骚扰用户还是被迫收到很多骚扰的提及。不仅于此，现有技术的处理周期很长，等恶意用户 B被禁言后，用户 A可能已经被验扰很久了，起到的效果不明显。

在本发明实施方式中，提出了一种用户生成内容提及验扰的智能屏蔽策略。本发明实施方式综合多个多维度的消息特征和用户特征，能实时准确地判断出某条消息对提及用户是否为骚扰，进而在该消息进入提及用户的收件箱之前主动将其屏蔽。

图 2为根据本发明实施方式的用户生成内容提及的骚扰屏蔽方法流程图。

如图 2所示，该方法包括：

步骤 201 : 接收用户生成内容发表请求。求，本发明实施方式首先接收该用户生成内容发表请求。

用户可以通过多种方式发出各种类型的用户生成内容发表请求。比如，用户可以在功能手机、智能手机、掌上电脑、个人电脑（PC )、平板电脑或个人数字助理（PDA )等终端上发出用户生成内容发表请求。这些终端上可以安装有操作系统，包括但不限于： Windows操作系统、 LINUX操作系统、 Android操作系统、 Symbian操作系统、 Windows mobile 操作系统、以及 i OS操作系统等等。

以上详细罗列了一些终端的具体类型和具体的操作系统类型，但是本领域技术人员可以意识到，本发明实施方式并不局限于上述罗列的类型，而还可以适用于其他任意的终端类型和操作系统类型之中。

而且，用户生成内容发表请求具体可以包括转发用户生成内容发表请求、评论用户生成内容发表请求、原创用户生成内容发表请求，等等。

在本发明实施方式中，用户生成内容发表请求具体可以包括但是不局限于：社区网络发表请求、视频分享发表请求、微博发表请求或者博客发表请求，等等。步骤 202: 解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的验扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

在这里，首先解析用户生成内容发表请求以判断是否包含提及对象。比如：在微博消息体内容中，有时会使用 "@" 符号后面紧跟用户的账号名，该用户的账号名即为提及对象。因此，在本发明实施方式中可以通过判断是否存在 "@" 符号来判断是否存在提及对象。如果针对用户生成内容发表请求不进行屏蔽的话，用户生成内容发表请求的具体内容都会自动进入提及对象的收件箱。

当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给提及对象。

在本发明实施方式中，可以综合多个多维度的消息特征和用户特征，实时准确地判断出某条消息对提及对象是否构成骚扰，进而在该消息进入提及对象的收件箱之前主动将其屏蔽。

在一个实施方式中，预先设置的验扰判定条件可以为：基于消息内容特征所确定的验扰判定条件。此时，首先解析出该用户生成内容发表请求的消息内容特征，再判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的验扰判定条件。

比如：基于消息内容特征所确定的骚扰判定条件具体可以包括下列中的至少一个：判断该用户生成内容发表请求的消息内容是否包括统一资源定位符（URL ); 判断该用户生成内容发表请求的消息内容是否涉及话题；判断该用户生成内容发表请求的消息内容是否为转发或评论；判断该用户生成内容发表请求的消息内容是否为原创；判断该用户生成内容发表请求的消息内容是否包含预先设定的黑名单词汇；或判断该用户生成内容发表请求的消息内容是否发表于第三方应用，等等。

可以针对多个基于消息内容特征所确定的验扰判定条件进行各种因素的综合判定，图 3为根据本发明实施方式的消息内容评估示意图。比如：

( a )、当用户生成内容发表请求的消息内容中包含 URL时，认为用户生成内容发表请求有可能是骚扰；

( b )、当用户生成内容发表请求为原创（或有话题）且该用户生成内容发表请求的消息内容包含预先设定的黑名单词汇时，认为用户生成内容发表请求有可能是骚扰；

( c )、当用户生成内容发表请求的消息内容中包含 URL以及该用户生成内容发表请求的消息内容发表于第三方应用时，认为用户生成内容发表请求有较大可能是骚扰；

( d )、当该用户生成内容发表请求的消息内容为转发或评论而且该用户生成内容发表请求的消息内容包含预先设定的黑名单词汇时，认为用户生成内容发表请求有较大可能是骚扰。

( e )、当用户生成内容发表请求的消息内容中包含 URL、消息内容发表于第三方应用、消息内容为转发或评论而且该用户生成内容发表请求的消息内容包含预先设定的黑名单词汇时，认为用户生成内容发表请求有较大可能是验扰。

可以针对上述多个基于消息内容特征所确定的验扰判定条件分别设置分值，然后整体求和所有基于消息内容特征所确定的骚扰判定条件的总分值，并基于该总分值与预先设定的基于消息内容特征的门限值进行比较，以判断是否构成验扰，并当构成骚扰时，不将该用户生成内容发表请求的消息内容发送给所述提及对象。其中，可以增加和删除验扰判定条件，而且每个验扰判定条件的得分值优选是动态可调整的，从而能够适应不断变化的恶意提及骚扰模型。

以上详细罗列了基于消息内容特征所确定的骚扰判定条件的具体实例，以及基于多个基于消息内容特征所确定的骚扰判定条件来整体性综合判定是否构成验扰的示范性说明，本领域技术人员可以意识到，这些实例和示范性说明仅仅是阐述性的，并不用于对本发明实施方式进行限定。

图 4为根据本发明实施方式的发起用户特征评估示意图。

在一个实施方式中，预先设置的验扰判定条件具体可以为：基于发起用户特征所确定的骚扰判定条件。此时，首先解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。

具体地，骚扰判定条件包括：判断该用户生成内容发表请求的发起用户在预定时间内是否有消息被屏蔽；和 /或判断该用户生成内容发表请求的发起用户在预定时间内的提及数是否超过预先设定的提及数门限值。

当该用户生成内容发表请求的发起用户在预定时间内有消息被屏蔽时，可以认为该用户生成内容发表请求的发起用户有较大可能性为骚扰用户，因此本次的用户生成内容发表请求有可能是验扰；当判定该用户提及数门限值时，可以认为该用户生成内容发表请求的发起用户有较大可能性为骚扰用户，因此本次的用户生成内容发表请求有可能是骚扰。

可以针对上述多个基于发起用户特征所确定的验扰判定条件分别设置分值，然后整体求和所有基于发起用户特征所确定的验扰判定条件的总分值，并基于该总分值与预先设定的基于发起用户特征的门限值进行比较，以判断是否构成验扰，并当构成骚扰时，不将该用户生成内容发表请求的消息内容发送给所述提及对象。其中，可以增加和删除验扰判定条件，而且每个验扰判定条件的得分值优选是动态可调整的，从而能够适应不断变化的恶意提及骚扰模型。

以上详细罗列了基于发起用户特征所确定的骚扰判定条件的具体实例，以及基于多个发起用户特征所确定的验扰判定条件来整体性综合判定是否构成验扰的示范性说明，本领域技术人员可以意识到，这些实例和示范性说明仅仅是阐述性的，并不用于对本发明实施方式进行限定。

图 5为根据本发明实施方式的发起用户与提及对象的关系链特征评估示意图。

在一个实施方式中，预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件。

此时，解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。

具体地，验扰判定条件包括：判断该提及对象是否收听该用户生成内容发表请求的发起用户；判断该用户生成内容发表请求的发起用户是否收听该提及对象；判断该提及对象是否是认证用户；判断该提及对象的听众是否超过预先设定的听众人数门限值；判断该用户生成内容发表请求的发起用户是否是认证用户；或判断该用户生成内容发表请求的发可以针对多个基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件进行各种因素的综合判定。比如：

( a )、当提及对象收听该用户生成内容发表请求的发起用户时，则认为用户生成内容发表请求有较大可能不是验扰。 ( b )、当该用户生成内容发表请求的发起用户收听该提及对象时 , 则认为用户生成内容发表请求较大可能不是验扰。

( c )、当该提及对象是认证用户时，认为用户生成内容发表请求有可能是骚扰。

( d )、当该提及对象的听众超过预先设定的听众人数门限值，认为用户生成内容发表请求有可能是骚扰。

( e )、当该用户生成内容发表请求的发起用户是认证用户时，则认为用户生成内容发表请求较大可能不是骚扰。

( f )、当该用户生成内容发表请求的发起用户的听众超过预先设定的听众人数门限值时，则认为用户生成内容发表请求较大可能不是骚扰。

可以针对上述多个基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件分别设置分值，然后整体求和所有基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件的总分值，并基于该总分值与预先设定的基于发起用户关系链特征和提及对象关系链特征的门限值进行比较，以判断是否构成验扰，并当构成骚扰时，不将该用户生成内容发表请求的消息内容发送给所述提及对象。其中，可以增加和删除骚扰判定条件，而且每个骚扰判定条件的得分值优选是动态可调整的，从而能够适应不断变化的恶意提及验扰模型。

其中，例如用户生成内容发表请求的发起用户提及了提及对象，但是提及对象收听了用户生成内容发表请求的发起用户，这时该消息为骚扰的可能性很低，因此，可以给提及对象收听该用户生成内容发表请求的发起用户这个判断条件设定为足够大的负数分，以保证最后的总得分不会超过屏蔽阈值。

以上详细罗列了基于发起用户关系链特征和提及对象关系链特征所确定的骚扰判定条件的具体实例，以及基于多个发起用户关系链特征和提及对象关系链特征所确定的骚扰判定条件来整体性综合判定是否构成验扰的示范性说明，本领域技术人员可以意识到，这些实例和示范性说明仅仅是阐述性的，并不用于对本发明实施方式进行限定。

在一个实施方式中，还可以综合考虑消息内容特征、发起用户特征与发起用户关系链特征及提及对象关系链特征，这三大验扰判定条件来整体判断是否构成验扰。此时，预先设置的验扰判定条件具体可以包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项，所加权确定的骚扰判定条件。然后解析出该用户生成内容发表请求的消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中的该至少两项，并基于预先设置的加权算法计算该至少两项的整体权值；判断该整体权值是否满足预先设置的整体权值门限值。比如：可以基于消息内容特征和发起用户特征这两项加权确定验扰判定条件；也可以基于消息内容特征，发起用户关系链特征及提及对象关系链特征这两项加权确定骚扰判定条件；还可以基于消息内容特征和发起用户关系链特征及提及对象关系链特征这两项加权确定骚扰判定条件。

在这里，可以针对多个基于消息内容特征的骚扰判定条件、多个基于发起用户特征的验扰判定条件、多个基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件中的每一个分别设置分值，然后整体求和所有这些特征所确定的验扰判定条件的总分值，并基于该总分值与预先设定的整体门限值进行比较，以判断是否构成验扰，并当构成骚扰时，不将该用户生成内容发表请求的消息内容发送给所述提及对象。其中，可以增加和删除骚扰判定条件，而且每个骚扰判定条件的得分值优选是动态可调整的，从而能够适应不断变化的恶意提及骚扰模型。

基于上述详细分析，本发明实施方式还提出了一种用户生成内容提及的验扰屏蔽装置。

图 6为根据本发明实施方式的用户生成内容提及的骚扰屏蔽装置结构图。

如图 6所示，该装置包括用户生成内容发表请求接收单元 601、用户生成内容解析单元 602和骚扰处理单元 603 , 其中：

用户生成内容发表请求接收单元 601 , 用于接收用户生成内容发表请求；

用户生成内容解析单元 602, 用于解析所述用户生成内容发表请求以判断是否包含提及对象；

骚扰处理单元 603 , 用于当用户生成内容解析单元判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

在一个实施方式中，所述预先设置的验扰判定条件为：基于消息内容特征所确定的骚扰判定条件；

骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的消息内容特征，并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的骚扰判定条件。

具体地，验扰判定条件包括下列中的至少一个：判断该用户生成内容发表请求的消息内容是否包括统一资源定位符；判断该用户生成内容发表请求的消息内容是否涉及话题；判断该用户生成内容发表请求的消息内容是否为转发或评论；判断该用户生成内容发表请求的消息内容是否为原创；判断该用户生成内容发表请求的消息内容是否包含预先设定的黑名单词汇；或判断该用户生成内容发表请求的消息内容是否发表于第三方应用。

在一个实施方式中，预先设置的验扰判定条件为：基于发起用户特征所确定的验扰判定条件；

骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。

具体地，验扰判定条件包括下列中的至少一个：判断该用户生成内容发表请求的发起用户在预定时间内是否有消息被屏蔽；或判断该用户定的提及数门限值。

在一个实施方式中，预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件；

骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。

具体地，骚扰判定条件包括下列中的至少一个：

判断该提及对象是否收听该用户生成内容发表请求的发起用户；判断该用户生成内容发表请求的发起用户是否收听该提及对象；判断该提及对象是否是认证用户；判断该提及对象的听众是否超过预先设定的听众人数门限值；判断该用户生成内容发表请求的发起用户是否是认证用户；或判断该用户生成内容发表请求的发起用户的听众是否超过预先设定的听众人数门限值。

更优选地，预先设置的验扰判定条件包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项，所加权确定的骚扰判定条件；此时：

验扰处理单元 603包括消息内容特征评判子单元 6031、发起用户特征评判子单元 6032、关系链评判子单元 6033和整体评判子单元 6034; 消息内容特征评判子单元 6031 , 用于计算该用户生成内容发表请求的消息内容特征值；

发起用户特征评判子单元 6032, 用于计算该用户生成内容发表请求的发起用户特征值；

关系链评判子单元 6033 , 用于计算该发起用户关系链及提及对象关系链的特征值；

整体评判子单元 6034, 用于对该发起用户关系链及提及对象关系链的特征值、消息内容特征值和发起用户特征值中的该至少两项进行加权计算，得到整体评判值，并判断该整体权值是否满足预先设置的整体权值门限值，当超过整体权值门限值的时候，则判定该条消息对提及用户构成骚扰。

其中，消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中，如果在验扰判定条件中没有涉及到，可以将该项所对应的评判子单元的特征值设置为 0。

其中，如果整体评判子单元 6034判断该用户生成内容发表请求为骚扰，则不将该用户生成内容发表请求的消息内容发送给提及对象。

可以将图 6所示装置集成到各种通信网络的硬件实体当中。比如，可以将用户生成内容提及的骚扰屏蔽装置集成到：功能手机、智能手机、掌上电脑、个人电脑（PC )、平板电脑或个人数字助理（PDA ), 等等设备之中。

图 7为根据本发明实施方式的用户生成内容提及骚扰屏蔽系统结构图。

如图 7所示，该系统包括终端 701和服务器 702, 终端 701和服务器 702之间具有通讯连接，其中：

终端 701 , 用于生成用户生成内容，并向服务器 702发送用户生成内容发表请求；

服务器 702, 用于解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的验扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。

服务器 702, 用于解析出该用户生成内容发表请求的消息内容特征，并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的骚扰判定条件。

在一个实施方式中，所述预先设置的验扰判定条件为：基于发起用户特征所确定的骚扰判定条件；

服务器 702, 用于解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。

在一个实施方式中，所述预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的验扰判定条件；

服务器 702, 用于解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。在一个实施方式中，所述预先设置的验扰判定条件包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项加权确定的验扰判定条件；

服务器 702, 用于解析出该用户生成内容发表请求的消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中的该至少两项，并基于预先设置的加权算法计算该至少两项的整体权值；判断该整体权值是否满足预先设置的整体权值门限值。

需要说明的是，上述各流程和各结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分，实际实现时，一个模块可以分由多个模块实现，多个模块的功能也可以由同一个模块实现，这些模块可以位于同一个设备中，也可以位于不同的设备中。

各实施例中的硬件模块可以以机械方式或电子方式实现。例如，理器，如 FPGA或 ASIC ) 用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路（如包括通用处理器或其它可编程处理器）用于执行特定操作。至于具体采用机械方式，或是采用专用的永久性电路，或是采用临时配置的电路（如由软件进行配置）来实现硬件模块，可以根据成本和时间上的考虑来决定。

本发明还提供了一种机器可读的存储介质，存储用于使一机器执行如本文所述方法的指令。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机（或 CPU或 MPU ) 读出并执行存储在存储介质中的程序代码。此外，还可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作。还可以将从存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的 CPU等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘（如 CD-ROM、 CD-R , CD-RW、 DVD-ROM、 DVD-RAM、 DVD-RW, DVD+RW )、磁带、非易失性存储卡和 ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

综上所述，在本发明实施方式中，接收用户生成内容发表请求；解析所述用户生成内容发表请求以判断是否包含提及对象，并当判定包含提及对象时，进一步判断该用户生成内容发表请求是否满足预先设置的验扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对象。由此可见，应用本发明实施方式之后实现了一种用户生成内容提及骚扰的智能屏蔽策略，可以在微博发表之前对提及骚扰进行智能屏蔽。本发明实施方式克服了现有技术的事后处理的缺陷，实现了针对用户生成内容提及验扰的事先处理，因此提高了处理的实时性，提高了用户生成内容提及验扰的处理效率。

而且，本发明实施方式实现了针对用户生成内容提及验扰的自动屏蔽，克服了现有技术中人工审核的缺陷，节省了运营成本，而且本发明实施方式综合了消息体内容、用户特征和关系链三个大维度的特征，增加了综合得分的准确性，而且每个得分项可以调整，能够适应不断变化的恶意提及骚扰模型，从而提高微博的整体消息质量以及提高了用户生成内容提及骚扰的处理效率。以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求书

1、一种用户生成内容提及的验扰屏蔽方法，其特征在于，该方法包括：

接收用户生成内容发表请求；

2、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述预先设置的验扰判定条件为：基于消息内容特征所确定的骚扰判定条件；

所述判断该用户生成内容发表请求是否满足预先设置的验扰判定条件为：

解析出该用户生成内容发表请求的消息内容特征，并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的骚扰判定条件。

3、根据权利要求 2所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述验扰判定条件包括下列中的至少一个：

判断该用户生成内容发表请求的消息内容是否包括统一资源定位付；

判断该用户生成内容发表请求的消息内容是否涉及话题；判断该用户生成内容发表请求的消息内容是否为转发或评论；判断该用户生成内容发表请求的消息内容是否为原创；

判断该用户生成内容发表请求的消息内容是否包含预先设定的黑名单词汇；或

判断该用户生成内容发表请求的消息内容是否发表于第三方应用。

4、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述预先设置的验扰判定条件为：基于发起用户特征所确定的骚扰判定条件；

解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。

5、根据权利要求 4所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述验扰判定条件包括下列中的至少一个：

判断该用户生成内容发表请求的发起用户在预定时间内是否有消息被屏蔽；或

判断该用户生成内容发表请求的发起用户在预定时间内的提及数是否超过预先设定的提及数门限值。

6、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的骚扰判定条件；

解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的验扰判定条件。

7、根据权利要求 6所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述验扰判定条件包括下列中的至少一个：

判断该提及对象是否收听该用户生成内容发表请求的发起用户；判断该用户生成内容发表请求的发起用户是否收听该提及对象；判断该用户生成内容发表请求的发起用户是否是认证用户；或判断该用户生成内容发表请求的发起用户的听众是否超过预先设定的听众人数门限值。

8、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法，其特征在于，所述预先设置的验扰判定条件包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项加权确定的骚扰判定条件；

解析出该用户生成内容发表请求的消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中的该至少两项，并基于预先设置的加权算法计算该至少两项的整体权值；

判断该整体权值是否满足预先设置的整体权值门限值。

9、一种用户生成内容提及的验扰屏蔽装置，其特征在于，该装置包括用户生成内容发表请求接收单元、用户生成内容解析单元和验扰处理单元，其中：

用户生成内容发表请求接收单元，用于接收用户生成内容发表请求；用户生成内容解析单元，用于解析所述用户生成内容发表请求以判断是否包含提及对象；

验扰处理单元，用于当用户生成内容解析单元判定包含提及对象时，判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件，如果满足，则不将该用户生成内容发表请求的消息内容发送给所述提及对

10、根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置，其特征在于，所述预先设置的验扰判定条件为：基于消息内容特征所确定的骚扰判定条件；

验扰处理单元，用于解析出该用户生成内容发表请求的消息内容特征，并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的验扰判定条件。

11、根据权利要求 10所述的用户生成内容提及的验扰屏蔽装置，其特征在于，所述验扰判定条件包括下列中的至少一个：

12、根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置，其特征在于，所述预先设置的验扰判定条件为：基于发起用户特征所确定的骚扰判定条件；

验扰处理单元，用于解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的验扰判定条件。

13、根据权利要求 12所述的用户生成内容提及的骚扰屏蔽装置，其特征在于，所述验扰判定条件包括下列中的至少一个：

14、根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置，其特征在于，所述预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的骚扰判定条件；

验扰处理单元，用于解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。

15、根据权利要求 14所述的用户生成内容提及的骚扰屏蔽装置，其特征在于，所述验扰判定条件包括下列中的至少一个：

判断该提及对象是否收听该用户生成内容发表请求的发起用户；判断该用户生成内容发表请求的发起用户是否收听该提及对象；判断该提及对象是否是认证用户；判断该用户生成内容发表请求的发起用户是否是认证用户；或判断该用户生成内容发表请求的发起用户的听众是否超过预先设定的听众人数门限值。

16、根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置，其特征在于，所述预先设置的骚扰判定条件包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项加权确定的骚扰判定条件；

验扰处理单元包括消息内容特征评判子单元、发起用户特征评判子单元、关系链评判子单元和整体评判子单元；其中：消息内容特征评判子单元，用于计算该用户生成内容发表请求的消息内容特征值；

发起用户特征评判子单元，用于计算该用户生成内容发表请求的发起用户特征值；

关系链评判子单元，用于计算该发起用户关系链及提及对象关系链的特征值；

整体评判子单元，用于对该发起用户关系链及提及对象关系链的特征值、消息内容特征值和发起用户特征值中的该至少两项进行加权计算，得到整体评判值，并判断该整体权值是否满足预先设置的整体权值门限值。

17、一种用户生成内容提及的验扰屏蔽系统，其特征在于，包括终端和服务器，其中：

终端，用于生成用户生成内容，并向服务器发送用户生成内容发表请求；

18、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统，其特征在于，所述预先设置的验扰判定条件为：基于消息内容特征所确定的骚扰判定条件；

服务器，用于解析出该用户生成内容发表请求的消息内容特征，并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的骚扰判定条件。

19、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统，其特征在于，所述预先设置的验扰判定条件为：基于发起用户特征所确定的骚扰判定条件；

服务器，用于解析出该用户生成内容发表请求的发起用户特征，并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。

20、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统，其特征在于，所述预先设置的验扰判定条件为：基于发起用户关系链特征和提及对象关系链特征所确定的骚扰判定条件；

服务器，用于解析出该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征，并判断该用户生成内容发表请求的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。

21、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统，其特征在于，所述预先设置的骚扰判定条件包括：基于消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项加权确定的骚扰判定条件；

服务器，用于解析出该用户生成内容发表请求的消息内容特征、发起用户特征和发起用户关系链特征及提及对象关系链特征中的该至少两项，并基于预先设置的加权算法计算该至少两项的整体权值；判断该整体权值是否满足预先设置的整体权值门限值。

22、一种存储介质，其特征在于，其中存储有计算机程序，该计算机程序用于执行如下方法：

接收用户生成内容发表请求；