CN103106217A - 一种留言信息的处理方法和设备 - Google Patents

一种留言信息的处理方法和设备 Download PDF

Info

Publication number
CN103106217A
CN103106217A CN2011103611520A CN201110361152A CN103106217A CN 103106217 A CN103106217 A CN 103106217A CN 2011103611520 A CN2011103611520 A CN 2011103611520A CN 201110361152 A CN201110361152 A CN 201110361152A CN 103106217 A CN103106217 A CN 103106217A
Authority
CN
China
Prior art keywords
information
message
sensitive words
message information
described message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103611520A
Other languages
English (en)
Other versions
CN103106217B (zh
Inventor
周龄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201110361152.0A priority Critical patent/CN103106217B/zh
Publication of CN103106217A publication Critical patent/CN103106217A/zh
Application granted granted Critical
Publication of CN103106217B publication Critical patent/CN103106217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种留言信息的处理方法和设备,该方法包括:服务器根据预设周期更新敏感字信息;所述服务器接收用户留言信息,并通过所述敏感字信息对所述留言信息进行敏感字检查;当所述留言信息通过敏感字检查时,所述服务器在其留言数据库中存储所述留言信息;当所述留言信息没有通过敏感字检查时,所述服务器拒绝在所述留言数据库中存储所述留言信息。本发明实施例中,通过使用最新出现的敏感字对留言信息进行敏感字检查,以提高检查的准确性,提高用户的使用感受。此外,通过对留言数据库中的留言信息进行分析,得到包含有广告信息的留言,并删除该包含有广告信息的留言,从而进一步提高用户的使用感受。

Description

一种留言信息的处理方法和设备
技术领域
本发明涉及通信技术领域,特别是涉及一种留言信息的处理方法和设备。
背景技术
Web Game(网页游戏)是指在Web浏览器上运行的游戏,客户端可使用HTML(Hypertext Markup Language,文本标记语言)、XML(Extensible Markup Language,可扩展标记语言)、JavaScript(客户端脚本语言)、Ajax(网页开发技术)、DOM(Document Object Model,文档对象模型)或Flash action(flash动画)等,实现界面和用户的交互,服务器端使用CGI(Common Gateway Interface,通用网关界面)或者脚本来实现游戏逻辑的处理。
Web Game与传统的游戏相比,其优势在于:无需下载安装游戏客户端,打开Web浏览器即可运行游戏。
留言系统是为Web Game提供的用户间相互交流、互动的通道,用户可以借助该留言系统实现和好友的信息互通;此外,留言系统也可为Web Game的系统管理员提供发布消息到用户的能力。
现有技术中,针对留言系统,可通过预先配置的文件对用户的留言进行脏话/敏感字检查,并根据检查结果进行相应的处理。
在实现本发明的过程中,发明人发现现有技术中至少存在以下问题:
现有技术中,只能根据本地的配置文件进行脏字/敏感字检查,然后做出相应的动作,不能匹配最新出现的敏感字,也无法识别广告信息,从而导致敏感字检查的准确率降低,用户的使用感受不好。
发明内容
本发明实施例提供一种留言信息的处理方法和设备,以提高敏感字检查的准确率。
为了达到上述目的,本发明实施例提供一种留言信息的处理方法,该方法包括:
服务器根据预设周期更新敏感字信息;
所述服务器接收用户留言信息,并通过所述敏感字信息对所述留言信息进行敏感字检查;
当所述留言信息通过敏感字检查时,所述服务器在其留言数据库中存储所述留言信息;
当所述留言信息没有通过敏感字检查时,所述服务器拒绝在所述留言数据库中存储所述留言信息。
所述服务器在其留言数据库中存储所述留言信息,之后还包括:
所述服务器确定所述留言信息中是否包含有指定类型的信息,若是,则所述服务器从所述留言数据库中删除所述留言信息。
所述服务器在其留言数据库中存储所述留言信息,之后还包括:
所述服务器将所述存储的留言信息抄送到旁路分析系统中;
所述旁路分析系统确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
所述指定类型的信息,包括:广告信息。
所述服务器拒绝在所述留言数据库中存储所述留言信息,包括:
所述服务器返回所述留言信息出现错误的信息;或者,
所述服务器通过指定标识替换所述留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到所述留言数据库中。
本发明实施例提供一种服务器,包括:
敏感字代理单元,用于根据预设周期更新敏感字信息;
敏感字检查单元,用于接收用户留言信息,并通过所述敏感字代理单元更新的所述敏感字信息对所述留言信息进行敏感字检查;
留言信息处理单元,用于当所述留言信息通过所述敏感字检查单元的敏感字检查时,在其留言数据库中存储所述留言信息;
当所述留言信息没有通过所述敏感字检查单元的敏感字检查时,拒绝在所述留言数据库中存储所述留言信息。
所述留言信息处理单元,还用于确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
所述留言信息处理单元,还用于将所述留言数据库中存储的所述留言信息抄送到旁路分析系统中;由所述旁路分析系统确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
所述指定类型的信息,包括:广告信息。
所述留言信息处理单元,具体用于当所述留言信息没有通过敏感字检查时,返回所述留言信息出现错误的信息;或者,
通过指定标识替换所述留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到所述留言数据库中。
与现有技术相比,本发明实施例至少具有以下优点:
通过使用最新出现的敏感字对留言信息进行敏感字检查,以提高检查的准确性,提高用户的使用感受。此外,通过对留言数据库中的留言信息进行分析,得到包含有广告信息的留言,并删除该包含有广告信息的留言,从而进一步提高用户的使用感受。
附图说明
图1是本发明实施例一提供的一种参考网络模型示意图;
图2是本发明实施例一提供的一种留言信息的处理方法流程图;
图3是本发明实施例二提供的一种参考网络模型示意图;
图4是本发明实施例二提供的一种留言信息的处理方法流程图;
图5是本发明实施例三提出的一种服务器的结构图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
实施例一
本发明实施例一提出一种留言信息的处理方法,该方法可应用于留言系统中,对用户的留言信息进行处理,如图1所示,为本发明实施例的留言分析的参考网络模型示意图。
基于上述网络模型,如图2所示,该留言信息的处理方法包括以下步骤:
步骤201,服务器根据预设周期更新敏感字信息。
该预设周期可以根据实际经验任意选择,例如,每10s钟敏感字信息会发生变化时,则可以设置该预设周期为10s。
基于图1的网络架构,服务器中的Dirty Agent(敏感字代理)会实时的从网络中获得最新的敏感字库(即敏感字信息),并更新敏感字信息,该过程本发明实施例中不再详加说明。
步骤202,服务器接收用户留言信息,并通过敏感字信息对留言信息进行敏感字检查。
针对用户发起的留言,在服务器对留言信息进行敏感字检查之前,服务器需要从Dirty Agent中获得最新的敏感字信息;在服务器对留言信息进行敏感字检查的过程中,服务器通过该最新的敏感字信息以及当前存在的敏感字信息对留言信息进行敏感字检查。
例如,当前存在的敏感字信息为敏感字A和敏感字B,Dirty Agent中存在有最新的敏感字C;在对留言信息进行敏感字检查时,服务器首先从Dirty Agent获得敏感字C,并利用敏感字A、敏感字B和敏感字C对留言信息进行敏感字检查。
基于图1的网络架构,针对用户发起的留言,服务器中的敏感字检查的API(Application Programming Interface,应用程序编程接口)会从Dirty Agent中拉取最新的敏感字信息,并利用该最新的敏感字信息以及当前存在的敏感字信息对留言信息进行敏感字检查。
本发明实施例中,服务器在通过敏感字信息对留言信息进行敏感字检查的过程中,可通过敏感字信息对留言信息进行敏感字匹配,该匹配方式取决于匹配算法,本发明实施例不再赘述。
本发明实施例中,当留言信息通过敏感字检查时,执行步骤203;当留言信息没有通过敏感字检查时,执行步骤204。
步骤203,服务器在其留言数据库(留言DB)中存储留言信息。
步骤204,服务器拒绝在留言数据库中存储留言信息。
具体的,服务器可返回留言信息出现错误的信息(即服务器发现有敏感字则直接进行报错返回,返回一个错误码);或者,
服务器通过指定标识(如*等)替换留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到留言数据库中。
综上所述,本发明实施例中,通过使用最新出现的敏感字对留言信息进行敏感字检查,以提高检查的准确性,提高用户的使用感受。
实施例二
本发明实施例二提出一种留言信息的处理方法,该方法可应用于留言系统中,对用户的留言信息进行处理,如图3所示,为本发明实施例的留言分析的参考网络模型示意图。
基于上述网络模型,如图4所示,该留言信息的处理方法包括以下步骤:
步骤401,服务器根据预设周期更新敏感字信息。
该预设周期可以根据实际经验任意选择,例如,每10s钟敏感字信息会发生变化时,则可以设置该预设周期为10s。
基于图3的网络架构,服务器中的Dirty Agent会实时的从网络中获得最新的敏感字库(即敏感字信息),并更新敏感字信息,该过程本发明实施例中不再详加说明。
步骤402,服务器接收用户留言信息,并通过敏感字信息对留言信息进行敏感字检查。
针对用户发起的留言,在服务器对留言信息进行敏感字检查之前,服务器需要从Dirty Agent中获得最新的敏感字信息;在服务器对留言信息进行敏感字检查的过程中,服务器通过该最新的敏感字信息以及当前存在的敏感字信息对留言信息进行敏感字检查。
基于图3的网络架构,针对用户发起的留言,服务器中的敏感字检查的API会从Dirty Agent中拉取最新的敏感字信息,并利用该最新的敏感字信息以及当前存在的敏感字信息对留言信息进行敏感字检查。
本发明实施例中,服务器在通过敏感字信息对留言信息进行敏感字检查的过程中,可通过敏感字信息对留言信息进行敏感字匹配,该匹配方式取决于常规匹配算法,本发明实施例不再赘述。
本发明实施例中,当留言信息没有通过敏感字检查时,执行步骤403;当留言信息通过敏感字检查时,执行步骤404。
步骤403,服务器拒绝在其留言数据库(留言DB)中存储留言信息。
具体的,服务器可返回留言信息出现错误的信息(即服务器发现有敏感字则直接进行报错返回,返回一个错误码);或者,服务器通过指定标识(如*等)替换留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到留言数据库中。
步骤404,服务器在留言数据库中存储留言信息。
步骤405,服务器确定留言信息中是否包含有指定类型的信息,若是,则服务器从留言数据库中删除该留言信息。其中,该指定类型的信息包括但不限于:广告信息、或其他非和谐信息。
其中步骤405也可以用以下步骤替代:
服务器将留言信息抄送到旁路分析系统中;旁路分析系统确定留言信息中是否包含有指定类型的信息,若是,则旁路分析系统从留言数据库中删除该留言信息。该旁路分析系统可以是一个广告信息服务器,该广告信息服务器定期地更新其数据库以提升其过滤广告的能力。
具体的,在敏感字检查通过之后,服务器会将留言信息存储到留言数据库中,并将该留言信息抄送一份到旁路分析系统中。之后,旁路分析系统可以在连线或者离线状态(即与上述敏感字检查相独立的过程)下对留言信息进行分析,在分析过程中,如果旁路分析系统发现留言信息中含有广告信息或者其他非和谐信息,则旁路分析系统会通过留言系统提供的API删除接口将该留言信息从留言数据库中删除。
综上所述,本发明实施例中,通过使用最新出现的敏感字对留言信息进行敏感字检查,以提高检查的准确性,提高用户的使用感受。此外,通过对留言数据库中的留言信息进行分析,得到包含有广告信息的留言,并删除该包含有广告信息的留言,从而进一步提高用户的使用感受。另外,在抄送旁路系统的步骤中,即使抄送失败也不会对用户造成困扰,只是保留了一些广告信息而已。
实施例三
基于与上述方法同样的技术构思,本发明实施例还提出了一种服务器,如图5所示,包括:
敏感字代理单元11,用于根据预设周期更新敏感字信息;
敏感字检查单元12,用于接收用户留言信息,并通过所述敏感字代理单元更新的所述敏感字信息对所述留言信息进行敏感字检查;
留言信息处理单元13,用于当所述留言信息通过所述敏感字检查单元的敏感字检查时,在其留言数据库中存储所述留言信息;
当所述留言信息没有通过所述敏感字检查单元的敏感字检查时,拒绝在所述留言数据库中存储所述留言信息。
本发明实施例中,所述留言信息处理单元13,还用于确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
所述留言信息处理单元13,还用于将所述留言数据库中存储的所述留言信息抄送到旁路分析系统中;由所述旁路分析系统确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
所述指定类型的信息,包括:广告信息。
所述留言信息处理单元13,具体用于当所述留言信息没有通过敏感字检查时,返回所述留言信息出现错误的信息;或者,
通过指定标识替换所述留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到所述留言数据库中。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (10)

1.一种留言信息的处理方法,其特征在于,该方法包括:
服务器根据预设周期更新敏感字信息;
所述服务器接收用户留言信息,并通过所述敏感字信息对所述留言信息进行敏感字检查;
当所述留言信息通过敏感字检查时,所述服务器在其留言数据库中存储所述留言信息;
当所述留言信息没有通过敏感字检查时,所述服务器拒绝在所述留言数据库中存储所述留言信息。
2.如权利要求1所述的方法,其特征在于,所述服务器在其留言数据库中存储所述留言信息,之后还包括:
所述服务器确定所述留言信息中是否包含有指定类型的信息,若是,则所述服务器从所述留言数据库中删除所述留言信息。
3.如权利要求1所述的方法,其特征在于,所述服务器在其留言数据库中存储所述留言信息,之后还包括:
所述服务器将所述存储的留言信息抄送到旁路分析系统中;
所述旁路分析系统确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
4.如权利要求2或3所述的方法,其特征在于,所述指定类型的信息,包括:广告信息。
5.如权利要求1所述的方法,其特征在于,所述服务器拒绝在所述留言数据库中存储所述留言信息,包括:
所述服务器返回所述留言信息出现错误的信息;或者,
所述服务器通过指定标识替换所述留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到所述留言数据库中。
6.一种服务器,其特征在于,包括:
敏感字代理单元,用于根据预设周期更新敏感字信息;
敏感字检查单元,用于接收用户留言信息,并通过所述敏感字代理单元更新的所述敏感字信息对所述留言信息进行敏感字检查;
留言信息处理单元,用于当所述留言信息通过所述敏感字检查单元的敏感字检查时,在其留言数据库中存储所述留言信息;
当所述留言信息没有通过所述敏感字检查单元的敏感字检查时,拒绝在所述留言数据库中存储所述留言信息。
7.如权利要求6所述的服务器,其特征在于,
所述留言信息处理单元,还用于确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
8.如权利要求6所述的服务器,其特征在于,
所述留言信息处理单元,还用于将所述留言数据库中存储的所述留言信息抄送到旁路分析系统中;由所述旁路分析系统确定所述留言信息中是否包含有指定类型的信息,若是,则从所述留言数据库中删除所述留言信息。
9.如权利要求7或8所述的服务器,其特征在于,所述指定类型的信息,包括:广告信息。
10.如权利要求6所述的服务器,其特征在于,
所述留言信息处理单元,具体用于当所述留言信息没有通过敏感字检查时,返回所述留言信息出现错误的信息;或者,
通过指定标识替换所述留言信息中没有通过敏感字检查的敏感字,并将替换后的留言信息存储到所述留言数据库中。
CN201110361152.0A 2011-11-15 2011-11-15 一种留言信息的处理方法和设备 Active CN103106217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110361152.0A CN103106217B (zh) 2011-11-15 2011-11-15 一种留言信息的处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110361152.0A CN103106217B (zh) 2011-11-15 2011-11-15 一种留言信息的处理方法和设备

Publications (2)

Publication Number Publication Date
CN103106217A true CN103106217A (zh) 2013-05-15
CN103106217B CN103106217B (zh) 2016-09-14

Family

ID=48314081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110361152.0A Active CN103106217B (zh) 2011-11-15 2011-11-15 一种留言信息的处理方法和设备

Country Status (1)

Country Link
CN (1) CN103106217B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107733924A (zh) * 2017-11-27 2018-02-23 北京小米移动软件有限公司 短信息云同步方法、装置、终端及存储介质
CN108304537A (zh) * 2018-01-30 2018-07-20 上海康斐信息技术有限公司 截留用户留言的方法和系统
TWI650655B (zh) * 2015-05-07 2019-02-11 浚鴻數據開發股份有限公司 網路事件自動蒐集分析方法及系統

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7013300B1 (en) * 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
CN1949780A (zh) * 2006-10-12 2007-04-18 百度在线网络技术(北京)有限公司 网络留言系统及留言过滤方法
CN101964000A (zh) * 2010-11-09 2011-02-02 焦点科技股份有限公司 一种敏感词自动过滤管理系统
CN103065027A (zh) * 2011-10-19 2013-04-24 腾讯科技(深圳)有限公司 一种提供给第三方sns网页游戏的留言方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7013300B1 (en) * 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
CN1949780A (zh) * 2006-10-12 2007-04-18 百度在线网络技术(北京)有限公司 网络留言系统及留言过滤方法
CN101964000A (zh) * 2010-11-09 2011-02-02 焦点科技股份有限公司 一种敏感词自动过滤管理系统
CN103065027A (zh) * 2011-10-19 2013-04-24 腾讯科技(深圳)有限公司 一种提供给第三方sns网页游戏的留言方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI650655B (zh) * 2015-05-07 2019-02-11 浚鴻數據開發股份有限公司 網路事件自動蒐集分析方法及系統
CN107733924A (zh) * 2017-11-27 2018-02-23 北京小米移动软件有限公司 短信息云同步方法、装置、终端及存储介质
CN108304537A (zh) * 2018-01-30 2018-07-20 上海康斐信息技术有限公司 截留用户留言的方法和系统

Also Published As

Publication number Publication date
CN103106217B (zh) 2016-09-14

Similar Documents

Publication Publication Date Title
CN104766014B (zh) 用于检测恶意网址的方法和系统
CN110399550A (zh) 一种信息推荐方法及装置
CN107943838B (zh) 一种自动获取xpath生成爬虫脚本的方法及系统
CN102163203B (zh) 网页下载的方法和装置
CN105243159A (zh) 一种基于可视化脚本编辑器的分布式网络爬虫系统
CN109376291B (zh) 一种基于网络爬虫的网站指纹信息扫描的方法及装置
CN104572043A (zh) 一种对客户端应用的控件进行实时埋点的方法及装置
CN108366058A (zh) 防止广告运营商流量劫持的方法、装置、设备及存储介质
CN106980497A (zh) 网页网站性能优化方法和装置
CN106685687A (zh) 灰度发布方法及装置
CN109871963A (zh) 运行故障还原方法、装置、电子设备及存储介质
CN104992117A (zh) Html5移动应用程序的异常行为检测方法和行为模型建立方法
CN102662966A (zh) 一种面向主题的获取动态页面内容的方法及系统
CN102523106A (zh) 基于FlexRIA技术的视频网站用户行为分析系统
CN112182359A (zh) 推荐模型的特征管理方法及系统
CN113568841A (zh) 一种针对小程序的风险检测方法、装置及设备
CN105528416A (zh) 一种网站更新内容的监测方法及系统
CN109657125A (zh) 基于网络爬虫的数据处理方法、装置、设备及存储介质
CN103440199A (zh) 测试引导方法和装置
CN111666298A (zh) 基于flink的用户服务类别检测方法、装置、计算机设备
CN103106217A (zh) 一种留言信息的处理方法和设备
CN104424188A (zh) 对获取的网页数据进行更新的系统及方法
CN107368407A (zh) 信息处理方法和装置
CN113392306A (zh) 信息交互方法、信息交互装置、终端及存储介质
CN116720489A (zh) 页面填充方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant