CN105468684B - 敏感词过滤系统及其通信方法 - Google Patents

敏感词过滤系统及其通信方法 Download PDF

Info

Publication number
CN105468684B
CN105468684B CN201510788675.1A CN201510788675A CN105468684B CN 105468684 B CN105468684 B CN 105468684B CN 201510788675 A CN201510788675 A CN 201510788675A CN 105468684 B CN105468684 B CN 105468684B
Authority
CN
China
Prior art keywords
sensitive words
server
filtering sensitive
filtering
request packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510788675.1A
Other languages
English (en)
Other versions
CN105468684A (zh
Inventor
王振兴
陈正超
周平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guiyang Longmaster Information and Technology Co ltd
Original Assignee
Guiyang Longmaster Information and Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guiyang Longmaster Information and Technology Co ltd filed Critical Guiyang Longmaster Information and Technology Co ltd
Priority to CN201510788675.1A priority Critical patent/CN105468684B/zh
Publication of CN105468684A publication Critical patent/CN105468684A/zh
Application granted granted Critical
Publication of CN105468684B publication Critical patent/CN105468684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种敏感词过滤系统及其通信方法。上述敏感词过滤系统包括:具备敏感词过滤功能的敏感词过滤服务器,所述敏感词过滤服务器包括:过滤请求输入接口以及过滤结果输出接口;多个业务服务器,各个业务服务器均包括:过滤请求输出接口及过滤结果输入接口,其中,所述多个业务服务器的过滤请求输出接口均与所述敏感词过滤服务器的过滤请求输入接口相连接,所述多个业务服务器的过滤结果输入接口均与所述敏感词过滤服务器的过滤结果输出接口相连接。根据上述技术方案,可以解决了相关技术中在敏感词过滤有问题时会导致正常业务服务器不能正常使用的问题。

Description

敏感词过滤系统及其通信方法
技术领域
本发明涉及通信领域,具体而言,涉及一种敏感词过滤系统及其通信方法。
背景技术
敏感词过滤是每个互联网产品服务器需要考虑的,通常敏感词过滤工作都设置在有需要的服务器中来进行,如图1所示的三种情况,图中敏感词过滤功能都是内嵌到每个需要进行过滤的业务服务器中。
但是,将敏感词过滤与具体的业务服务器耦合在一起,会带来以下几点不便:
1、新增一个涉及到敏感词过滤的业务服务器都需要增加重复的敏感词过滤代码。
2、敏感词过滤功能出现bug崩溃时会导致业务服务器的崩溃。
3、敏感词过滤会影响服务器的处理性能。
敏感词过滤功能的优先级应该是低于业务功能的,不应该出现因为敏感词过滤的问题而导致正常业务服务器不能正常使用;敏感词过滤工作应该是一个公共的算法工作,它只关心敏感词过滤,不用关心具体的业务逻辑,所以它应该服务于全部有敏感词过滤需要的业务服务器。
发明内容
本发明的主要目的在于公开了一种敏感词过滤系统及其通信方法,以至少解决相关技术中敏感词过滤功能内嵌到需要进行过滤的业务服务器中,在敏感词过滤有问题时会导致正常业务服务器不能正常使用的问题。
根据本发明的一个方面,提供了一种敏感词过滤系统。
根据本发明的敏感词过滤系统包括:具备敏感词过滤功能的敏感词过滤服务器,敏感词过滤服务器包括:过滤请求输入接口以及过滤结果输出接口;多个业务服务器,各个业务服务器均包括:过滤请求输出接口及过滤结果输入接口,其中,所述多个业务服务器的过滤请求输出接口均与所述敏感词过滤服务器的过滤请求输入接口相连接,所述多个业务服务器的过滤结果输入接口均与所述敏感词过滤服务器的过滤结果输出接口相连接。
根据本发明的另一方面,提供了一种敏感词过滤系统的通信方法。
根据本发明的敏感词过滤系统的通信方法包括:敏感词过滤服务器接收来自于业务服务器的敏感词过滤请求包和设置于该敏感词过滤请求包之后完整的业务请求包,其中,所述敏感词过滤服务器能够处理的敏感词过滤请求包中填充有业务请求包需要过滤的字符串字段;所述敏感词过滤服务器识别出所述敏感词过滤请求包,并对所述敏感词过滤请求包需要过滤的字符串字段进行遍历过滤;所述敏感词过滤服务器将遍历过滤后的字符串字段填充到敏感词过滤回复包中,并将所述敏感词过滤回复包发送至所述业务处理器。
通过本发明,无须关心具体的业务逻辑,能更好的服务于所有有敏感词过滤需要的业务服务器。敏感词过滤服务器能将敏感词过滤与业务解耦,敏感词服务器崩溃不影响业务服务器正常使用,敏感词过滤的性能开销不在业务服务器上,从而很好的解决了相关技术中敏感词过滤功能内嵌到需要进行过滤的业务服务器中,在敏感词过滤有问题时会导致正常业务服务器不能正常使用的问题。
附图说明
图1是根据相关技术的敏感词过滤系统的结构示意图;
图2是根据本发明实施例的敏感词过滤系统的结构框图;
图3是根据本发明实施例的敏感词过滤系统的通信方法的流程图;以及
图4是根据本发明优选实施例的敏感词过滤系统的通信方法的流程图。
具体实施方式
下面结合说明书附图对本发明的具体实现方式做一详细描述。
图2是根据相关技术的敏感词过滤系统的结构示意图。如图2所示,该敏感词过滤系统包括:
具备敏感词过滤功能的敏感词过滤服务器20,上述敏感词过滤服务器包括:过滤请求输入接口200以及过滤结果输出接口202;
多个业务服务器22,各个业务服务器22均包括:过滤请求输出接口120及过滤结果输入接口222,其中,上述多个业务服务器的过滤请求输出接口220均与上述敏感词过滤服务器20的过滤请求输入接口200相连接,上述多个业务服务器22的过滤结果输入接口222均与上述敏感词过滤服务器的过滤结果输出接口202相连接。
采用图2所示的敏感词过滤系统,无须关心具体的业务逻辑,能更好的服务于所有有敏感词过滤需要的业务服务器。敏感词过滤服务器能将敏感词过滤与业务解耦,敏感词服务器崩溃不影响业务服务器正常使用,敏感词过滤的性能开销不在业务服务器上,从而很好的解决了相关技术中敏感词过滤功能内嵌到需要进行过滤的业务服务器中,在敏感词过滤有问题时会导致正常业务服务器不能正常使用的问题。
其中,上述业务服务器包括但不限于以下至少之一:接入服务器、频道管理服务器、群组服务器。
优选地,各个上述业务服务器与上述敏感词过滤服务器之间可以通过传输控制协议(Transmission Control Protocol,简称为TCP)协议进行通信。
在优选实施过程中,独立的敏感词过滤服务器(PSWFS),从结构上可以看出PSWFS只向外提供敏感词过滤请求输入接口和敏感词过滤结果输出接口这两个接口,有敏感词过滤需要的业务服务器只需要向PSWFS的过滤请求输入接口发送过滤请求,并经由敏感词过滤结果输出接口接收过滤回复。
图3是根据本发明实施例的敏感词过滤系统的通信方法的流程图。如图3所示,该敏感词过滤系统的通信方法包括:
步骤S301:敏感词过滤服务器接收来自于业务服务器的敏感词过滤请求包和设置于该敏感词过滤请求包之后完整的业务请求包,其中,上述敏感词过滤服务器能够处理的敏感词过滤请求包中填充有业务请求包需要过滤的字符串字段;
步骤S303:上述敏感词过滤服务器识别出上述敏感词过滤请求包,并对上述敏感词过滤请求包需要过滤的字符串字段进行遍历过滤;
步骤S305:上述敏感词过滤服务器将遍历过滤后的字符串字段填充到敏感词过滤回复包中,并将上述敏感词过滤回复包发送至上述业务处理器。
通过图3所示的通信方法,实现了敏感词过滤服务器与业务服务器之间的数据交互,把业务请求包里需要过滤的字段取出来填充到敏感词过滤服务器能够处理的敏感词过滤请求包格式中来,敏感词过滤服务器只处理需要过滤的字符串,而不涉及其他业务。并且业务处理器将业务请求包附在敏感词过滤请求包后面,使得敏感词过滤服务器在敏感词处理完后再将业务请求包附在敏感词过滤回复包后面发回业务服务器,从而继续后面的业务逻辑。
优选地,在步骤S301的上述敏感词过滤服务器接收来自于业务服务器的敏感词过滤请求包和设置于该敏感词过滤请求包之后完整的业务请求包之前,还可以包括以下处理:上述业务服务器接收到需要进行敏感词过滤的业务请求包时,将上述业务请求包需要过滤的字符串字段和字符串个数填充到敏感词过滤服务器可处理的敏感词过滤请求包中,并将完整的上述业务请求包设置在该敏感词过滤请求包的后面;上述业务服务器将上述敏感词过滤请求包和上述业务请求包一起发送给敏感词过滤服务器。
优选地,在步骤S305中上述敏感词过滤服务器将上述敏感词过滤回复包发送至上述业务处理器之后,还可以包括以下处理:上述业务服务器接收来自于上述敏感词过滤服务器返回的敏感词过滤回复包以及设置于上述敏感词过滤回复包之后的完整的上述业务请求包;上述业务服务器将上述业务请求包中需要过滤的字符串字段替换为上述敏感词过滤回复包中与该字符串字段对应的字段。
其中,根据本发明实施例,敏感词过滤请求包(STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RQ)可以设计为包括但不限于以下两个字段:敏感词检测列表字段、检测列表中的数量字段,具体参见表1。
表1
字段名 中文名 数据类型
_checkStrList 敏感词检测列表 vector<string>
_count 检测列表中的数量 uint16_t
优选实施过程中,上述业务服务器将上述业务请求包需要过滤的字符串字段和字符串个数填充到上述敏感词过滤请求包中可以进一步包括:上述业务服务器将上述需要过滤的字符串字段填充到上述业务请求包的敏感词检测列表字段中,上述业务服务器将上述需要过滤的字符串个数填充到上述业务请求包的检测列表中的数量字段中。
其中,根据本发明实施例,敏感词过滤回复包(STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RS)可以设计为包括但不限于以下三个字段:敏感词检测列表字段、检测列表中的数量字段、以及检测是否成功字段,具体参见表2。
表2
字段名 中文名 数据类型
_checkStrList 敏感词检测列表 vector<string>
_count 检测列表中的数量 uint16_t
_result 结果 int32_t
优选地,上述敏感词过滤服务器将遍历过滤后的字符串字段填充于敏感词过滤回复包中可以进一步包括:上述敏感词过滤服务器将遍历过滤后的字符串字段填充到敏感词过滤回复包的敏感词检测列表字段中。
具体地,每个数据包的结构抽象出来可以是TLV结构模式,Type表示请求类型,Length表示请求包的总长度,Value表示业务数据,而Length减去Type字段的长度就能得到Value的长度,如表3所示。
表3
Type Length Value
以下结合图4的实例进一步描述上述优选实施方式。
图4是根据本发明实例的敏感词过滤系统的通信方法的流程图。如图4所示,该敏感词过滤系统的通信方法包括:
步骤S401:业务服务器收到需要进行敏感词过滤的请求时,将请求中需要过滤的字符串字段填充到敏感词过滤请求包(STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RQ)的_checkStrList字段中,并在_count字段中填写过滤字段的个数,将收到的完整的业务请求包附在STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RQ的后面,一起打包发送给敏感词过滤服务器PSWFS(相当于同时向PSWFS发送两个TLV)。
步骤S403:PSWFS接收到后只能识别出是STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RQ请求(第一个TLV),并将其中需要过滤的字段遍历过滤后放到STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RS中的_checkStrList中,并将隐藏在敏感词过滤回复包(STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RQ)请求后面的第二个TLV拷贝到STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RS后面一起打包返回给业务服务器。
步骤S405:业务服务器接收到敏感词过滤回复包后,将完整的业务请求包(第二个TLV)提取出来,并将其中的需要过滤的字段替换为STRU_PSWFS_COMMON_SENSITIVE_WORD_CHECK_RS中相应字段继续业务请求逻辑。
综上所述,借助本发明提供的上述实施例,无须关心具体的业务逻辑,能更好的服务于所有有敏感词过滤需要的业务服务器。敏感词过滤服务器能将敏感词过滤与业务解耦,敏感词服务器崩溃不影响业务服务器正常使用,敏感词过滤的性能开销不在业务服务器上,从而很好的解决了相关技术中敏感词过滤功能内嵌到需要进行过滤的业务服务器中,在敏感词过滤有问题时会导致正常业务服务器不能正常使用的问题。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (10)

1.一种敏感词过滤系统,其特征在于,包括:
具备敏感词过滤功能的敏感词过滤服务器,所述敏感词过滤服务器包括:过滤请求输入接口以及过滤结果输出接口;
多个业务服务器,各个业务服务器均包括:过滤请求输出接口及过滤结果输入接口,其中,所述多个业务服务器的过滤请求输出接口均与所述敏感词过滤服务器的过滤请求输入接口相连接,所述多个业务服务器的过滤结果输入接口均与所述敏感词过滤服务器的过滤结果输出接口相连接,其中,所述业务服务器将上述业务请求包需要过滤的字符串字段和字符串个数填充到敏感词过滤服务器可处理的敏感词过滤请求包中,并将完整的上述业务请求包设置在该敏感词过滤请求包的后面,一起发送给所述敏感词过滤服务器。
2.根据权利要求1所述的系统,其特征在于,所述业务服务器包括以下至少之一:接入服务器、频道管理服务器、群组服务器。
3.根据权利要求1所述的系统,其特征在于,各个所述业务服务器与所述敏感词过滤服务器之间通过传输控制协议TCP协议进行通信。
4.一种如权利要求1至3中任一项所述的敏感词过滤系统的通信方法,其特征在于,包括:
敏感词过滤服务器接收来自于业务服务器的敏感词过滤请求包和设置于该敏感词过滤请求包之后完整的业务请求包,其中,所述敏感词过滤服务器能够处理的敏感词过滤请求包中填充有业务请求包需要过滤的字符串字段;
所述敏感词过滤服务器识别出所述敏感词过滤请求包,并对所述敏感词过滤请求包需要过滤的字符串字段进行遍历过滤;
所述敏感词过滤服务器将遍历过滤后的字符串字段填充到敏感词过滤回复包中,并将所述敏感词过滤回复包发送至所述业务服务器。
5.根据权利要求4所述的方法,其特征在于,在所述敏感词过滤服务器接收来自于业务服务器的敏感词过滤请求包和设置于该敏感词过滤请求包之后完整的业务请求包之前,还包括:
所述业务服务器接收到需要进行敏感词过滤的业务请求包时,将所述业务请求包需要过滤的字符串字段和字符串个数填充到敏感词过滤服务器可处理的敏感词过滤请求包中,并将完整的所述业务请求包设置在该敏感词过滤请求包的后面;
所述业务服务器将所述敏感词过滤请求包和所述业务请求包一起发送给敏感词过滤服务器。
6.根据权利要求4所述的方法,其特征在于,在所述敏感词过滤服务器将所述敏感词过滤回复包发送至所述业务处理器之后,还包括:
所述业务服务器接收来自于所述敏感词过滤服务器返回的敏感词过滤回复包以及设置于所述敏感词过滤回复包之后的完整的所述业务请求包;
所述业务服务器将所述业务请求包中需要过滤的字符串字段替换为所述敏感词过滤回复包中与该字符串字段对应的字段。
7.根据权利要求4所述的方法,其特征在于,所述业务请求包包括:敏感词检测列表字段、检测列表中的数量字段。
8.根据权利要求7所述的方法,其特征在于,所述业务服务器将所述业务请求包需要过滤的字符串字段和字符串个数填充到所述敏感词过滤请求包中包括:
所述业务服务器将所述需要过滤的字符串字段填充到所述业务请求包的敏感词检测列表字段中,所述业务服务器将所述需要过滤的字符串个数填充到所述业务请求包的检测列表中的数量字段中。
9.根据权利要求4所述的方法,其特征在于,所述敏感词过滤回复包包括:敏感词检测列表字段、检测列表中的数量字段、以及检测是否成功字段。
10.根据权利要求9所述的方法,其特征在于,所述敏感词过滤服务器将遍历过滤后的字符串字段填充于敏感词过滤回复包中包括:所述敏感词过滤服务器将遍历过滤后的字符串字段填充到敏感词过滤回复包的敏感词检测列表字段中。
CN201510788675.1A 2015-11-17 2015-11-17 敏感词过滤系统及其通信方法 Active CN105468684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510788675.1A CN105468684B (zh) 2015-11-17 2015-11-17 敏感词过滤系统及其通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510788675.1A CN105468684B (zh) 2015-11-17 2015-11-17 敏感词过滤系统及其通信方法

Publications (2)

Publication Number Publication Date
CN105468684A CN105468684A (zh) 2016-04-06
CN105468684B true CN105468684B (zh) 2019-06-11

Family

ID=55606385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510788675.1A Active CN105468684B (zh) 2015-11-17 2015-11-17 敏感词过滤系统及其通信方法

Country Status (1)

Country Link
CN (1) CN105468684B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169092A (zh) * 2017-05-12 2017-09-15 暴风体育(北京)有限责任公司 交互过程中智能识别并处理敏感内容的方法及系统
CN107943954B (zh) * 2017-11-24 2020-07-10 杭州安恒信息技术股份有限公司 网页敏感信息的检测方法、装置及电子设备
CN111274149A (zh) * 2020-02-06 2020-06-12 中国建设银行股份有限公司 测试数据的处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964000A (zh) * 2010-11-09 2011-02-02 焦点科技股份有限公司 一种敏感词自动过滤管理系统
CN102402613A (zh) * 2011-12-20 2012-04-04 上海电机学院 网页文本信息过滤系统及方法
CN103714160A (zh) * 2013-12-27 2014-04-09 北京像素软件科技股份有限公司 一种网络游戏中敏感词过滤方法及系统
CN104715037A (zh) * 2015-03-19 2015-06-17 腾讯科技(深圳)有限公司 一种网络数据的过滤方法、装置和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8412661B2 (en) * 2010-11-24 2013-04-02 International Business Machines Corporation Smart survey with progressive discovery

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964000A (zh) * 2010-11-09 2011-02-02 焦点科技股份有限公司 一种敏感词自动过滤管理系统
CN102402613A (zh) * 2011-12-20 2012-04-04 上海电机学院 网页文本信息过滤系统及方法
CN103714160A (zh) * 2013-12-27 2014-04-09 北京像素软件科技股份有限公司 一种网络游戏中敏感词过滤方法及系统
CN104715037A (zh) * 2015-03-19 2015-06-17 腾讯科技(深圳)有限公司 一种网络数据的过滤方法、装置和系统

Also Published As

Publication number Publication date
CN105468684A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN106375384A (zh) 一种虚拟网络环境中镜像网络流量的管理系统和控制方法
CA2896865C (en) Method and system for using a recursive event listener on a node in hierarchical data structure
CN105024855A (zh) 分布式集群管理系统和方法
CN101141304B (zh) Acl规则的管理方法和设备
US20150215394A1 (en) Load distribution method taking into account each node in multi-level hierarchy
CN105468684B (zh) 敏感词过滤系统及其通信方法
CN104394080A (zh) 实现安全组功能的方法及装置
WO2020038450A1 (zh) 带宽调整方法、装置、通信设备及计算机可读存储介质
CN105939267A (zh) 带外管理方法及装置
CN103533070A (zh) 业务同步方法、内容管理设备及策略管理设备
WO2016061436A2 (en) Methods and apparatuses for flexible mobile steering in cellular networks
CN111147468A (zh) 用户接入方法、装置、电子设备及存储介质
CN106888185B (zh) 一种基于串行链路的工业网络安全防护方法
CN109726151B (zh) 用于管理输入输出栈的方法、设备和介质
CN102932368A (zh) 一种跨网络http安全访问方法及系统
CN104104596A (zh) 一种irf分裂处理方法和装置
CN108667640B (zh) 通信方法及设备、网络接入系统
CN108089968A (zh) 一种宿主机监控虚拟机数据库状态的方法
CN103490964B (zh) 一种实现灵活配置终端接入数量的方法及装置
EP3145120B1 (en) Data acquisition method, device and system
EP3195528B1 (en) Application control interworking in network
EP2988476B1 (en) Method and apparatus for processing operation on endpoint peripheral
CN103780668B (zh) 一种基于http传输协议的云报表数据存储方法
CN109451090A (zh) 一种域名解析方法及装置
CN110309225B (zh) 数据处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant