CN113220868B - 一种文本数据过滤、获取方法、装置、设备及存储介质 - Google Patents
一种文本数据过滤、获取方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113220868B CN113220868B CN202110591345.9A CN202110591345A CN113220868B CN 113220868 B CN113220868 B CN 113220868B CN 202110591345 A CN202110591345 A CN 202110591345A CN 113220868 B CN113220868 B CN 113220868B
- Authority
- CN
- China
- Prior art keywords
- text data
- value
- database
- text
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013500 data storage Methods 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 4
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种文本数据过滤、获取方法、装置、设备及存储介质。其中,所述方法应用于终端时,包括:若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。本发明实施例所提供的技术方案,可以实现对用户存储的文本数据进行全面地过滤,可以实现对后台数据库进行保护,提高数据安全性。
Description
技术领域
本发明实施例涉及数据过滤技术领域,尤其涉及一种文本数据过滤、获取方法、装置、设备及存储介质。
背景技术
随着互联网的高速发展,越来越多的企业搭乘着互联网这班高速列车使得自己的企业发展的越来越好,越加壮大。但是随着业务量的增加,企业的后台数据库压力也随之而来。因此,后台数据库也成为对手或者黑客的重点攻击目标。其中攻击方式主要包括XSS攻击、SQL注入攻击以及敏感词输入。
XSS攻击是Web攻击中最常见的攻击方法之一,它是通过对网页注入可执行代码且成功地被浏览器执行,达到攻击的目的,形成了一次有效XSS攻击,一旦攻击成功,它可以获取用户的联系人列表,然后向联系人发送虚假诈骗信息,可以删除用户的日志等等。
SQL注入是通过把SQL命令插入到Web表单提交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令。具体来说,它是利用现有应用程序,将(恶意)的SQL命令注入到后台数据库引擎执行的能力,它可以通过在Web表单中输入(恶意)SQL语句得到一个存在安全漏洞的网站上的数据库,而不是按照设计者意图去执行SQL语句。
相关技术中的文本数据过滤方法,在前端或者后端进行过滤,无法预防全部的攻击方式,一旦相关的过滤接口被破解,则后台数据库会受到严重攻击,导致严重的损失。
发明内容
本发明实施例提供一种文本数据过滤、获取方法、装置、设备及存储介质,可以实现对用户存储的文本数据进行全面地过滤,可以实现对后台数据库进行保护,提高数据安全性。
第一方面,本发明实施例提供了一种文本数据过滤方法,应用于终端,该方法包括:若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;
将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
第二方面,本发明实施例还提供了文本数据获取方法,应用于服务端,该方法包括:若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;
将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
第三方面,本发明实施例还提供了一种文本数据过滤装置,配置于终端,该装置包括:
文本数据过滤模块,用于若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
第一数据库存入模块,用于生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;
第二数据库存入模块,用于将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
第四方面,本发明实施例还提供了一种文本数据获取装置,配置于服务端,该装置包括:获取请求响应模块,用于若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;
文本数据显示模块,用于将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
第五方面,本发明实施例还提供了一种电子设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一项所述的由终端执行的文本数据过滤方法或者由服务端执行的文本数据获取方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的由终端执行的文本数据过滤方法或者由服务端执行的文本数据获取方法。
本发明实施例提供的技术方案,应用于终端时,若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。通过执行本方案,可以实现对用户存储的文本数据进行全面地过滤,可以实现对后台数据库进行保护,提高数据安全性。
附图说明
图1是本发明实施例提供的应用于终端的一种文本数据过滤方法的流程图;
图2是本发明实施例提供的应用于服务端的一种文本数据获取方法的流程图;
图3是本发明实施例提供的一种文本数据过滤方法的流程图;
图4是本发明实施例提供的配置于终端的一种文本数据过滤装置结构示意图;
图5是本发明实施例提供的配置于服务端的一种文本数据获取装置结构示意图;
图6是本发明实施例提供的一种电子设备结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1是本发明实施例提供的应用于终端的文本数据过滤方法的流程图,所述方法可以由文本数据过滤装置来执行,所述装置可以由软件和/或硬件的方式实现,所述装置可以配置在终端,所述终端可以是移动手机、平板电脑、穿戴设备等电子设备。所述方法应用于用户通过终端存储文本数据的场景中。如图1所示,本发明实施例提供的技术方案具体包括:
S110:若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据。
其中,所述文本数据包括:文本标题和文本内容。
具体的,当用户需要通过终端的浏览器发表一篇帖子或者发表一篇评论时,可以通过终端的浏览器中内嵌的富文本编辑器分别对文本标题和文本内容进行编辑,来完成对文本数据的编辑。其中,文本内容可以是评论或者帖子的正文内容,文本标题可以是评论或者帖子的主题。
当用户完成对文本数据的编辑后,触发文本数据保存选项,即向终端发出文本数据存储请求。如果终端接收到用户发送的文本数据存储请求,则调用Node.js文本过滤接口将用户保存的文本数据进行过滤得到过滤文本数据。
其中,过滤方式可以是将文本数据中的敏感词进行过滤。其中,敏感词可以是带有敏感政治倾向、暴力倾向、不健康色彩的词或不文明用语。也可以是网站根据自身实际情况,设定的只适用于本网站的特殊敏感词,例如很多电子商务网站会将一些涉及侵犯知识产权,不宜销售的商品,例如“山寨”、“水货”、“盗版”、“刻录”等设置为敏感词,在商品简介中这些词是发不出来的。
过滤方式也可以是将文本数据中的特殊字符进行过滤。其中,特殊字符可以是通过嵌入在语句或代码中注入到用户浏览器的网页上,对网站系统造成非法攻击或者非法操作的字符,例如可以是‘$’、‘*’以及‘<’等特殊字符。
在一个可行的实施方式中,可选的,将所述文本数据进行过滤得到过滤文本数据,包括:将所述文本数据与预存的敏感词词库中的敏感词进行匹配;若匹配成功,则将所述敏感词删除;或,将所述敏感词转化成目标字符。
其中,敏感词词库中包含了开发者自定义的所有敏感词,终端将用户保存的文本数据与预存的敏感词词库中的敏感词进行匹配。如果敏感词匹配成功,终端则调用Node.js文本过滤接口将匹配成功的敏感词中的每个字对应转化成目标字符,例如用*代替;或者终端直接将匹配成功的敏感词进行删除。
由此,通过将文本数据与预存的敏感词词库中的敏感词进行匹配;若匹配成功,则将敏感词删除;或,将敏感词转化成目标字符,可以实现对文本数据中的敏感词进行过滤,可以有效地杜绝非法行为,达到防患于未然的目的。
在一个可行的实施方式中,可选的,将所述文本数据进行过滤得到过滤文本数据,包括:将所述文本数据与预存的特殊字符词库中的特殊字符进行匹配;若匹配成功,则根据预设转义规则将所述文本数据中的特殊字符格式转义成目标格式,以将包含所述特殊字符的语句进行失效化处理。
其中,特殊字符可以是‘#’、‘&’、‘<’以及‘>’等字符,开发者将通用的特殊字符以及自定义的所有特殊字符存放在特殊字符词库中,终端将用户保存的文本数据与特殊字符词库中的特殊字符进行匹配。如果匹配成功,则终端通过调用Node.js文本过滤接口根据预设的转义规则将匹配成功的特殊字符格式进行转义,即用其他字符替代特殊字符,从而改变特殊字符的原本意义。例如将半角格式的特殊字符对应转义为全角格式的字符,使得包含特殊字符的语句或者代码失效。
由此,通过将文本数据与预存的特殊字符词库中的特殊字符进行匹配;若匹配成功,则根据预设转义规则将文本数据中的特殊字符格式转义成目标格式,以将包含所述特殊字符的语句进行失效化处理。可以实现过滤非法语句或者非法代码的效果,避免非法语句或者非法代码对服务器造成操作未知事件的攻击,可以提高整个系统的安全性。
S120:生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库。
其中,ID值可以是通用唯一识别码(Universally Unique Identifier,UUID),指在一台机器上生成的唯一数字,例如,可以由32位16进制数字组成,可以根据终端的时间或终端的MAC地址生成一个随机数,例如哈希数。第一数据库可以是与终端进行通信连接的数据库,即前端数据库,本方案中可以使用MySql数据库,用于存放与用户的隐私信息完全无关的的数据信息。终端将文本数据过滤完成得到过滤文本数据后,生成一个与过滤文本数据一一对应的ID值,并将该过滤文本数据和与其对应的ID值存入第一数据库。
S130:将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
其中,第二数据库可以是与服务端进行通信连接的数据库,即后台数据库,可以使用MySql数据库。第二数据库用于存放重要的数据信息,例如用户的身份信息和联系方式等隐私信息。终端将与过滤文本数据对应的ID值发送给服务端,以使服务端通过业务接口将该ID值存入第二数据库。每向第二数据库插入一条数据,第二数据库对应的增加一条记录,并将该条记录的序号作为本条记录的主键,并且记录序号与过滤文本数据的ID值一一对应。
在一个可行的实施方式中,可选的,将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库,包括:将所述ID值和所述文本标题发送给服务端,以使所述服务端将所述ID值和所述文本标题存入所述第二数据库。
具体的,终端还可以将过滤文本数据中的文本标题提取出来,将该文本标题与和过滤文本数据对应的ID值一起发送给服务端,以使服务端通过业务接口将该ID值和该文本标题存入第二数据库。可以实现将服务端第二数据库中的ID值和文本标题与终端第一数据库中的过滤文本数据建立一一对应关系,进而可以实现通过文本标题确定与之相对应的文本数据,使得查找文本数据的方式更加灵活。
在一个可行的实施方式中,可选的,在将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库之后,还包括:若接收到文本数据的显示请求,则从所述第一数据库中获取所述文本数据的ID值;根据所述ID值从所述第一数据库中获取与所述ID值匹配的文本标题,并进行显示。
具体的,终端将文本数据过滤完成得到过滤文本数据进行保存后,还可以将该文本数据的文本标题进行显示。从第一数据库中获取过滤文本数据的ID值,通过该ID值从第一数据库中获取与该ID值匹配的文本标题,并将该文本标题、文本标题的显示日期以及文本标题的显示时间作为列表中的一条数据向用户进行显示。
由此,通过若接收到文本数据的显示请求,则从第一数据库中获取文本数据的ID值;根据ID值从第一数据库中获取与ID值匹配的文本标题,并进行显示,可以实现将文本数据的文本标题显示给用户,以使用户知晓文本数据存储成功,并进而可以实现提供给用户访问文本数据的访问接口。
本发明实施例提供的技术方案,应用于终端时,若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。通过执行本方案,可以实现对用户存储的文本数据进行全面地过滤,可以实现对后台数据库进行保护,提高数据安全性。
图2是本发明实施例提供的应用于服务端的文本数据获取方法的流程图,所述方法可以由文本数据获取装置来执行,所述装置可以由软件和/或硬件的方式实现,所述装置可以配置在服务端,所述服务端可以是服务器等电子设备。所述方法应用于用户获取文本数据的场景中。如图2所示,本发明实施例提供的技术方案具体包括:
S210:若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值。
具体的,当用户在终端的文章列表中触发某一文本标题选项以获取该文本标题对应的文本内容时,终端向服务端发送文本数据获取请求,从文章列表页面跳转到与该文本标题对应的详情页页面,该详情页页面上携带有第二数据库中的记录序号,服务端通过调用业务接口以及根据该记录序号从第二数据库中获取与该记录序号唯一对应的过滤文本数据的ID值。
S220:将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
具体的,服务端向终端发送文本数据获取请求以及ID值,终端接收到服务端发送的内容之后,通过调用前端接口并根据该ID值从第一数据库中获取与该ID值对应的文本数据,并将该文本数据显示给用户。
本发明实施例提供的技术方案,应用于服务端时,若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。通过执行本方案,可以实现将过滤后的文本数据内容显示给用户。
相关技术中文本数据过滤方法有如下几种:1、输入剔除:前端在输入数据的地方禁止输入敏感标签;2、传输剔除:前端在发送数据的地方过滤敏感标签;3、接收剔除:后端在接收数据的时候过滤敏感标签。
上述文本数据过滤方法,只在前端和后端进行文本数据过滤,如果出现过滤方法被破解,那么后台数据库将会受到严重威胁。另外,相关技术中的前端防攻击方式大多数是直接写在业务代码中、缺少封装以及缺少工具封装的模式,大量散乱的代码遍布在项目中,导致开发以及维护效率低下,代码冗余。目前还没有一种方法可以在兼顾安全性的同时,又能保证开发的效率。
图3是本发明实施例提供的文本数据过滤方法的流程图,如图3所示,本发明实施例提供的技术方案包括如下步骤:
步骤一、终端将文本数据传给Node.js文本过滤接口。
步骤二、Node.js文本过滤接口将文本数据进行过滤得到过滤文本数据并将过滤文本数据存入第一数据库。
步骤三、Node.js文本过滤接口返回存入的过滤文本数据的ID值。
步骤四、终端将过滤文本数据的ID值存入第一数据库并传给业务接口。
步骤五、服务端接收业务接口发送的过滤文本数据的ID值。
步骤六、服务端将过滤文本数据的ID值存入第二数据库。
本发明实施例提供的技术方案,通过ID值为内容传给业务接口并存入后台数据库,保证了如果Node.js过滤接口的过滤方法被破解,也仅仅是前端数据库受到威胁,由于前端数据库并没有业务敏感信息,因此保证了后台数据库的安全。Node.js过滤接口既可以实现防止XSS攻击、SQL注入攻击等文本数据安全过滤方法,也可以配置敏感词脱敏功能,所有代码都集中在Node.js过滤接口这里,不会出现大量冗余代码。本方案将该文本过滤方法进行了封装,并以组件的形式提供给开发者进行复用,节省了前后端对于文本数据过滤上的开发时间,极大地提高了项目的整体开发效率。
图4是本发明实施例提供的配置于终端的文本数据过滤装置结构示意图,所述装置可以配置在终端,所述终端可以是移动手机、平板电脑、穿戴设备等电子设备。如图4所示,所述装置包括:
文本数据过滤模块410,用于若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
第一数据库存入模块420,用于生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;
第二数据库存入模块430,用于将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
可选的,将所述文本数据进行过滤得到过滤文本数据,包括:将所述文本数据与预存的敏感词词库中的敏感词进行匹配;若匹配成功,则将所述敏感词删除;或,将所述敏感词转化成目标字符。
可选的,将所述文本数据进行过滤得到过滤文本数据,包括:将所述文本数据与预存的特殊字符词库中的特殊字符进行匹配;若匹配成功,则根据预设转义规则将所述文本数据中的特殊字符格式转义成目标格式,以将包含所述特殊字符的语句进行失效化处理。
可选的,所述装置还包括文本标题显示模块,用于在将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库之后,若接收到文本数据的显示请求,则从所述第一数据库中获取所述文本数据的ID值;根据所述ID值从所述第一数据库中获取与所述ID值匹配的文本标题,并进行显示。
可选的,将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库,包括:将所述ID值和所述文本标题发送给服务端,以使所述服务端将所述ID值和所述文本标题存入所述第二数据库。
上述实施例所提供的装置可以执行本发明任意实施例所提供的应用于终端的文本数据过滤方法,具备执行方法相应的功能模块和有益效果。
图5是本发明实施例提供的配置于服务端的文本数据获取装置结构示意图,所述装置可以配置在服务端,所述服务端可以是服务器等电子设备。如图5所示,所述装置包括:
获取请求响应模块510,用于若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;
文本数据显示模块520,用于将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
上述实施例所提供的装置可以执行本发明任意实施例所提供的应用于服务端的文本数据获取方法,具备执行方法相应的功能模块和有益效果。
图6是本发明实施例提供的一种电子设备结构示意图,如图6所示,该设备包括:
一个或多个处理器610,图6中以一个处理器610为例;
存储器620;
所述设备还可以包括:输入装置630和输出装置640。
所述设备中的处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器620作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种文本数据过滤方法/文本数据获取方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述方法实施例的一种由终端执行的文本数据过滤方法,即:
若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;
将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
又例如:实现本发明实施例所提供的由服务端执行的文本数据获取方法,也即:
若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;
将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置630可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的一种由终端执行的文本数据过滤方法,即:
若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库;
将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库。
又例如:实现本发明实施例所提供的由服务端执行的文本数据获取方法,也即:
若检测到文本数据获取请求,则从第二数据库中获取与所述文本数据获取请求匹配的ID值;
将所述ID值发送给终端,以使所述终端根据所述ID值从第一数据库中获取与所述ID值匹配的文本数据,并将所述文本数据进行显示。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (8)
1.一种文本数据过滤方法,其特征在于,应用于终端,包括:
若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库,其中,所述第一数据库为与终端进行通信连接的数据库,用于存放与用户的隐私信息无关的数据信息;
将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库,其中,所述第二数据库为与服务端进行通信连接的数据库,用于存放用户的隐私信息;
若接收到所述服务端发送的文本数据获取请求匹配的ID值,根据所述文本数据获取请求匹配的ID值从第一数据库中获取与所述文本数据获取请求匹配的ID值匹配的文本数据,并将所述文本数据进行显示,其中,所述文本数据获取请求匹配的ID值由所述服务端在检测到所述文本数据获取请求后从第二数据库中获取。
2.根据权利要求1所述的方法,其特征在于,将所述文本数据进行过滤得到过滤文本数据,包括:
将所述文本数据与预存的敏感词词库中的敏感词进行匹配;
若匹配成功,则将所述敏感词删除;或,将所述敏感词转化成目标字符。
3.根据权利要求1所述的方法,其特征在于,将所述文本数据进行过滤得到过滤文本数据,包括:
将所述文本数据与预存的特殊字符词库中的特殊字符进行匹配;
若匹配成功,则根据预设转义规则将所述文本数据中的特殊字符格式转义成目标格式,以将包含所述特殊字符的语句进行失效化处理。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到文本数据的显示请求,则从所述第一数据库中获取所述文本数据的ID值;
根据所述ID值从所述第一数据库中获取与所述ID值匹配的文本标题,并进行显示。
5.根据权利要求1所述的方法,其特征在于,将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库,包括:
将所述ID值和所述文本标题发送给服务端,以使所述服务端将所述ID值和所述文本标题存入所述第二数据库。
6.一种文本数据过滤装置,其特征在于,配置于终端,包括:
文本数据过滤模块,用于若接收到文本数据存储请求,则将所述文本数据进行过滤得到过滤文本数据;其中,所述文本数据包括:文本标题和文本内容;
第一数据库存入模块,用于生成针对所述过滤文本数据的ID值,并将所述过滤文本数据与所述ID值存入第一数据库,其中,所述第一数据库为与终端进行通信连接的数据库,用于存放与用户的隐私信息无关的数据信息;
第二数据库存入模块,用于将所述ID值发送给服务端,以使所述服务端将所述ID值存入第二数据库,其中,所述第二数据库为与服务端进行通信连接的数据库,用于存放用户的隐私信息;
文本数据显示模块,用于若接收到所述服务端发送的文本数据获取请求匹配的ID值,根据所述文本数据获取请求匹配的ID值从第一数据库中获取与所述文本数据获取请求匹配的ID值匹配的文本数据,并将所述文本数据进行显示,其中,所述文本数据获取请求匹配的ID值由所述服务端在检测到所述文本数据获取请求后从第二数据库中获取。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5任一项所述的由终端执行的文本数据过滤方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的由终端执行的文本数据过滤方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110591345.9A CN113220868B (zh) | 2021-05-28 | 2021-05-28 | 一种文本数据过滤、获取方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110591345.9A CN113220868B (zh) | 2021-05-28 | 2021-05-28 | 一种文本数据过滤、获取方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113220868A CN113220868A (zh) | 2021-08-06 |
CN113220868B true CN113220868B (zh) | 2024-08-13 |
Family
ID=77099084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110591345.9A Active CN113220868B (zh) | 2021-05-28 | 2021-05-28 | 一种文本数据过滤、获取方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220868B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914057A (zh) * | 2020-06-01 | 2020-11-10 | 杭州城市大数据运营有限公司 | 客服系统敏感词检测过滤方法和装置 |
CN112199327A (zh) * | 2020-08-24 | 2021-01-08 | 杭州雷数科技有限公司 | 用于处理文件的服务方法、系统、电子设备和存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8578487B2 (en) * | 2010-11-04 | 2013-11-05 | Cylance Inc. | System and method for internet security |
CN102402613A (zh) * | 2011-12-20 | 2012-04-04 | 上海电机学院 | 网页文本信息过滤系统及方法 |
CN110019239B (zh) * | 2017-12-29 | 2021-06-04 | 百度在线网络技术(北京)有限公司 | 上报数据的存储方法、装置、电子设备和存储介质 |
CN111368529B (zh) * | 2020-03-17 | 2022-07-01 | 重庆邮电大学 | 基于边缘计算的移动终端敏感词识别方法、装置及系统 |
CN112131202B (zh) * | 2020-10-10 | 2022-08-16 | 厦门悦讯信息科技股份有限公司 | 一种分布式文件存储和读取方法、终端设备及存储介质 |
CN112612922A (zh) * | 2020-12-16 | 2021-04-06 | 平安普惠企业管理有限公司 | 一种手机号码的安全存储方法、装置、计算机设备和介质 |
-
2021
- 2021-05-28 CN CN202110591345.9A patent/CN113220868B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914057A (zh) * | 2020-06-01 | 2020-11-10 | 杭州城市大数据运营有限公司 | 客服系统敏感词检测过滤方法和装置 |
CN112199327A (zh) * | 2020-08-24 | 2021-01-08 | 杭州雷数科技有限公司 | 用于处理文件的服务方法、系统、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113220868A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2637477C1 (ru) | Система и способ обнаружения фишинговых веб-страниц | |
CN103368957B (zh) | 对网页访问行为进行处理的方法及系统、客户端、服务器 | |
WO2016164036A1 (en) | Modifying web page code to include code to protect output | |
Barua et al. | Server side detection of content sniffing attacks | |
US10104063B2 (en) | Android-based mobile equipment security protection method, and device | |
JP2014203464A (ja) | クライアントベースローカルマルウェア検出方法 | |
CN103428186A (zh) | 一种检测钓鱼网站的方法及装置 | |
CN104168293A (zh) | 结合本地内容规则库识别可疑钓鱼网页的方法及系统 | |
CN102780684B (zh) | Xss防御系统 | |
KR101372906B1 (ko) | 악성코드를 차단하기 위한 방법 및 시스템 | |
CN115086064A (zh) | 基于协同入侵检测的大规模网络安全防御系统 | |
CN109088872B (zh) | 带使用期限的云平台的使用方法、装置、电子设备及介质 | |
CN113067792A (zh) | 一种xss攻击识别方法、装置、设备及介质 | |
WO2021212739A1 (zh) | 网络攻击的防御方法、装置、设备、系统和存储介质 | |
CN113220868B (zh) | 一种文本数据过滤、获取方法、装置、设备及存储介质 | |
CN106612283B (zh) | 一种识别下载文件来源的方法及装置 | |
CN113141332B (zh) | 一种命令注入识别方法、系统、设备及计算机存储介质 | |
Kour et al. | Tracing out cross site scripting vulnerabilities in modern scripts | |
CN114626061A (zh) | 网页木马检测的方法、装置、电子设备及介质 | |
CN117040804A (zh) | 网站的网络攻击检测方法、装置、设备、介质和程序产品 | |
CN109491647A (zh) | 一种基于编程语言的在线预防攻击方法及电子设备 | |
CN113886812A (zh) | 检测防护方法、系统、计算机设备及可读存储介质 | |
CN112182603B (zh) | 反爬虫方法和装置 | |
CN109218284B (zh) | Xss漏洞检测方法及装置、计算机设备及可读介质 | |
CN111262842B (zh) | 网页防篡改方法、装置、电子设备、及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |