CN105574203A - 一种信息存储方法及装置 - Google Patents

一种信息存储方法及装置 Download PDF

Info

Publication number
CN105574203A
CN105574203A CN201610008386.XA CN201610008386A CN105574203A CN 105574203 A CN105574203 A CN 105574203A CN 201610008386 A CN201610008386 A CN 201610008386A CN 105574203 A CN105574203 A CN 105574203A
Authority
CN
China
Prior art keywords
information
user
sensitive word
module
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610008386.XA
Other languages
English (en)
Inventor
沈文策
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610008386.XA priority Critical patent/CN105574203A/zh
Publication of CN105574203A publication Critical patent/CN105574203A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种信息存储方法及装置,涉及互联网技术领域,应用于服务器,该方法包括:接收用户上传的目标信息,根据预设的敏感词库,判断该目标信息中是否包含敏感词,若为是,则根据预设的替换词库,确定该目标信息中包含的敏感词的替换词,根据所确定的替换词更新该目标信息,存储更新后的该目标信息。应用本发明实施例提供的技术方案存储信息,能够构建一个安全的网络环境,确保了用户获得的信息健康安全,提高了用户在网络环境中进行信息交互的体验。

Description

一种信息存储方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种信息存储方法及装置。
背景技术
随着互联网技术的发展,互联网应用的范围也越来越广,用户可以通过互联网将其想要分享的信息发送到网络侧,也可以从网络侧获得其想要的信息。
目前,用户可以将任何信息发送到网络侧,网络侧在获得信息后,不对信息进行任何处理,直接存储信息。但是,在用户发送到网络侧的信息中可能会包含一些敏感词(如关于“黄、赌、毒”的词),导致已存储信息为不健康不安全的信息,若不去除这些词语,在网络侧接收到其他用户发送的访问请求后,将访问请求对应的已存储信息推送给其他用户,将会扰乱网络环境,降低用户在网络环境中进行信息交互的体验。
发明内容
本发明实施例的目的在于提供一种信息存储方法及装置,以构建一个安全的网络环境,确保用户获得的信息健康安全,提高用户在网络环境中进行信息交互的体验。
为达到上述目的,本发明实施例公开了一种信息存储方法,应用于服务器,所述方法包括步骤:
接收用户上传的目标信息;
根据预设的敏感词库,判断所述目标信息中是否包含敏感词,其中,所述预设的敏感词库,用于存储敏感词;
若为是,则根据预设的替换词库,确定所述目标信息中包含的敏感词的替换词,其中,所述预设的替换词库,用于存储敏感词的替换词;
根据所确定的替换词更新所述目标信息;
存储更新后的所述目标信息。
在本发明的一种具体实现方式中,所述预设的敏感词库通过以下方式更新:
在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
接收所述网络侧根据所述查询请求进行敏感词查询的查询结果,其中,所述查询结果中包含敏感词;
根据所述查询结果中包含的敏感词,更新所述预设的敏感词库。
在本发明的一种具体实现方式中,所述存储更新后的所述目标信息,包括:
获得更新后的所述目标信息中的关键词;
根据所获得的关键词,确定更新后的所述目标信息的信息类别;
按照所确定的信息类别存储更新后的所述目标信息。
在本发明的一种具体实现方式中,所述方法还包括:
接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
在本发明的一种具体实现方式中,所述方法还包括:
根据用户上传信息的信息类别和/或查看信息的信息类别,获得所述用户的行为习惯;
存储所述行为习惯,以使得所述服务器根据所述行为习惯确定针对所述用户的待推荐信息。
为达到上述目的,本发明实施例还公开了一种信息存储装置,应用于服务器,所述装置包括:信息接收模块、敏感词判断模块、替换词确定模块、信息更新模块和信息存储模块;
其中,所述信息接收模块,用于接收用户上传的目标信息;
所述敏感词判断模块,用于根据预设的敏感词库,判断所述目标信息中是否包含敏感词,若为是,则触发所述替换词确定模块,其中,所述预设的敏感词库,用于存储敏感词;
所述替换词确定模块,用于根据预设的替换词库,确定所述目标信息中包含的敏感词的替换词,其中,所述预设的替换词库,用于存储敏感词的替换词;
所述信息更新模块,用于根据所确定的替换词更新所述目标信息;
所述信息存储模块,用于存储更新后的所述目标信息。
在本发明的一种具体实现方式中,所述装置还包括:查询请求发送模块、查询结果接收模块和词库更新模块;
其中,所述查询请求发送模块,用于在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
所述查询结果接收模块,用于接收所述网络侧根据所述查询请求进行敏感词查询的查询结果,其中,所述查询结果中包含敏感词;
所述词库更新模块,用于根据所述查询结果中包含的敏感词,更新所述预设的敏感词库。
在本发明的一种具体实现方式中,所述信息存储模块,包括:关键词获得子模块、信息类别确定子模块和信息存储子模块;
其中,所述关键词获得子模块,用于获得更新后的所述目标信息中的关键词;
所述信息类别确定子模块,用于根据所获得的关键词,确定更新后的所述目标信息的信息类别;
所述信息存储子模块,用于按照所确定的信息类别存储更新后的所述目标信息。
在本发明的一种具体实现方式中,所述装置还包括:信息推送模块,
用于接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
用于确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
用于按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
在本发明的一种具体实现方式中,所述装置还包括:行为习惯获得模块和行为习惯存储模块;
其中,所述行为习惯获得模块,用于根据用户上传信息的信息类别和/或查看信息的信息类别,获得所述用户的行为习惯;
所述行为习惯存储模块,用于存储所述行为习惯,以使得所述服务器根据所述行为习惯确定针对所述用户的待推荐信息。
由上可见,本发明实施例中,服务器在接收到用户上传的目标信息后,根据预设的敏感词库中存储的敏感词,判断该目标信息中是否包含敏感词,若包含,则从预设的替换词库中查找并确定该目标信息中包含的敏感词的替换词,根据所确定的替换词,更新该目标信息,并存储更新后的该目标信息。这样,服务器存储的信息中包含的敏感词均被替换掉了,保证了已存储信息的健康安全,构建了一个安全的网络环境,确保用户获得的信息健康安全,提高用户在网络环境中进行信息交互的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息存储方法的流程示意图;
图2为本发明实施例提供的敏感词库更新方法的流程示意图;
图3为本发明实施例提供的另一种信息存储方法的流程示意图;
图4为本发明实施例提供的一种信息存储装置的结构示意图;
图5为本发明实施例提供的敏感词库更新装置的结构示意图;
图6为本发明实施例提供的另一种信息存储装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种信息存储方法及装置,涉及互联网技术领域,应用于服务器,该方法包括:接收用户上传的目标信息,根据预设的敏感词库,判断该目标信息中是否包含敏感词,若为是,则根据预设的替换词库,确定该目标信息中包含的敏感词的替换词,根据所确定的替换词更新该目标信息,存储更新后的该目标信息。
下面通过具体实施例,对本发明进行详细说明。
参考图1,图1为本发明实施例提供的一种信息存储方法的流程示意图,应用于服务器,该方法可以包括如下步骤:
S101:接收用户上传的目标信息;
具体地,上述目标信息可以为一个词语或一段文字,如:用户根据在生活中的感想书写的一段文字,或用户看到的一篇文章等。
实际应用中,上述服务器可以为博客的服务器,博客的服务器可以接收用户上传的目标信息,形成博文,并将博文存储在博客的服务器中。
S102:根据预设的敏感词库,判断所述目标信息中是否包含敏感词,若为是,则执行步骤S103;
其中,上述预设的敏感词库,用于存储敏感词,上述敏感词可以认为是不宜在网络中出现的词。
在本发明的一种具体实现方式中,敏感词的判定可以为:一条目标信息中同时出现了一组词,才判定该目标信息中包含敏感词,如:在预设的敏感词库中“支持”和“台湾”为一组敏感词,若一条目标信息中只出现了“支持”或只出现了“台湾”,则判定该目标信息中未包含敏感词,若该目标信息同时出现了“支持”和“台湾”,才判定该目标信息中包含敏感词。这样,判定目标信息中是否包含敏感词的方法更为准确。
实际应用中,每个时期的敏感词可能是不同,因此,需要不断的更新预设的敏感词库,以保证服务器能够根据预设的敏感词库,准确的判定目标信息中是否包含敏感词,更新预设的敏感词库的方法可以参考图2,图2为本发明实施例提供的敏感词库更新方法的流程示意图,该方法应用于服务器,可以包括如下步骤:
S201:在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
具体地,在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求,可以为:按照预设的时间间隔,向网络侧发送查询请求。假设,预设的时间间隔为5天,则每5天向网络侧发送查询请求。
另外,在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求,还可以为:接收管理人员发送的敏感词库更新指令之后,向网络侧发送查询请求。
需要说明的是,上述网络侧可以为网络交互社区,如:新浪博客、天涯博客,也可以为网络新闻发布平台,还可以为搜索引擎,如:百度、搜狗等,这些网络侧每天都存在着大量信息的交互,因此,可以及时获得当前的敏感词并更新预设的敏感词库。
S202:接收所述网络侧根据所述查询请求进行敏感词查询的查询结果;
其中,上述查询结果中包含敏感词。
S203:根据所述查询结果中包含的敏感词,更新所述预设的敏感词库。
假设,网络侧反馈的查询结果中包含的敏感词为“鲜花”,则将“鲜花”存储到预设的敏感词库中,更新预设的敏感词库过程结束。
在本发明的一种具体实现方式中,还可以累计记录敏感词的出现次数,对于出现次数小于预设阈值的敏感词,可以在预设的敏感词库中删除,以免预设的敏感词库中存储过多无用的敏感词,占用过多的服务器的存储空间。
另外,上述累计记录的敏感词的出现次数可以为最近一段时间内的敏感词的出现次数,以避免一些敏感词因为在预设的敏感词库中存储了很长一段时间而使得其出现次数大于预设阈值,进而导致不能删除这些敏感词。
另外,在本发明的一种具体实现方式中,管理人员可以直接向预设的敏感词库中输入敏感词或从预设的敏感词库中删除敏感词,这样来更新预设的敏感词库更为人性化。
当然,上述预设的敏感词库可以根据用户的需要,按照上述步骤S201、S202和S203更新,还可以根据已存在的敏感词库(如:其他服务商构建的敏感词库)更新,在本发明对此不进行限定。
S103:根据预设的替换词库,确定所述目标信息中包含的敏感词的替换词;
其中,上述预设的替换词库,用于存储敏感词的替换词。
在本发明的一种具体实现方式中,预设的替换词库中的替换词可以是单一的,即无论出现什么样的敏感词均替换为同一词语,如:预设的替换词库中的替换词为“a”,根据预设的敏感词库,判定目标信息中出现的敏感词有:“筛子”、“酒吧”和“花”,根据预设的替换词库,可以确定“筛子”、“酒吧”和“花”均替换为“a”。这样,在目标信息中包含敏感词时,可以直接进行替换,替换的速度快。
在本发明的一种具体实现方式中,预设的替换词库中的替换词还可以与敏感词一一对应。假设,预设的替换词库中的替换词为“a”、“b”、“c”,其中,“a”对应的敏感词为“筛子”,“b”对应的敏感词为“酒吧”,“c”对应的敏感词为“花”,若目标信息中出现的敏感词有:“筛子”、“酒吧”和“花”,根据预设的替换词库替换后,上述敏感词变为了“a”、“b”、“c”。这样,便于管理人员获知一用户上传的目标信息中出现了什么样的敏感词多、什么样的敏感词少、什么样的敏感词不会出现,并根据该用户上传的目标信息中出现次数多的敏感词建立一个针对该用户的子敏感词库,这样,在该用户上传的目标信息时,可以根据针对该用户的子敏感词库,判断该用户上传的目标信息是否包含敏感词,这样减少了需要判断的敏感词,提高了判断的速度,进而提高了整体的存储速度。
S104:根据所确定的替换词更新所述目标信息;
S105:存储更新后的所述目标信息。
假设,预设的敏感词库中存储的敏感词有:“筛子”、“酒吧”和“花”,若目标信息为“花儿为什么这样红”,则可以判定目标信息中包含敏感词“花”,此时,从替换词库中获得敏感词“花”的替换词,假设敏感词“花”的替换词为“a”,则根据替换词“a”更新的目标信息为“a儿为什么这样红”,并将“a儿为什么这样红”存储在服务器中。
应用上述各个实施例,服务器在接收到用户上传的目标信息后,根据预设的敏感词库中存储的敏感词,判断该目标信息中是否包含敏感词,若包含,则从预设的替换词库中查找并确定该目标信息中包含的敏感词的替换词,根据所确定的替换词,更新该目标信息,并存储更新后的该目标信息。这样,服务器存储的信息中包含的敏感词均被替换掉了,保证了已存储信息的健康安全,构建了一个安全的网络环境,确保用户获得的信息健康安全,提高用户在网络环境中进行信息交互的体验。
图3为本发明实施例提供的另一种信息存储方法的流程示意图,应用于服务器,在该方法中,上述步骤S105,可以包括:
S105a:获得更新后的所述目标信息中的关键词;
S105b:根据所获得的关键词,确定更新后的所述目标信息的信息类别;
S105c:按照所确定的信息类别存储更新后的所述目标信息。
具体地,上述信息类别可以包括:教育、财经、时事、娱乐等。在本发明实施例中,可以对目标信息进行分词,从中获得关键词,并分析关键词,确定目标信息的信息类别,分类存储目标信息,这样,在其他用户查找信息时,能够根据信息类别快速获得相关的信息。
这种情况下,预设的敏感词库可以包含针对各个信息类别的子敏感词库,这样,在将一条已存储信息推送给用户时,可以根据针对该已存储信息所属的信息类别的子敏感词库,对该已存储信息进行检测,判断该已存储信息中是否包含为替换的敏感词,确保了该已存储信息的健康安全,提高了在网络环境中进行信息交互的体验。
另外,在用户上传目标信息时,用户可以直接选择的信息类别,服务器根据用户选择的信息类别,确定子敏感词库,根据确定的子敏感词库,判断该目标信息中是否包含为替换的敏感词。这样节约了判断的时间,提高了目标信息的存储速度。
在本发明的一种具体实现方式中,信息类别还可以包括收费(如:鲜花博文)和免费(如:非鲜花博文),对应重要的信息,可以选择收费的信息类别,只有付费的用户可以看到该收费的信息,如:财经类的信息,这类信息一般会比较重要,保密要求高,且可能会给用户带来一定的利益。一般情况下,对于收费的信息中是否包含敏感词的判断比较严格,已确定用户能够拥有更好的使用体验。
在本发明的一种具体实现方式中,上述信息存储方法还可以包括:
接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
假设,预设数量为2,当前时间为8:00,已存储信息有A、B和C,其存储时间为[A,7:59]、[B,7:57]、[C,7:58],排序后推送给用户的信息为A和C。
在本发明的一种具体实现方式中,上述信息存储方法还可以包括:
根据用户上传信息的信息类别和/或查看信息的信息类别,获得所述用户的行为习惯;
存储所述行为习惯,以使得所述服务器根据所述行为习惯确定针对所述用户的待推荐信息。
假设,用户查看的信息多为教育类的信息,则说明该用户对教育类的信息比较感兴趣,因此,当有新的教育类的信息存储时,主动向该用户推送该教育类的信息,方便用户了解相关信息,避免用户花费不必要的时间去了解相关信息。
需要说明的是,若用户使用的移动终端,则服务器可以随时随地的发送最新的信息到用户使用的移动终端,以便用户随时可以获得最新的信息,不会错过任何的机遇。
应用图3所示实施例,服务器获得更新后的目标信息中的关键词,根据所获得的关键词,确定该目标信息的信息类别,并按照所确定的信息类别存储目标信息,这样,在其他用户查找信息时,能够根据信息类别快速获得相关的信息,提高了用户在网络环境中进行信息交互的体验。
图4为本发明实施例提供的一种信息存储装置的结构示意图,应用于服务器,该装置可以包括:信息接收模块401、敏感词判断模块402、替换词确定模块403、信息更新模块404和信息存储模块405;
其中,信息接收模块401,用于接收用户上传的目标信息;
具体地,上述目标信息可以为一句话或一段文字,如:用户根据在生活中的感想书写的一段文字,或用户看到的一篇文章等。
实际应用中,上述服务器可以为博客的服务器,博客的服务器就可以接收用户上传的目标信息,形成博文,并将博文存储在博客的服务器中。
敏感词判断模块402,用于根据预设的敏感词库,判断目标信息中是否包含敏感词,若为是,则触发替换词确定模块403,其中,预设的敏感词库,用于存储敏感词;
另外,上述敏感词可以认为是不宜在网络中出现的词。
在本发明的一种具体实现方式中,敏感词的判定可以为:一条目标信息中同时出现了一组词,才判定该目标信息中包含敏感词,如:在预设的敏感词库中“支持”和“台湾”为一组敏感词,若一条目标信息中只出现了“支持”或只出现了“台湾”,则判定该目标信息中未包含敏感词,若该目标信息同时出现了“支持”和“台湾”,才判定该目标信息中包含敏感词。这样,判定目标信息中是否包含敏感词的方法更为准确。
实际应用中,每个时期的敏感词可能是不同,因此,需要不断的更新预设的敏感词库,以保证服务器能够根据预设的敏感词库,准确的判定目标信息中是否包含敏感词,更新预设的敏感词库的装置可以参考图5,图5为本发明实施例提供的敏感词库更新装置的结构示意图,该装置应用于服务器,可以包括:查询请求发送模块501、查询结果接收模块502和词库更新模块503;
其中,查询请求发送模块501,用于在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
具体地,在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求,可以为:按照预设的时间间隔,向网络侧发送查询请求。假设,预设的时间间隔为5天,则每5天向网络侧发送查询请求。
另外,在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求,还可以为:接收管理人员发送的敏感词库更新指令之后,向网络侧发送查询请求。
需要说明的是,上述网络侧可以为网络交互社区,如:新浪博客、天涯博客,也可以为网络新闻发布平台,还可以为搜索引擎,如:百度、搜狗等,这些网络侧每天都存在着大量信息的交互,因此,可以及时获得当前的敏感词并更新预设的敏感词库。
查询结果接收模块502,用于接收网络侧根据查询请求进行敏感词查询的查询结果,其中,查询结果中包含敏感词;
词库更新模块503,用于根据查询结果中包含的敏感词,更新预设的敏感词库。
假设,网络侧反馈的查询结果中包含的敏感词为“鲜花”,则将“鲜花”存储到预设的敏感词库中,更新预设的敏感词库过程结束。
在本发明的一种具体实现方式中,还可以累计记录敏感词的出现次数,对于出现次数小于预设阈值的敏感词,可以在预设的敏感词库中删除,以免预设的敏感词库中存储过多无用的敏感词,占用过多的服务器的存储空间。
另外,上述累计记录的敏感词的出现次数可以为最近一段时间内的敏感词的出现次数,以避免一些敏感词因为在预设的敏感词库中存储了很长一段时间而使得其出现次数大于预设阈值,进而导致不能删除这些敏感词。
另外,在本发明的一种具体实现方式中,管理人员可以直接向预设的敏感词库中输入敏感词或从预设的敏感词库中删除敏感词,这样来更新预设的敏感词库更为人性化。
当然,上述预设的敏感词库可以根据用户的需要,采用查询请求发送模块501、查询结果接收模块502和词库更新模块503更新,还可以根据已存在的敏感词库(如:其他服务商构建的敏感词库)更新,在本发明对此不进行限定。
替换词确定模块403,用于根据预设的替换词库,确定目标信息中包含的敏感词的替换词,其中,预设的替换词库,用于存储敏感词的替换词;
在本发明的一种具体实现方式中,预设的替换词库中的替换词可以是单一的,即无论出现什么样的敏感词均替换为同一词语,如:预设的替换词库中的替换词为“a”,根据预设的敏感词库,判定目标信息中出现的敏感词有:“筛子”、“酒吧”和“花”,根据预设的替换词库,可以确定“筛子”、“酒吧”和“花”均替换为“a”。这样,在目标信息中包含敏感词时,可以直接进行替换,替换的速度快。
在本发明的一种具体实现方式中,预设的替换词库中的替换词还可以与敏感词一一对应。假设,预设的替换词库中的替换词为“a”、“b”、“c”,其中,“a”对应的敏感词为“筛子”,“b”对应的敏感词为“酒吧”,“c”对应的敏感词为“花”,若目标信息中出现的敏感词有:“筛子”、“酒吧”和“花”,根据预设的替换词库替换后,上述敏感词变为了“a”、“b”、“c”。这样,便于管理人员获知一用户上传的目标信息中出现了什么样的敏感词多、什么样的敏感词少、什么样的敏感词不会出现,并根据该用户上传的目标信息中出现次数多的敏感词建立一个针对该用户的子敏感词库,这样,在该用户上传的目标信息时,可以根据针对该用户的子敏感词库,判断该用户上传的目标信息是否包含敏感词,这样减少了需要判断的敏感词,提高了判断的速度,进而提高了整体的信息存储速度。
信息更新模块404,用于根据所确定的替换词更新目标信息;
信息存储模块405,用于存储更新后的目标信息。
假设,预设的敏感词库中存储的敏感词有:“筛子”、“酒吧”和“花”,若目标信息为“花儿为什么这样红”,则可以判定目标信息中包含敏感词“花”,此时,从替换词库中获得敏感词“花”的替换词,假设敏感词“花”的替换词为“a”,则根据替换词“a”更新的目标信息为“a儿为什么这样红”,并将“a儿为什么这样红”存储在服务器中。
应用上述各个实施例,服务器在接收到用户上传的目标信息后,根据预设的敏感词库中存储的敏感词,判断该目标信息中是否包含敏感词,若包含,则从预设的替换词库中查找并确定该目标信息中包含的敏感词的替换词,根据所确定的替换词,更新该目标信息,并存储更新后的该目标信息。这样,服务器存储的信息中包含的敏感词均被替换掉了,保证了已存储信息的健康安全,构建了一个安全的网络环境,确保用户获得的信息健康安全,提高用户在网络环境中进行信息交互的体验。
图6为本发明实施例提供的另一种信息存储装置的结构示意图,应用于服务器,该装置中,信息存储模块405,包括:关键词获得子模块405a、信息类别确定子模块405b和信息存储子模块405c;
其中,关键词获得子模块405a,用于获得更新后的目标信息中的关键词;
信息类别确定子模块405b,用于根据所获得的关键词,确定更新后的目标信息的信息类别;
信息存储子模块405c,用于按照所确定的信息类别存储更新后的目标信息。
具体地,上述信息类别可以包括:教育、财经、时事、娱乐等。在本发明实施例中,可以对目标信息进行分词,从中获得关键词,并分析关键词,确定目标信息的信息类别,分类存储目标信息,这样,在其他用户查找信息时,能够根据信息类别快速获得相关的信息。
这种情况下,预设的敏感词库可以包含针对各个信息类别的子敏感词库,这样,在将一条已存储信息推送给用户时,可以根据针对该已存储信息所属的信息类别的子敏感词库,对该已存储信息进行检测,判断该已存储信息中是否包含为替换的敏感词,确保了该已存储信息的健康安全,提高了在网络环境中进行信息交互的体验。
另外,在用户上传目标信息时,用户可以直接选择的信息类别,服务器根据用户选择的信息类别,确定子敏感词库,根据确定的子敏感词库,判断该目标信息中是否包含为替换的敏感词。这样节约了判断的时间,提高了目标信息的存储速度。
在本发明的一种具体实现方式中,信息类别还可以包括收费(如:鲜花博文)和免费(如:非鲜花博文),对应重要的信息,可以选择收费的信息类别,只有付费的用户可以看到该收费的信息,如:财经类的信息,这类信息一般会比较重要,保密要求高,且可能会给用户带来一定的利益。一般情况下,对于收费的信息中是否包含敏感词的判断比较严格,已确定用户能够拥有更好的使用体验。
在本发明的一种具体实现方式中,上述信息存储装置还可以包括:信息推送模块(图6中未示出),
用于接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
用于确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
用于按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
假设,预设数量为2,当前时间为8:00,已存储信息有A、B和C,其存储时间为[A,7:59]、[B,7:57]、[C,7:58],排序后推送给用户的信息为A和C。
在本发明的一种具体实现方式中,上述信息存储装置还可以包括:行为习惯获得模块和行为习惯存储模块(图6中未示出);
其中,行为习惯获得模块,用于根据用户上传信息的信息类别和/或查看信息的信息类别,获得用户的行为习惯;
行为习惯存储模块,用于存储行为习惯,以使得服务器根据行为习惯确定针对用户的待推荐信息。
假设,用户查看的信息多为教育类的信息,则说明该用户对教育类的信息比较感兴趣,因此,当有新的教育类的信息存储时,主动向该用户推送该教育类的信息,方便用户了解相关信息,避免用户花费不必要的时间去了解相关信息。
需要说明的是,若用户使用的移动终端,则服务器可以随时随地的发送最新的信息到用户使用的移动终端,以便用户随时可以获得最新的信息,不会错过任何的机遇。
应用图6所示实施例,服务器获得更新后的目标信息中的关键词,根据所获得的关键词,确定该目标信息的信息类别,并按照所确定的信息类别存储目标信息,这样,在其他用户查找信息时,能够根据信息类别快速获得相关的信息,提高了用户在网络环境中进行信息交互的体验。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种信息存储方法,应用于服务器,其特征在于,所述方法包括步骤:
接收用户上传的目标信息;
根据预设的敏感词库,判断所述目标信息中是否包含敏感词,其中,所述预设的敏感词库,用于存储敏感词;
若为是,则根据预设的替换词库,确定所述目标信息中包含的敏感词的替换词,其中,所述预设的替换词库,用于存储敏感词的替换词;
根据所确定的替换词更新所述目标信息;
存储更新后的所述目标信息。
2.根据权利要求1所述的方法,其特征在于,所述预设的敏感词库通过以下方式更新:
在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
接收所述网络侧根据所述查询请求进行敏感词查询的查询结果,其中,所述查询结果中包含敏感词;
根据所述查询结果中包含的敏感词,更新所述预设的敏感词库。
3.根据权利要求1所述的方法,其特征在于,所述存储更新后的所述目标信息,包括:
获得更新后的所述目标信息中的关键词;
根据所获得的关键词,确定更新后的所述目标信息的信息类别;
按照所确定的信息类别存储更新后的所述目标信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据用户上传信息的信息类别和/或查看信息的信息类别,获得所述用户的行为习惯;
存储所述行为习惯,以使得所述服务器根据所述行为习惯确定针对所述用户的待推荐信息。
6.一种信息存储装置,应用于服务器,其特征在于,所述装置包括:信息接收模块、敏感词判断模块、替换词确定模块、信息更新模块和信息存储模块;
其中,所述信息接收模块,用于接收用户上传的目标信息;
所述敏感词判断模块,用于根据预设的敏感词库,判断所述目标信息中是否包含敏感词,若为是,则触发所述替换词确定模块,其中,所述预设的敏感词库,用于存储敏感词;
所述替换词确定模块,用于根据预设的替换词库,确定所述目标信息中包含的敏感词的替换词,其中,所述预设的替换词库,用于存储敏感词的替换词;
所述信息更新模块,用于根据所确定的替换词更新所述目标信息;
所述信息存储模块,用于存储更新后的所述目标信息。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:查询请求发送模块、查询结果接收模块和词库更新模块;
其中,所述查询请求发送模块,用于在满足预设的敏感词库更新条件的情况下,向网络侧发送查询请求;
所述查询结果接收模块,用于接收所述网络侧根据所述查询请求进行敏感词查询的查询结果,其中,所述查询结果中包含敏感词;
所述词库更新模块,用于根据所述查询结果中包含的敏感词,更新所述预设的敏感词库。
8.根据权利要求6所述的装置,其特征在于,所述信息存储模块,包括:关键词获得子模块、信息类别确定子模块和信息存储子模块;
其中,所述关键词获得子模块,用于获得更新后的所述目标信息中的关键词;
所述信息类别确定子模块,用于根据所获得的关键词,确定更新后的所述目标信息的信息类别;
所述信息存储子模块,用于按照所确定的信息类别存储更新后的所述目标信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:信息推送模块,
用于接收用户输入的信息类别;根据所输入的信息类别,确定待推荐信息,并将所述待推荐信息推送给用户;或
用于确定访问次数大于预设阈值的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户;或
用于按照已存储信息的存储时间由后到先的顺序,从已存储信息中确定预设数量的已存储信息为所述待推荐信息,并将所述待推荐信息推送给用户。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:行为习惯获得模块和行为习惯存储模块;
其中,所述行为习惯获得模块,用于根据用户上传信息的信息类别和/或查看信息的信息类别,获得所述用户的行为习惯;
所述行为习惯存储模块,用于存储所述行为习惯,以使得所述服务器根据所述行为习惯确定针对所述用户的待推荐信息。
CN201610008386.XA 2016-01-07 2016-01-07 一种信息存储方法及装置 Pending CN105574203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610008386.XA CN105574203A (zh) 2016-01-07 2016-01-07 一种信息存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610008386.XA CN105574203A (zh) 2016-01-07 2016-01-07 一种信息存储方法及装置

Publications (1)

Publication Number Publication Date
CN105574203A true CN105574203A (zh) 2016-05-11

Family

ID=55884334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610008386.XA Pending CN105574203A (zh) 2016-01-07 2016-01-07 一种信息存储方法及装置

Country Status (1)

Country Link
CN (1) CN105574203A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107003930A (zh) * 2017-01-25 2017-08-01 深圳前海达闼云端智能科技有限公司 用户信息记录方法、装置及电子设备
CN108123933A (zh) * 2017-12-05 2018-06-05 南京南邮信息产业技术研究院有限公司 基于互联网大数据的信息泄露自动监测方法和系统
CN113011165A (zh) * 2021-03-19 2021-06-22 支付宝(杭州)信息技术有限公司 一种识别被封锁关键词的方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729520A (zh) * 2008-10-28 2010-06-09 北京大学 敏感信息的检测方法及装置
CN102779176A (zh) * 2012-06-27 2012-11-14 北京奇虎科技有限公司 关键词过滤系统及方法
CN103365924A (zh) * 2012-04-09 2013-10-23 北京大学 一种搜索信息的方法、装置和终端
CN103618668A (zh) * 2013-12-18 2014-03-05 清华大学 微博推送、接收方法及装置
CN103678620A (zh) * 2013-12-18 2014-03-26 国家电网公司 一种基于用户历史行为特征的知识文档推荐方法
JP2015184769A (ja) * 2014-03-20 2015-10-22 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、及びプログラム
CN105183761A (zh) * 2015-07-27 2015-12-23 网易传媒科技(北京)有限公司 敏感词替换方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729520A (zh) * 2008-10-28 2010-06-09 北京大学 敏感信息的检测方法及装置
CN103365924A (zh) * 2012-04-09 2013-10-23 北京大学 一种搜索信息的方法、装置和终端
CN102779176A (zh) * 2012-06-27 2012-11-14 北京奇虎科技有限公司 关键词过滤系统及方法
CN103618668A (zh) * 2013-12-18 2014-03-05 清华大学 微博推送、接收方法及装置
CN103678620A (zh) * 2013-12-18 2014-03-26 国家电网公司 一种基于用户历史行为特征的知识文档推荐方法
JP2015184769A (ja) * 2014-03-20 2015-10-22 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、及びプログラム
CN105183761A (zh) * 2015-07-27 2015-12-23 网易传媒科技(北京)有限公司 敏感词替换方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107003930A (zh) * 2017-01-25 2017-08-01 深圳前海达闼云端智能科技有限公司 用户信息记录方法、装置及电子设备
CN107003930B (zh) * 2017-01-25 2020-07-28 深圳前海达闼云端智能科技有限公司 用户信息记录方法、装置及电子设备
CN108123933A (zh) * 2017-12-05 2018-06-05 南京南邮信息产业技术研究院有限公司 基于互联网大数据的信息泄露自动监测方法和系统
CN108123933B (zh) * 2017-12-05 2020-12-08 南京南邮信息产业技术研究院有限公司 基于互联网大数据的信息泄露自动监测方法和系统
CN113011165A (zh) * 2021-03-19 2021-06-22 支付宝(杭州)信息技术有限公司 一种识别被封锁关键词的方法、装置、设备及介质
CN113011165B (zh) * 2021-03-19 2024-06-07 支付宝(中国)网络技术有限公司 一种识别被封锁关键词的方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US11580104B2 (en) Method, apparatus, device, and storage medium for intention recommendation
WO2021098648A1 (zh) 文本推荐方法、装置、设备及介质
US20180276304A1 (en) Advanced computer implementation for crawling and/or detecting related electronically catalogued data using improved metadata processing
CN101351795B (zh) 用于基于概念的搜索与分析的系统、方法与设备
US9280339B1 (en) Class replacer during application installation
CN105144159A (zh) Hive表链接
US11093461B2 (en) Method for computing distinct values in analytical databases
CN102930054A (zh) 数据搜索方法及系统
CN104133878A (zh) 用户标签的生成方法和装置
CN103118111A (zh) 一种基于多个数据交互中心的数据进行信息推送的方法
CN111597449A (zh) 用于搜索的候选词构建方法、装置、电子设备及可读介质
CN105574203A (zh) 一种信息存储方法及装置
US10929447B2 (en) Systems and methods for customized data parsing and paraphrasing
CN108154024A (zh) 一种数据检索方法、装置及电子设备
CN104021192A (zh) 一种数据库更新方法及装置
CN105635821A (zh) 一种视频过滤方法及装置
US9230011B1 (en) Index-based querying of archived data sets
US11941145B2 (en) User data system including user data fragments
Saha et al. Big data and internet of things: a survey
CN113961811A (zh) 基于事件图谱的话术推荐方法、装置、设备及介质
CN112419058A (zh) 数据管理方法和装置、存储介质及电子设备
CN104298768A (zh) 一种搜索方法、装置及系统
US10142429B2 (en) Web presence management system
Lee et al. An efficient application-device matching method for the mobile software ecosystem
CN116561134B (zh) 业务规则处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160511