CN110399554A - 一种网站内容特定信息的检测方法、装置和存储系统 - Google Patents
一种网站内容特定信息的检测方法、装置和存储系统 Download PDFInfo
- Publication number
- CN110399554A CN110399554A CN201910631309.3A CN201910631309A CN110399554A CN 110399554 A CN110399554 A CN 110399554A CN 201910631309 A CN201910631309 A CN 201910631309A CN 110399554 A CN110399554 A CN 110399554A
- Authority
- CN
- China
- Prior art keywords
- specific information
- web site
- detection
- site contents
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000007689 inspection Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 abstract description 9
- 230000008901 benefit Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种网站内容特定信息的检测方法、装置和存储系统,所述方法包括:在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。本发明实施例可以最大化利用计算机的计算性能并行处理过滤敏感词,减少检测时间消耗,对违规网站监控更加便捷高效。
Description
技术领域
本发明涉及网站内容检测技术,尤指一种网站内容特定信息的检测方法、装置和存储系统。
背景技术
当前信息化浪潮高速发展,互联网技术的发展日新月异,每天都有大量网站在各大专业或非专业的网站代理机构上线运行,上线运行的网站质量参差不齐,所发布的信息也相差甚大,信息化社会存在利的同时也存在弊端,利的一面是我们查找各种资料非常方便,弊的一面是信息化的互联网中存在各种违规的内容,如导致伤害青少年的身心健康的黄色网站、违反国家安全的违法信息等各种非法内容。为了积极响应国家号召净化网络环境,同时使广大网民能够浏览到更加健康和正能量的互联网环境,因此检测网站内容、屏蔽违规网站,以对处理非法网站管理人员和对广大网民传导正确的思想教育至关重要。
目前国内做网站内容分发网络(Content Delivery Network,CDN)的厂商越来越多,那么在这鱼龙混杂的众多网站就存在各种违规违法等相关问题,作为CDN厂商有责任对用户通过厂商CDN节点访问网页的内容做违法违规的查封处理。在传统网站抓取和敏感词检测方法中,通常使用抓取工具对网站内容进行抓取后的结果文件存储在本地机器中,然后使用程序读取数据并做敏感词的过滤提取,从而识别违规网站的统一资源定位符(URL),接下来把这些违规网站送交审查人员进行审查确定是否真正违规,从而判定是否需要做查封网站处理。
然而现有技术对网站敏感词的检测时间消耗大,不能最大化利用计算机的计算性能并行处理过滤敏感词,对网站监控效率低。
发明内容
为了解决上述技术问题,本发明实施例提供了一种网站内容特定信息的检测方法、装置和存储系统,可以最大化利用计算机的计算性能并行处理过滤敏感词,减少检测时间消耗,对违规网站监控更加便捷高效。
为了达到本发明目的,一方面,本发明实施例提供了一种网站内容特定信息的检测方法,包括:
在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
进一步地,所述的网站内容特定信息的检测方法还包括:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
其中,所述对所述网站内容进行特定信息检测包括:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
进一步地,所述的网站内容特定信息的检测方法还包括:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
可选地,所述大数据集群的存储系统包括Hadoop分布式文件系统HDFS。
另一方面,本发明实施例还提供了一种网站内容特定信息的检测装置,包括:
内容抓取器,用于在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
敏感词检测器,用于对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
违规网站送检器,用于将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
进一步地,所述装置还用于:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
其中,所述敏感词检测器用于:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
进一步地,所述装置还用于:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
本发明实施例还提供了一种存储系统,所述存储系统存储权利要求1-5任一项所述的方法获取的网站内容特定信息及对应网站统一资源定位符URL。
本发明实施例通过在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。本发明实施例可以最大化利用计算机的计算性能并行处理过滤敏感词,减少检测时间消耗,对违规网站监控更加便捷高效。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例网站内容特定信息的检测方法的流程图;
图2为本发明实施例网站内容特定信息的检测方法中基于大数据并行分析的网站敏感词违规检测流程图;
图3为本发明实施例网站内容特定信息的检测装置的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例网站内容特定信息的检测方法的流程图,如图1所示,本发明实施例的方法包括以下步骤:
步骤101:在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
具体地,本发明实施例本发明提出了一种基于大数据并行分析的网站敏感词违规检测的方法,主要应用于网站页面抓取和网站页面内容敏感词检测,通过该方法对网站敏感词的检测可以减少检测时间消耗,最大化利用计算机的计算性能并行处理过滤敏感词,对社会正能量的发展和违规网站监控更加便捷高效。
其中,大数据:指需要新的处理模式来满足海量数据规模、快速的数据增长和多样的数据类型的信息资产。
敏感词:指对社会产生不良影响的淫秽色情以及违规违法词汇或语句,如公安等部门关注的特殊词汇。
域名:指由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。
URL:可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
本发明实施例的方法包括使用大数据技术的内容抓取器、敏感词检测器和违规网站送检器。
在大数据集群的存储系统中存储大量用户访问的网页统一资源定位符URL。
进一步地,所述存储系统可以包括URL存储系统、抓取内容存储系统、敏感信息存储系统。
例如,根据URL存储系统中的URL进行内容抓取,将获取的结果存储于抓取内容存储系统中,然后在所述抓取内容存储系统中检测内容获取存在的敏感词,将所述敏感词存储于敏感信息存储系统中。
步骤102:对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
具体地,集群中运行内容抓取器抓取步骤101中的URL,并将网页内容结果在大数据集群中存储;
通过对大量的违规违法的敏感词配置在集群中运行敏感词检测器,对存储的抓取器结果进行敏感词检测,检查存在违规违法的网站URL,并将含有敏感词的内容与网站URL对应存储;
步骤103:将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
具体地,将步骤102的结果通过违规网站送检器传递给相关系统做进一步违规检测或查封处理。
进一步地,所述的网站内容特定信息的检测方法还包括:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
其中,所述对所述网站内容进行特定信息检测包括:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
进一步地,所述的网站内容特定信息的检测方法还包括:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
可选地,所述大数据集群的存储系统包括Hadoop分布式文件系统HDFS。
图2为本发明实施例网站内容特定信息的检测方法中基于大数据并行分析的网站敏感词违规检测流程图,如附图2所示,本发明实施例具体实施过程如下:
在大数据集群中存储大量用户访问的网页URL,这些URL可来源于CDN厂商的服务日志,也可以来源于电信运营上用户的上网日志。前提为不涉及到用户隐私的情况下,使用内容抓取器抓取网站URL内容作为敏感词检测的输入来源,例如:URL为www.baidu.com/index.html,通过内容抓取器抓取出来的数据为“百度一下你就知道”;
将上述抓取的结果和抓取到的内容对应放入集群存储系统中,例如:将URL和抓取的内容存入Hadoop分布式文件系统(HDFS)存储系统中;
通过配置大量的违规违法的敏感词,配置在集群运行敏感词检测器中,将存储的内容抓取器的结果存储路径递交给敏感词检测器;
敏感词检测器获得存储路径后,根据存储路径查询并检查存储的URL和抓取的内容。
敏感词检测器检查存储的URL和抓取的内容,当判断确实存在违规违法的网站URL时,将含有的敏感词、网站的内容与网站URL对应存储,例如:把结果存入数据仓库工具hive表中,敏感词检测器集成在函数hiveUDF中,以此来运行大规模集群并行分析模式;
敏感词、网站的内容与网站URL对应存储后,使用违规网站送捡器把含有敏感词的网站检测结果传送给违规网站决策系统,以进行网站违法违规查封或整改调整。
本发明实施例中,使用大数据集群技术并行分析网站敏感词违规检测的方法,可减少文本抓取时间和敏感词过滤提取时间,因为在大数据量的文本过滤多个敏感词会很耗费计算机性能,所以采用大数据中的集群模式对大数据量的数据进行挖掘提取,这种并行化处理可明显比传统单机多线程处理模式大大减少敏感词检测处理时间,提高了处理效率。
因此,本发明实施例的方法通过使用大数据技术的内容抓取器、敏感词检测器和违规网站送检器,大大提高了数据抓取的效率,并降低了检测的时间成本。
图3为本发明实施例网站内容特定信息的检测装置的结构图,如图3所示,本发明实施例另一方面提供的一种网站内容特定信息的检测装置,包括:
内容抓取器301,用于在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
敏感词检测器302,用于对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
违规网站送检器303,用于将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
其中,本发明实施例的装置使用大数据处理技术利用内容抓取器、敏感词检测器和违规网站送检器组件通过高效的大规模数据处理技术和敏感词检测技术进行检测。
具体地,基于数据集群技术并行分析网站敏感词违规检测的装置通过实现内容抓取器、敏感词检测器和违规网站送检器组件组合,主要用于:
使用内容抓取器大规模并行抓取URL的内容做存储系统存储;
使用敏感词检测器大规模并行处理检测提取敏感词信息;
使用违规网站送检器将相关违规网站URL和违规信息传递给违规违规网站决策系统进行处理。
进一步地,所述装置还用于:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
其中,所述敏感词检测器302用于:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
进一步地,所述装置还用于:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
本发明实施例还提供了一种存储系统,所述存储系统存储权利要求1-5任一项所述的方法获取的网站内容特定信息及对应网站统一资源定位符URL。
本发明实施例通过在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。本发明实施例可以最大化利用计算机的计算性能并行处理过滤敏感词,减少检测时间消耗,对违规网站监控更加便捷高效。
在大数据时代,大量的数据存储和处理需要使用大规模并行化思想处理很多之前单机程序遇到的技术瓶颈,本发明主要应用于网站页面抓取和网站页面内容敏感词检测,通过该方法对网站敏感词的检测可以减少检测时间消耗,最大化利用计算机的计算性能并行处理过滤敏感词。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种网站内容特定信息的检测方法,其特征在于,包括:
在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
2.根据权利要求1所述的网站内容特定信息的检测方法,其特征在于,还包括:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
3.根据权利要求2所述的网站内容特定信息的检测方法,其特征在于,所述对所述网站内容进行特定信息检测包括:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
4.根据权利要求3所述的网站内容特定信息的检测方法,其特征在于,还包括:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
5.根据权利要求4所述的网站内容特定信息的检测方法,其特征在于,所述大数据集群的存储系统包括Hadoop分布式文件系统HDFS。
6.一种网站内容特定信息的检测装置,其特征在于,包括:
内容抓取器,用于在大数据集群中使用大数据处理技术,并行抓取用户访问的网页统一资源定位符URL对应的网站内容作为特定信息检测的输入来源;
敏感词检测器,用于对所述网站内容进行特定信息检测,检测获取所述特定信息及存在所述特定信息对应网站URL,则将获取结果进行存储;
违规网站送检器,用于将存储的所述特定信息对应网站URL和所述特定信息传递给违规网站决策系统进行处理。
7.根据权利要求6所述的网站内容特定信息的检测装置,其特征在于,所述装置还用于:
将抓取的所述网站内容的结果存储于大数据集群的存储系统中。
8.根据权利要求7所述的网站内容特定信息的检测装置,其特征在于,所述敏感词检测器用于:
通过大数据处理技术和敏感词检测技术并行处理检测提取敏感信息。
9.根据权利要求8所述的网站内容特定信息的检测装置,其特征在于,所述装置还用于:将所述敏感信息以及含有所述敏感信息的内容与所述网站URL对应存储。
10.一种存储系统,其特征在于,所述存储系统存储权利要求1-5任一项所述的方法获取的网站内容、特定信息及对应网站统一资源定位符URL。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910631309.3A CN110399554A (zh) | 2019-07-12 | 2019-07-12 | 一种网站内容特定信息的检测方法、装置和存储系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910631309.3A CN110399554A (zh) | 2019-07-12 | 2019-07-12 | 一种网站内容特定信息的检测方法、装置和存储系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110399554A true CN110399554A (zh) | 2019-11-01 |
Family
ID=68325462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910631309.3A Pending CN110399554A (zh) | 2019-07-12 | 2019-07-12 | 一种网站内容特定信息的检测方法、装置和存储系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399554A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111600772A (zh) * | 2020-04-30 | 2020-08-28 | 北京金山云网络技术有限公司 | 网络分发内容检测处理装置、方法、系统及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951539A (zh) * | 2015-06-19 | 2015-09-30 | 成都艾尔普科技有限责任公司 | 互联网数据中心有害信息监测系统 |
CN107181620A (zh) * | 2017-06-09 | 2017-09-19 | 安徽博约信息科技股份有限公司 | 一种属地网站监管系统 |
CN107392028A (zh) * | 2017-07-21 | 2017-11-24 | 上海携程商务有限公司 | 敏感信息的检测方法及其检测装置、存储介质、电子设备 |
CN107579976A (zh) * | 2017-09-06 | 2018-01-12 | 杭州安恒信息技术有限公司 | 自定义检测网站敏感信息的方法及装置 |
-
2019
- 2019-07-12 CN CN201910631309.3A patent/CN110399554A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951539A (zh) * | 2015-06-19 | 2015-09-30 | 成都艾尔普科技有限责任公司 | 互联网数据中心有害信息监测系统 |
CN107181620A (zh) * | 2017-06-09 | 2017-09-19 | 安徽博约信息科技股份有限公司 | 一种属地网站监管系统 |
CN107392028A (zh) * | 2017-07-21 | 2017-11-24 | 上海携程商务有限公司 | 敏感信息的检测方法及其检测装置、存储介质、电子设备 |
CN107579976A (zh) * | 2017-09-06 | 2018-01-12 | 杭州安恒信息技术有限公司 | 自定义检测网站敏感信息的方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111600772A (zh) * | 2020-04-30 | 2020-08-28 | 北京金山云网络技术有限公司 | 网络分发内容检测处理装置、方法、系统及电子设备 |
CN111600772B (zh) * | 2020-04-30 | 2022-05-10 | 北京金山云网络技术有限公司 | 网络分发内容检测处理装置、方法、系统及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101597B (zh) | 一种电力新闻数据采集系统 | |
Lakshmi et al. | Efficient prediction of phishing websites using supervised learning algorithms | |
CN104767757B (zh) | 基于web业务的多维度安全监测方法和系统 | |
CN108776671A (zh) | 一种网络舆情监控系统及方法 | |
CN108769048A (zh) | 一种安全可视化与态势感知平台系统 | |
CN106685936B (zh) | 网页篡改的检测方法及装置 | |
CN101751458A (zh) | 一种网络舆情监控系统及方法 | |
CN102591965B (zh) | 一种黑链检测的方法及装置 | |
CN107181612A (zh) | 一种基于大数据的可视化网络安全监控方法 | |
CN102436563B (zh) | 一种检测页面篡改的方法及装置 | |
CN102446255B (zh) | 一种检测页面篡改的方法及装置 | |
CN109242553A (zh) | 一种用户行为数据推荐方法、服务器及计算机可读介质 | |
CN102054015A (zh) | 使用有机物件数据模型来组织社群智能信息的系统及方法 | |
CN105138907B (zh) | 一种主动探测被攻击网站的方法和系统 | |
CN105468744A (zh) | 一种实现税务舆情分析和全文检索的大数据平台 | |
CN106779278A (zh) | 资产信息的评价系统及其信息的处理方法和装置 | |
CN109033203A (zh) | 一种面向大数据的特征提取并行处理方法 | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
CN109308330A (zh) | 基于互联网的企业泄露信息提取、分析及分类的方法 | |
CN104036190A (zh) | 一种检测页面篡改的方法及装置 | |
CN104346443A (zh) | 网络文本处理方法及装置 | |
CN110399554A (zh) | 一种网站内容特定信息的检测方法、装置和存储系统 | |
CN104036189A (zh) | 页面篡改检测方法及黑链数据库生成方法 | |
CN108197465B (zh) | 一种网址检测方法及装置 | |
CN106557590A (zh) | 一种智能问答系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191101 |