CN104992113A - 检测网站隐私内容是否暴露的方法、装置和云监控系统 - Google Patents

检测网站隐私内容是否暴露的方法、装置和云监控系统 Download PDF

Info

Publication number
CN104992113A
CN104992113A CN201510290214.1A CN201510290214A CN104992113A CN 104992113 A CN104992113 A CN 104992113A CN 201510290214 A CN201510290214 A CN 201510290214A CN 104992113 A CN104992113 A CN 104992113A
Authority
CN
China
Prior art keywords
website
content
privacy
privacy content
appointed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510290214.1A
Other languages
English (en)
Inventor
鲍坤夫
刘浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510290214.1A priority Critical patent/CN104992113A/zh
Publication of CN104992113A publication Critical patent/CN104992113A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/554Detecting local intrusion or implementing counter-measures involving event detection and direct action
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种检测网站隐私内容是否暴露的方法、装置和云监控系统,该方法包括:接收检测指定网站的隐私内容的请求;通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上,或者,将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。本发明提供的技术方案根据网站管理者的需求,为网站管理者提供了获知指定网站的信息公开情况的服务,使得网站管理者能够及时有效地获知指定网站的信息公开情况,避免网站隐私信息的泄漏,符合网站管理需求。

Description

检测网站隐私内容是否暴露的方法、装置和云监控系统
技术领域
本发明涉及信息安全领域,具体涉及一种检测网站隐私内容是否暴露的方法、装置和一种云监控系统。
背景技术
现有技术中,网站管理者在运营维护指定网站时,往往无法及时有效地获知其管理的网站的信息公开情况,更无法根据信息公开情况对网站所公开信息进行调整和维护。当该指定网站的隐私信息暴露在互联网环境中时,其他人可以通过搜索引擎搜索得到该指定网站的隐私信息,而网站管理者却不能及时发现,导致网站存在信息安全隐患,不符合网站管理需求。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种检测网站隐私内容是否暴露的方法、装置和一种云监控系统。
依据本发明的一个方面,提供了一种检测网站隐私内容是否暴露的方法,该方法包括:
接收检测指定网站的隐私内容的请求;
通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上,或者,将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
可选地,所述接收检测指定网站的隐私内容的请求包括:提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称。
以及将所述爬取的全部内容返回给请求方包括:提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
可选地,所述接收检测指定网站的隐私内容的请求包括:
在用户界面上提供隐私内容查看控件;
当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
可选地,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取所述指定网站的本意公开内容;
将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
可选地,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取与所述指定网站的隐私内容相关的关键词和/或特征格式;
扫描所述爬取的全部内容,判断所述爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定所述指定网站有隐私内容暴露的网站上。
可选地,该方法进一步包括:
当判断出所述指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
可选地,上述步骤由对运行在互联网数据中心IDC上的网络业务系统进行运维管理的云监控系统执行。
依据本发明的另一个方面,提供了一种检测网站隐私内容是否暴露的装置,该装置包括:
接收单元,适于接收检测指定网站的隐私内容的请求;
获取单元,适于通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
判断单元,适于根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上;
返回单元,适于将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
可选地,所述接收单元,适于提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称。
所述返回单元,适于提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
可选地,所述接收单元,适于在用户界面上提供隐私内容查看控件,当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
可选地,所述获取单元,进一步适于获取所述指定网站的本意公开内容;
所述判断单元,适于将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
可选地,所述获取单元,进一步适于获取与所述指定网站的隐私内容相关的关键词和/或特征格式;
所述判断单元,适于扫描所述爬取的全部内容,判断所述爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定所述指定网站有隐私内容暴露的网站上。
可选地,该装置进一步包括:
报警单元,适于当所述判断单元判断出所述指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
依据本发明的又一个方面,提供了一种云监控系统,该云监控系统对运行在IDC上的网络业务系统进行运维管理,且该云监控系统包括如上任一项所述的检测网站隐私内容是否暴露的装置。
由上述可知,对于一个网站管理者来说,获知其管理的网站的信息公开情况是十分重要的,网站管理者可以根据该信息公开情况对网站隐私暴露的现象及时加以调整和维护,保护网站隐私安全。对于一个指定网站来说,搜索引擎爬虫从指定网站爬取的全部内容反映了该指定网站暴露在互联网环境中的全部内容,通过分析该内容中是否存在隐私内容即可判断指定网站的隐私内容是否被暴露。本发明提供的技术方案根据网站管理者的需求,为网站管理者提供了获知指定网站的信息公开情况的服务,通过搜索引擎爬虫爬取得到指定网站的全部内容,主动或者让网站管理者判断指定网站的隐私内容是否暴露在网站上,使得网站管理者能够及时有效地获知指定网站的信息公开情况,避免网站隐私信息的泄漏,符合网站管理需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种检测网站隐私内容是否暴露的方法的流程图;
图2示出了根据本发明一个实施例的一种检测网站隐私内容是否暴露的装置的示意图;
图3示出了根据本发明另一个实施例的一种检测网站隐私内容是否暴露的装置的示意图;
图4示出了根据本发明一个实施例的一种云监控系统的示意图。
图5示出了根据本发明一个实施例的IDC进行公有云监控部署的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种检测网站隐私内容是否暴露的方法的流程图。如图1所示,该方法包括:
步骤S110,接收检测指定网站的隐私内容的请求。
步骤S120,通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从指定网站爬取的全部内容。
步骤S130,根据爬取的全部内容判断指定网站的隐私内容是否暴露在网站上,或者,将爬取的全部内容返回给请求方,以便请求方核对指定网站的隐私内容是否暴露在网站上。
可见,对于一个指定网站来说,搜索引擎爬虫从指定网站爬取的全部内容反映了该指定网站暴露在互联网环境中的全部内容,通过分析该内容中是否存在隐私内容即可判断指定网站的隐私内容是否被暴露。图1所示的方法根据网站管理者的需求,为网站管理者提供了获知其管理的指定网站的信息公开情况的服务,通过搜索引擎爬虫爬取得到指定网站的全部内容,主动或者让网站管理者判断指定网站的隐私内容是否暴露在网站上,使得网站管理者能够及时有效地获知指定网站的信息公开情况,避免网站隐私信息的泄漏,符合网站管理需求。
在本发明的一个实施例中,图1所示方法的步骤S110中,接收检测指定网站的隐私内容的请求包括:提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息。其中,网站描述信息为网站地址或网站名称。以及步骤S130中将爬取的全部内容返回给请求方包括:提供请求内容返回接口,通过该返回接口将爬取的全部内容返回给请求方。
这大大方便了与用户的沟通和通信。例如,本方案可以提供一个页面,该页面上有网站描述信息输入框,用户打开该页面并在网站描述信息输入框中输入网站地址或网站名称即可。以及,可以通过用户指定的渠道(邮件,上传到指定服务器)将爬取的内容返回给请求方;或者直接根据爬取的全部内容判断指定网站的隐私内容是否暴露在网站上,将判断结果通过该页面显示给用户或者通过用户指定的渠道发送给用户。
在本发明的另一个实施例中,图1所示方法的步骤S110中,接收检测指定网站的隐私内容的请求包括:在用户界面上提供隐私内容查看控件;当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。这个是针对登录用户提供的一键查看方案,当用户已登录页面时,可以根据用户的登录信息获知其对应的网站,因为登录用户只需要触发隐私内容查看控件即可启动图1的方案,进而获知对应的网站的隐私内容是否暴露在网站上。
在本发明的一个实施例中,图1所示方法的步骤S130中,根据爬取的全部内容判断指定网站的隐私内容是否暴露在网站上包括:
方案一:获取指定网站的本意公开内容;将爬取的全部内容与本意公开内容进行比对,如果爬取的全部内容比本意公开内容多,则确定指定网站有隐私内容暴露的网站上。这里网站的本意公开内容是指网站的非隐私内容,即本意要公开在网站上的内容。
方案二:获取与指定网站的隐私内容相关的关键词和/或特征格式;扫描爬取的全部内容,判断爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定指定网站有隐私内容暴露的网站上。例如,隐私内容是用户名和密码等保密信息,可以以用户名作为关键词进行扫描。又例如,隐私内容是一种特殊格式的文档,则可以根据格式特征进行扫描。
在本发明的一个实施例中,图1所示的方法进一步包括:
步骤S140,当判断出指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
其中,所述预设的方式包括如下中的一种或多种:电子邮件、手机短信、即时通信消息等。在具体的实施例中,可以根据报警内容的紧急程度选取不同的方式发出报警,如较紧急的通过手机短信或即时通信消息发出报警,不太紧急的通过电子邮件发出报警;也可以根据发出报警的时间选取不同的方式发出报警,也可以根据接收报警的用户的角色选取不同的方式发出报警等,均以保证用户的需求为前提。
随着互联网的不断发展,互联网数据中心(Internet Data Center,IDC)应运而生,成为新世纪中国互联网产业中不可或缺的重要一环,为互联网内容提供商、企业、媒体和各类网站提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、网络带宽以及ASP、EC等业务。在IDC进行公有云监控部署后,云监控系统可对运行在IDC上的网站系统进行监控维护。因此,在本发明的一个实施例中,图1所示的方法的各步骤由对运行在互联网数据中心IDC上的网络业务系统进行运维管理的云监控系统执行。图5示出了根据本发明一个实施例的IDC进行公有云监控部署的示意图,在本实施例中,检测网站隐私内容是否暴露的方案可以以如图5所示的公有云监控部署为基础,由云监控系统对指定网站提供检测网站隐私内容是否暴露的服务。此外,由于对于IDC来说,网站管理者是直接用户,因此本文中所出现的“用户”均指:相应网站管理者。
例如,对于有获取网站信息公开情况的需求的网站管理者来说,在IDC进行公有云监控部署的背景下,仅需注册待监控的网站域名,并在待监控网站系统上通过简单网络管理协议(SNMP)安装配置脚本,就可以根据需要获得由云监控系统提供的各类型监控服务。则在此背景下,一种检测网站隐私内容是否暴露的方案的实施过程如下:
根据用户需求,接收检测指定网站的隐私内容的请求,具体形式可以是:通过输入接口接收用户输入的指定网站的描述信息;或者,响应于用户触发特定控件的操作,确定接收到检测该登录用户对应的网站的隐私内容的请求。在接收到请求后,通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从指定网站爬取的全部内容。
一方面,可以主动根据爬取的全部内容判断指定网站的隐私内容是否暴露在网站上,将判断结果返回给用户,在发现网站的隐私内容暴露在网站上时,向用户发起报警。其中具体判断方式可以是:获取指定网站的本意公开内容,将爬取的全部内容与本意公开内容进行比对,如果爬取的全部内容比本意公开内容多,则确定指定网站有隐私内容暴露的网站上;或者,获取与指定网站的隐私内容相关的关键词和/或特征格式,扫描爬取的全部内容,判断爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定指定网站有隐私内容暴露的网站上。另一方面,可以将爬取的全部内容返回给请求方,以便请求方核对指定网站的隐私内容是否暴露在网站上。
可见,上述实施过程使得网站管理者能够及时有效地获知指定网站的信息公开情况,进而根据该信息公开情况对网站进行调整和维护,避免网站隐私信息的泄漏。
图2示出了根据本发明一个实施例的一种检测网站隐私内容是否暴露的装置的示意图。如图2所示,该检测网站隐私内容是否暴露的装置200包括:
接收单元210,适于接收检测指定网站的隐私内容的请求。
获取单元220,适于通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从指定网站爬取的全部内容。
判断单元230,适于根据爬取的全部内容判断指定网站的隐私内容是否暴露在网站上。
返回单元240,适于将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
可见,对于一个指定网站来说,搜索引擎爬虫从指定网站爬取的全部内容反映了该指定网站暴露在互联网环境中的全部内容,通过分析该内容中是否存在隐私内容即可判断指定网站的隐私内容是否被暴露。图2所示的装置根据网站管理者的需求,为网站管理者提供了获知指定网站的信息公开情况的服务,通过搜索引擎爬虫爬取得到指定网站的全部内容,主动或者让网站管理者判断指定网站的隐私内容是否暴露在网站上,使得网站管理者能够及时有效地获知指定网站的信息公开情况,避免网站隐私信息的泄漏,符合网站管理需求。
在本发明的一个实施例中,图2所示装置的接收单元210,适于提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称。
返回单元240,适于提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
在本发明的一个实施例中,图2所示装置的接收单元210,适于在用户界面上提供隐私内容查看控件,当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
在本发明的一个实施例中,图2所示装置的获取单元220,进一步适于获取指定网站的本意公开内容;判断单元230,适于将爬取的全部内容与本意公开内容进行比对,如果爬取的全部内容比本意公开内容多,则确定指定网站有隐私内容暴露的网站上。
在本发明的另一个实施例中,图2所示装置的获取单元220,进一步适于获取与指定网站的隐私内容相关的关键词和/或特征格式;判断单元230,适于扫描爬取的全部内容,判断爬取的全部内容中是否包含关键词和/或特征格式,如果是则确定指定网站有隐私内容暴露的网站上。
图3示出了根据本发明另一个实施例的一种检测网站隐私内容是否暴露的装置的示意图。如图3所示,该检测网站隐私内容是否暴露的装置300包括:接收单元310、获取单元320、判断单元330、返回单元340和报警单元350。
报警单元350,适于当所述判断单元330判断出所述指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
其余各单元的功能与图2所示的各单元对应相同,在此不再赘述。
图4示出了根据本发明一个实施例的一种云监控系统的示意图。该云监控系统对运行在互联网数据中心IDC上的网络业务系统进行运维管理,如图5所示。
如图4所示,该云监控系统400包括检测网站隐私内容是否暴露的装置410,该检测网站隐私内容是否暴露的装置410与上文中图2或图3所示的实施例中的检测网站隐私内容是否暴露的装置200/300相同,在此不再赘述。
一种检测网站隐私内容是否暴露的装置和云监控系统的具体实施例在上文中已详细说明,在此不再赘述。
综上所述,对于一个网站管理者来说,获知其管理的网站的信息公开情况是十分重要的,网站管理者可以根据该信息公开情况对网站隐私暴露的现象及时加以调整和维护,保护网站隐私安全。对于一个指定网站来说,搜索引擎爬虫从指定网站爬取的全部内容反映了该指定网站暴露在互联网环境中的全部内容,通过分析该内容中是否存在隐私内容即可判断指定网站的隐私内容是否被暴露。本发明提供的技术方案根据网站管理者的需求,为网站管理者提供了获知指定网站的信息公开情况的服务,通过搜索引擎爬虫爬取得到指定网站的全部内容,主动或者让网站管理者判断指定网站的隐私内容是否暴露在网站上,使得网站管理者能够及时有效地获知指定网站的信息公开情况,避免网站隐私信息的泄漏,符合网站管理需求。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种检测网站隐私内容是否暴露的装置和云监控系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种检测网站隐私内容是否暴露的方法,其中,该方法包括:
接收检测指定网站的隐私内容的请求;
通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上,或者,将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
A2、如A1所述的方法,其中,
所述接收检测指定网站的隐私内容的请求包括:提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称。
以及将所述爬取的全部内容返回给请求方包括:提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
A3、如A1所述的方法,其中,所述接收检测指定网站的隐私内容的请求包括:
在用户界面上提供隐私内容查看控件;
当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
A4、如A1所述的方法,其中,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取所述指定网站的本意公开内容;
将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
A5、如A1所述的方法,其中,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取与所述指定网站的隐私内容相关的关键词和/或特征格式;
扫描所述爬取的全部内容,判断所述爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定所述指定网站有隐私内容暴露的网站上。
A6、如A1所述的方法,其中,该方法进一步包括:
当判断出所述指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
A7、如A1-A6中任一项所述的方法,其中,
上述步骤由对运行在互联网数据中心IDC上的网络业务系统进行运维管理的云监控系统执行。
本发明还公开了B8、一种检测网站隐私内容是否暴露的装置,其中,该装置包括:
接收单元,适于接收检测指定网站的隐私内容的请求;
获取单元,适于通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
判断单元,适于根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上;
返回单元,适于将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
B9、如B8所述的装置,其中,
所述接收单元,适于提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称。
所述返回单元,适于提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
B10、如B8所述的装置,其中,
所述接收单元,适于在用户界面上提供隐私内容查看控件,当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
B11、如B8所述的装置,其中,
所述获取单元,进一步适于获取所述指定网站的本意公开内容;
所述判断单元,适于将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
B12、如B8所述的装置,其中,
所述获取单元,进一步适于获取与所述指定网站的隐私内容相关的关键词和/或特征格式;
所述判断单元,适于扫描所述爬取的全部内容,判断所述爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定所述指定网站有隐私内容暴露的网站上。
B13、如B8所述的装置,其中,该装置进一步包括:
报警单元,适于当所述判断单元判断出所述指定网站的隐私内容暴露在网站上时,通过预设的方式发出报警。
本发明还公开了C14、一种云监控系统,其中,该云监控系统对运行在IDC上的网络业务系统进行运维管理,且该云监控系统包括如B8-B13中任一项所述的检测网站隐私内容是否暴露的装置。

Claims (10)

1.一种检测网站隐私内容是否暴露的方法,其中,该方法包括:
接收检测指定网站的隐私内容的请求;
通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上,或者,将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
2.如权利要求1所述的方法,其中,
所述接收检测指定网站的隐私内容的请求包括:提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称;
以及将所述爬取的全部内容返回给请求方包括:提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
3.如权利要求1所述的方法,其中,所述接收检测指定网站的隐私内容的请求包括:
在用户界面上提供隐私内容查看控件;
当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
4.如权利要求1所述的方法,其中,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取所述指定网站的本意公开内容;
将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
5.如权利要求1所述的方法,其中,所述根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上包括:
获取与所述指定网站的隐私内容相关的关键词和/或特征格式;
扫描所述爬取的全部内容,判断所述爬取的全部内容中是否包含所述关键词和/或特征格式,如果是则确定所述指定网站有隐私内容暴露的网站上。
6.一种检测网站隐私内容是否暴露的装置,其中,该装置包括:
接收单元,适于接收检测指定网站的隐私内容的请求;
获取单元,适于通过调用搜索引擎网站提供的应用程序接口API接口,获取搜索引擎爬虫从所述指定网站爬取的全部内容;
判断单元,适于根据所述爬取的全部内容判断所述指定网站的隐私内容是否暴露在网站上;
返回单元,适于将所述爬取的全部内容返回给请求方,以便请求方核对所述指定网站的隐私内容是否暴露在网站上。
7.如权利要求6所述的装置,其中,
所述接收单元,适于提供检测指定网站的隐私内容的请求输入接口,通过该输入接口接收用户输入的网站描述信息;所述网站描述信息为网站地址或网站名称;
所述返回单元,适于提供请求内容返回接口,通过该返回接口将所述爬取的全部内容返回给请求方。
8.如权利要求6所述的装置,其中,
所述接收单元,适于在用户界面上提供隐私内容查看控件,当登录用户触发该隐私内容查看控件时,确定接收到检测该登录用户对应的网站的隐私内容的请求。
9.如权利要求6所述的装置,其中,
所述获取单元,进一步适于获取所述指定网站的本意公开内容;
所述判断单元,适于将所述爬取的全部内容与所述本意公开内容进行比对,如果所述爬取的全部内容比所述本意公开内容多,则确定所述指定网站有隐私内容暴露的网站上。
10.一种云监控系统,其中,该云监控系统对运行在IDC上的网络业务系统进行运维管理,且该云监控系统包括如权利要求6-9中任一项所述的检测网站隐私内容是否暴露的装置。
CN201510290214.1A 2015-05-29 2015-05-29 检测网站隐私内容是否暴露的方法、装置和云监控系统 Pending CN104992113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510290214.1A CN104992113A (zh) 2015-05-29 2015-05-29 检测网站隐私内容是否暴露的方法、装置和云监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510290214.1A CN104992113A (zh) 2015-05-29 2015-05-29 检测网站隐私内容是否暴露的方法、装置和云监控系统

Publications (1)

Publication Number Publication Date
CN104992113A true CN104992113A (zh) 2015-10-21

Family

ID=54303926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510290214.1A Pending CN104992113A (zh) 2015-05-29 2015-05-29 检测网站隐私内容是否暴露的方法、装置和云监控系统

Country Status (1)

Country Link
CN (1) CN104992113A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657462A (zh) * 2018-12-06 2019-04-19 江苏满运软件科技有限公司 数据检测方法、系统、电子设备和存储介质
CN113326539A (zh) * 2021-06-23 2021-08-31 支付宝(杭州)信息技术有限公司 针对小程序进行隐私数据泄露检测的方法、装置及系统
FR3125346A1 (fr) * 2021-07-16 2023-01-20 Cybelangel Procédé de détermination d’un degré d’exposition de données

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510195A (zh) * 2008-02-15 2009-08-19 刘峰 基于爬虫技术的网站安全防护与测试诊断系统构造方法
CN103077107A (zh) * 2012-12-31 2013-05-01 Tcl集团股份有限公司 一种数据维护方法及系统
CN103310026A (zh) * 2013-07-08 2013-09-18 焦点科技股份有限公司 一种基于搜索引擎的轻量级通用网页主题爬虫方法
CN103414735A (zh) * 2012-10-12 2013-11-27 深圳市利谱信息技术有限公司 一种网站内容涉密检查系统
CN103685575A (zh) * 2014-01-06 2014-03-26 洪高颖 一种基于云架构的网站安全监控方法
CN104040934A (zh) * 2011-12-15 2014-09-10 英特尔公司 当被云服务操控时保护图像隐私

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510195A (zh) * 2008-02-15 2009-08-19 刘峰 基于爬虫技术的网站安全防护与测试诊断系统构造方法
CN104040934A (zh) * 2011-12-15 2014-09-10 英特尔公司 当被云服务操控时保护图像隐私
CN103414735A (zh) * 2012-10-12 2013-11-27 深圳市利谱信息技术有限公司 一种网站内容涉密检查系统
CN103077107A (zh) * 2012-12-31 2013-05-01 Tcl集团股份有限公司 一种数据维护方法及系统
CN103310026A (zh) * 2013-07-08 2013-09-18 焦点科技股份有限公司 一种基于搜索引擎的轻量级通用网页主题爬虫方法
CN103685575A (zh) * 2014-01-06 2014-03-26 洪高颖 一种基于云架构的网站安全监控方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657462A (zh) * 2018-12-06 2019-04-19 江苏满运软件科技有限公司 数据检测方法、系统、电子设备和存储介质
CN109657462B (zh) * 2018-12-06 2021-05-11 贵阳货车帮科技有限公司 数据检测方法、系统、电子设备和存储介质
CN113326539A (zh) * 2021-06-23 2021-08-31 支付宝(杭州)信息技术有限公司 针对小程序进行隐私数据泄露检测的方法、装置及系统
CN113326539B (zh) * 2021-06-23 2022-05-17 支付宝(杭州)信息技术有限公司 针对小程序进行隐私数据泄露检测的方法、装置及系统
FR3125346A1 (fr) * 2021-07-16 2023-01-20 Cybelangel Procédé de détermination d’un degré d’exposition de données

Similar Documents

Publication Publication Date Title
CN109716343B (zh) 威胁检测的企业图形方法
US20220232026A1 (en) Intrusion detection system enrichment based on system lifecycle
EP3731123B1 (en) Deception-based responses to security attacks
CN106101145B (zh) 一种网站漏洞检测方法及装置
CN102932370B (zh) 一种安全扫描方法、设备及系统
CN111400722B (zh) 扫描小程序的方法、装置、计算机设备和存储介质
CN104484259A (zh) 应用程序的流量监控方法、装置和移动终端
US8214897B2 (en) System and method for usage-based misinformation detection and response
CN111783096B (zh) 检测安全漏洞的方法和装置
CN107733706A (zh) 一种无代理的违规外联监测方法和系统
CN109922062B (zh) 源代码泄露监控方法及相关设备
CN103607385A (zh) 基于浏览器进行安全检测的方法和装置
US20180054456A1 (en) Website security tracking across a network
CN104219200A (zh) 一种防范dns缓存攻击的装置和方法
CN101656710A (zh) 主动审计系统及方法
CN106658568B (zh) 一种用于提供可用无线接入点信息的方法与设备
CN110059007B (zh) 系统漏洞扫描方法、装置、计算机设备及存储介质
CN105260660A (zh) 智能终端支付环境的监控方法、装置及系统
EP4107618A1 (en) Method and system for online user behavior management
CN104992113A (zh) 检测网站隐私内容是否暴露的方法、装置和云监控系统
EP4120111A1 (en) Data exfiltration detection
US20230291759A1 (en) Evaluating an it infrastructure's vulnerability to a network attack
CN110378120A (zh) 应用程序接口攻击检测方法、装置以及可读存储介质
US11356481B1 (en) Preventing phishing attempts of one-time passwords
CN107508838A (zh) 一种访问控制方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151021

RJ01 Rejection of invention patent application after publication