CN106326734A - 一种检测敏感信息的方法和设备 - Google Patents

一种检测敏感信息的方法和设备 Download PDF

Info

Publication number
CN106326734A
CN106326734A CN201510379284.4A CN201510379284A CN106326734A CN 106326734 A CN106326734 A CN 106326734A CN 201510379284 A CN201510379284 A CN 201510379284A CN 106326734 A CN106326734 A CN 106326734A
Authority
CN
China
Prior art keywords
sensitive information
webpage
information
terminal unit
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510379284.4A
Other languages
English (en)
Inventor
赵勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510379284.4A priority Critical patent/CN106326734A/zh
Publication of CN106326734A publication Critical patent/CN106326734A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/554Detecting local intrusion or implementing counter-measures involving event detection and direct action
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种检测敏感信息的方法,所述方法包括:终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页;所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。本申请通过终端设备检测自身访问的页面,将检测结果反馈给所述服务器,以使所述服务器对敏感信息进行清洗,不仅降低了对服务器性能的要求,还降低了运营成本。

Description

一种检测敏感信息的方法和设备
技术领域
本申请涉及计算机领域,特别是涉及一种检测敏感信息的方法和设备。
背景技术
对于用户的一些敏感信息,例如银行卡号,证件号,联系信息等,不能直接全部显示在网页上,以防止信息泄露导致后续用户被钓鱼,诈骗,威胁用户的账户资金安全,在现有技术中对于整个网站上是否存在这种不符合规范的情况的解决方法如图1所示,用户终端在访问某网站时,所述服务器从数据库中获取相应的数据返回给用户,在返回的过程中对所有的数据进行检测,查看是否包含敏感信息,然后进行记录。
在实现本申请的过程中,发明人发现现有技术至少存在如下问题:
因为对于敏感信息监测的过程是发生在服务器端,且数据监测过程中数据匹配的性能消耗很大,返回的数据量大或大量用户同时访问同一个网站的情况下,会造成明显的延迟,同时对服务器性能的要求也越来越高。随着业务量的不断增长,只能通过增加服务器的方式保障业务的正常运行,大幅增加运营成本。
发明内容
本申请的目的在于提供一种检测敏感信息的方法和设备,本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
一种检测敏感信息的方法,其特征在于,所述方法包括:
终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页;
所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。
所述终端设备根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测,具体为:
所述终端设备调用所述网页上的直译式脚本语言JS,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述方法还包括:
当所述终端设备根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述终端设备根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
一种终端设备,其特征在于,所述设备包括:
接收模块,用于接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
加载模块,用于通过自身的浏览器对所述数据信息进行加载生成相应的网页;
检测模块,用于根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块,具体用于:
调用所述网页上的JS脚本,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块,还具体用于:
当所述检测模块根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述检测模块根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
附图说明
图1为本申请现有技术中中的一种检测敏感信息的方法流程图;
图2为本申请实施例中的一种检测敏感信息的方法流程图;
图3位本申请实施例中的一种检测敏感信息的流程示意图;
图4为本申请实施例中的一种终端设备的结构意图。
具体实施方式
本申请通过终端设备检测自身获取的网页中是否存在敏感信息,来达到检测相应网站中是否存在敏感信息的目的,从而避免用户信息泄露的目的。
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图2所示,为本申请实施例中一种检测敏感信息的方法,所述方法包括:
步骤201,终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息。
终端设备在访问某个网页时需要向该网页所对应的服务器发送访问请求,所述服务器根据所述访问请求在其数据库中查找相应的数据信息,并将所述数据信息反馈给所述终端设备。
步骤202,所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页。
步骤203,所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。
所述终端设备根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测,具体为:
所述终端设备调用所述网页上的直译式脚本语言JS,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
具体的,终端设备的浏览器在接受到所述服务器返回的相应网页的数据信息并对所述数据信息加载完成后,调用网页上的JS,使网页上的JS监控脚本开始运行,其中,在JS监控脚本中包含敏感信息检测的规则库,例如:身份证号规则、银行卡号规则、手机号规则等有关用户信息的规则,所述JS根据敏感信息检测的规则库遍历所述网页对应的HTML源码来对检测所述网页中是否存在用户的敏感信息。
在遍历所述网页对应的HTML源码后,所述方法还包括:
当所述终端设备根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述终端设备根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
具体的,服务器对敏感信息主要通过数据校验和去重工作进行数据清洗,并对接受到的敏感信息相应的信息存储。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
服务器可以根据敏感信息相应的信息来判断所述敏感信息出现的具体网页的具体位置,以及是何种类型的敏感信息。以使在对敏感信息进行清洗时能够快速准确的找到其位置和确定清洗方案。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
网页中的所有信息都有其对应的代码,所述代码可以表示相应信息的内容、位置等,所述信息的在网页中的位置可以根据其位置的前后特定个数的代码片段来表示,例如,敏感信息所在网页位置前后各20个字符的代码片段,当然据使用多少个字符代码片段可以根据实际情况确定。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
为了进一步阐述本申请的技术思想,现结合具体的应用场景,对本申请的技术方案进行说明,在实际应用中,具体场景的变化并不会影响本申请的保护范围。
在万维网上的一个超媒体文档称之为一个页面,作为一个组织或个人在万维网上开始点的页面称为主页Homepage,或首页,主页中通常包括有指向其他相关页面或其他节点的指针(超级链接)。在逻辑上将视为一个整体的一系列页面的有机集合称为网站(Website或Site)。
HTML源码时一个网页的重要组成部分,一个网页有很多信息,一个网页中的信息是根据HTML源码来进行展示的,HTML源码能够描述相应信息的文字和图片,如:文字如何处理,图片如何安排,图片如何显示等,并且是根据相应信息的出现顺序进行编码的。
如图3所示,终端设备向某个网站的服务器发起访问请求,请求访问该网站下的某个页面,所述服务器根据接收的访问请求查找所述访问请求所对应的网页的数据信息,所述服务器将请求访问的页面的数据信息发送给所述终端设备,所述终端设备通过自身携带的浏览器对所述数据信息进行加载得到相应的页面,所述终端设备通过浏览器调用页面中的JS检测脚本根据JS检测脚本中包含的敏感信息检测的规则库遍历所述页面所对应的HTML源码,检测所述页面是否存在敏感信息。
例如:对当前访问页面中是否存在某个用户的身份证号的检测,所述终端设备调用所述页面中的JS检测脚本根据身份证号规则,如:身份证号的位数、身份证号中的数字排布的规律,以及身份证号制定的规则等遍历当前访问页面的HTML源码,来判断当前访问页面中是否存在某个用户的身份证号。
如果不存在,所述终端设备停止对当前页面的检测;
如果存在,所述终端设备将检测到的敏感信息所在页面的地址、敏感信息的类型和敏感信息所在位置前后各20个字符的代码片段反馈给服务器。
服务器的根据所述敏感信息的所在页面的地址、敏感信息的类型和敏感信息所在位置前后各20个字符的代码片段确定所述敏感信息出现的具体位置,即所述敏感信息出现的具体页面以及出现在具体页面中具体位置,和采用何种类型的清洗规则对所述敏感信息进行清洗,进一步的,根据身份证号的清洗规则对网页中的身份证号进行清洗。
所述服务器对清洗完后的所述页面的数据信息进行保存,以使其他终端设备在访问该网页时保证使终端设备加载后的页面中不会再次出现用户的敏感信息,从而保证了用户敏感信息的安全。
基于与上述方法同样的申请构思,本申请还提出了一种终端设备,如图4所述,该设备包括:
接收模块41,用于接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
加载模块42,用于通过自身的浏览器对所述数据信息进行加载生成相应的网页;
检测模块43,用于根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块43,具体用于:
调用所述网页上的JS脚本,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块43,还具体用于:
当所述检测模块根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述检测模块根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
本领域技术人员可以理解实施例中的设备中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式提现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本申请的保护范围。
以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种检测敏感信息的方法,其特征在于,所述方法包括:
终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页;
所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。
2.如权利要求1所述方法,其特征在于,所述终端设备根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测,具体为:
所述终端设备调用所述网页上的直译式脚本语言JS,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
3.如权利要求1所述方法,其特征在于,所述方法还包括:
当所述终端设备根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述终端设备根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
4.如权利要求3所述方法,其特征在于,所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
5.如权利要求4所述方法,其特征在于,所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
6.一种终端设备,其特征在于,所述设备包括:
接收模块,用于接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
加载模块,用于通过自身的浏览器对所述数据信息进行加载生成相应的网页;
检测模块,用于根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
7.如权利要求6所述设备,其特征在于,所述检测模块,具体用于:
调用所述网页上的JS脚本,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
8.如权利要求6所述设备,其特征在于,所述检测模块,还具体用于:
当所述检测模块根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述检测模块根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
9.如权利要求8所述设备,其特征在于,所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
10.如权利要求9所述设备,其特征在于,所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
CN201510379284.4A 2015-06-30 2015-06-30 一种检测敏感信息的方法和设备 Pending CN106326734A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510379284.4A CN106326734A (zh) 2015-06-30 2015-06-30 一种检测敏感信息的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510379284.4A CN106326734A (zh) 2015-06-30 2015-06-30 一种检测敏感信息的方法和设备

Publications (1)

Publication Number Publication Date
CN106326734A true CN106326734A (zh) 2017-01-11

Family

ID=57726704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510379284.4A Pending CN106326734A (zh) 2015-06-30 2015-06-30 一种检测敏感信息的方法和设备

Country Status (1)

Country Link
CN (1) CN106326734A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790271A (zh) * 2017-02-16 2017-05-31 济南浪潮高新科技投资发展有限公司 一种敏感数据的检测方法、装置、可读介质及存储控制器
CN107392028A (zh) * 2017-07-21 2017-11-24 上海携程商务有限公司 敏感信息的检测方法及其检测装置、存储介质、电子设备
CN107579976A (zh) * 2017-09-06 2018-01-12 杭州安恒信息技术有限公司 自定义检测网站敏感信息的方法及装置
CN107908959A (zh) * 2017-11-10 2018-04-13 北京知道创宇信息技术有限公司 网站信息检测方法、装置、电子设备及存储介质
CN110506271A (zh) * 2017-03-23 2019-11-26 微软技术许可有限责任公司 针对隐私敏感用户内容的可配置注释
CN110968822A (zh) * 2018-09-30 2020-04-07 阿里巴巴集团控股有限公司 页面检测方法、装置、电子设备和存储介质
CN111353116A (zh) * 2020-02-28 2020-06-30 深圳市意盛科技有限公司 内容检测方法、系统及设备、客户端设备和存储介质
CN112052364A (zh) * 2020-09-27 2020-12-08 深圳前海微众银行股份有限公司 敏感信息检测方法、装置、设备与计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915294B1 (en) * 2000-08-18 2005-07-05 Firstrain, Inc. Method and apparatus for searching network resources
CN101656710A (zh) * 2008-08-21 2010-02-24 中联绿盟信息技术(北京)有限公司 主动审计系统及方法
CN102402613A (zh) * 2011-12-20 2012-04-04 上海电机学院 网页文本信息过滤系统及方法
CN103605925A (zh) * 2013-11-29 2014-02-26 北京奇虎科技有限公司 一种网页篡改的检测方法及装置
CN104378283A (zh) * 2014-11-21 2015-02-25 国家电网公司 一种基于客户端/服务器模式的敏感邮件过滤系统及方法
CN104704485A (zh) * 2012-07-19 2015-06-10 格兰斯电讯网络有限公司 协同浏览与其他形式的信息共享的集成

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915294B1 (en) * 2000-08-18 2005-07-05 Firstrain, Inc. Method and apparatus for searching network resources
CN101656710A (zh) * 2008-08-21 2010-02-24 中联绿盟信息技术(北京)有限公司 主动审计系统及方法
CN102402613A (zh) * 2011-12-20 2012-04-04 上海电机学院 网页文本信息过滤系统及方法
CN104704485A (zh) * 2012-07-19 2015-06-10 格兰斯电讯网络有限公司 协同浏览与其他形式的信息共享的集成
CN103605925A (zh) * 2013-11-29 2014-02-26 北京奇虎科技有限公司 一种网页篡改的检测方法及装置
CN104378283A (zh) * 2014-11-21 2015-02-25 国家电网公司 一种基于客户端/服务器模式的敏感邮件过滤系统及方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790271A (zh) * 2017-02-16 2017-05-31 济南浪潮高新科技投资发展有限公司 一种敏感数据的检测方法、装置、可读介质及存储控制器
CN110506271A (zh) * 2017-03-23 2019-11-26 微软技术许可有限责任公司 针对隐私敏感用户内容的可配置注释
CN110506271B (zh) * 2017-03-23 2023-09-29 微软技术许可有限责任公司 针对隐私敏感用户内容的可配置注释
CN107392028A (zh) * 2017-07-21 2017-11-24 上海携程商务有限公司 敏感信息的检测方法及其检测装置、存储介质、电子设备
CN107579976A (zh) * 2017-09-06 2018-01-12 杭州安恒信息技术有限公司 自定义检测网站敏感信息的方法及装置
CN107908959A (zh) * 2017-11-10 2018-04-13 北京知道创宇信息技术有限公司 网站信息检测方法、装置、电子设备及存储介质
CN107908959B (zh) * 2017-11-10 2020-02-14 北京知道创宇信息技术股份有限公司 网站信息检测方法、装置、电子设备及存储介质
CN110968822A (zh) * 2018-09-30 2020-04-07 阿里巴巴集团控股有限公司 页面检测方法、装置、电子设备和存储介质
CN110968822B (zh) * 2018-09-30 2023-04-18 阿里巴巴集团控股有限公司 页面检测方法、装置、电子设备和存储介质
CN111353116A (zh) * 2020-02-28 2020-06-30 深圳市意盛科技有限公司 内容检测方法、系统及设备、客户端设备和存储介质
CN111353116B (zh) * 2020-02-28 2021-06-01 深圳市意盛科技有限公司 内容检测方法、系统及设备、客户端设备和存储介质
CN112052364A (zh) * 2020-09-27 2020-12-08 深圳前海微众银行股份有限公司 敏感信息检测方法、装置、设备与计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN106326734A (zh) 一种检测敏感信息的方法和设备
CN102663135B (zh) 用于嵌入式浏览器的图形化书签实现方法、装置及终端
US20110320414A1 (en) Method, system and computer-readable storage medium for detecting trap of web-based perpetual calendar and building retrieval database using the same
US9514113B1 (en) Methods for automatic footnote generation
EP2941724A1 (en) Method and apparatus for generating webpage content
CN102664925B (zh) 一种展现搜索结果的方法及装置
US20150287047A1 (en) Extracting Information from Chain-Store Websites
US7962523B2 (en) System and method for detecting templates of a website using hyperlink analysis
CN103971244A (zh) 一种商品信息的发布与浏览方法、装置及系统
CN103777980A (zh) 一种加载网站点评信息的方法和浏览器
CN103246746A (zh) 一种信息搜索方法、装置和系统
WO2021042508A1 (zh) 网页生成方法、装置、计算机设备和存储介质
CN103177096B (zh) 基于文本属性的页面元素定位方法及设备
CN105260469B (zh) 一种处理网站地图的方法、装置及设备
CN106603490A (zh) 一种钓鱼网站的检测方法和系统
CN101739412A (zh) 用于智能卡的网页安全评估装置和方法
CN103365961A (zh) 一种面向精准搜索的网站结构化标注方法和系统
CN105930385A (zh) 一种数据爬取方法及系统
Prabha et al. Comparative analysis of different page ranking algorithms
CN105306462A (zh) 网页链接检测方法及装置
CN106611029A (zh) 提高网站站内搜索效率的方法和装置
US8838602B1 (en) Systems and methods for web page grouping based on URLs
KR102214990B1 (ko) 북마크관리 및 정보검색 서비스 제공시스템 및 이를 이용한 북마크관리 및 정보검색 서비스 제공방법
CN103955548B (zh) 一种网页渲染方法及装置
KR20120090131A (ko) 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111