CN107451434A - 一种网页内容识别方法及系统 - Google Patents

一种网页内容识别方法及系统 Download PDF

Info

Publication number
CN107451434A
CN107451434A CN201710690756.7A CN201710690756A CN107451434A CN 107451434 A CN107451434 A CN 107451434A CN 201710690756 A CN201710690756 A CN 201710690756A CN 107451434 A CN107451434 A CN 107451434A
Authority
CN
China
Prior art keywords
webpage
bag
network
web
page contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710690756.7A
Other languages
English (en)
Inventor
赵廷江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710690756.7A priority Critical patent/CN107451434A/zh
Publication of CN107451434A publication Critical patent/CN107451434A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种网页内容识别方法及系统,通过预先对网页开发客户进行安全认证,并在创造网页时在网页的对应网址上加入特定符号,然后用户内也下载该特点符号,当用于需要识别网络内容时,预先判断该网络内容的网站是否安全,一旦安全,方可识别网络内容,最终从真正意义上解决了目前网络内容的安全性难以识别的问题,最终实现对网页内容进行安全识别,并将不必要的网页进行隔离,最终提高网络安全。

Description

一种网页内容识别方法及系统
技术领域
本发明涉及一种互联网技术领域,特别是一种网页内容识别方法及系统。
背景技术
作为信息的重要传播和承载媒介,网络正已惊人的速度不断的发展扩大。网络在拥有增长速度、信息量庞大量大特点的同时也拥者动态性、开放性、互动性、匿名性、异性等诸多特点,造成了至今没有一个同一的网络监管机构对其上传播的信息进行监管的现状,致使网络上充斥着黄、毒、暴力、邪教等各类敏感网页,因此,研究、开发与网络相适应的自动识别与过滤技术,对网络上日益泛滥的色情图像/视频等敏感信息进行有效的技术检测和过滤已经成为网络信息安全中的一项重要研究课题。
当人们用搜索互联网页时,经常会跳出一些不良的网页,一旦这些网页进入电脑后,导致浪费大量存储资源,容易使电脑系统变卡,且很容易点击其内容,最终导致系统奔溃或侵入我们的电脑,最终降低电脑的安全性,因此如何对网页内容进行安全识别,并将不必要的网页进行隔离,最终提高网络安全尤为重要。
发明内容
本发明的目的是为了解决上述现有技术的不足而提供一种网页内容识别方法及系统。通过预先对网页开发客户进行安全认证,并在创造网页时在网页的对应网址上加入特定符号,然后用户内也下载该特点符号,当用于需要识别网络内容时,预先判断该网络内容的网站是否安全,一旦安全,方可识别网络内容,最终从真正意义上解决了目前网络内容的安全性难以识别的问题,最终实现对网页内容进行安全识别,并将不必要的网页进行隔离,最终提高网络安全。
为了实现上述目的,本发明所设计的一种网页内容识别方法,其具体包括以下步骤:
a)预先生成两个能够下载的网络数据包,该两个网络数据包内均包含有一个特定符号;且其中一个网络数据包作为供网络内容设计的人员使用的创造包,另一个网络数据包作为供网络使用者使用的使用包,其中创造包需要客户注册,然后才能看到里面的特定符号,使用包内的特定符号是加密处理;
b)使用者在对应的能够连接网络的终端中下载使用包,创造者在对应的能够连接网络的终端中下载创造包;并注册成为安全网页开发客户,生成注册账号和密码;
c)根据注册的账号和密码登入,即可获取下载在手机终端中创造包内的特定符号;
d)安全网页开发客户在开发网页以及网页内容时,将创造包内的特定符号添加到网页网址内;说明此网页内容为安全网页内容;
e)使用者需要打开对应的网页时,系统自动获取该网页的全部网址并将下载过来的使用包内的特定符号与该网页上的特定符号进行对比,若匹配,说明该网络内容为安全,此时将该网页内的特定符号删除,立即跳转到该网页对应的内容进行快速的识别;若识别不匹配,立即显示,该网页内容为不安全,禁止打开。
进一步,在步骤d中,所述特定的符号加入到网页网址的最后。
进一步,在步骤b中,在创建成为安全网页开发客户时,根据创建的账号和密码自动生成二维码,且将对应的账号、二维码发送给安装有对应创造包的移动终端,在步骤c中,根据创建的账号、密码以及对应的二维码与移动终端进行比较,一旦三者均相同,此时立即将创造包内的特点符号供安全网页开发客户使用。
本发明还公开了一种网页内容识别系统,包括采用所述的一种网页内容识别方法,其还包括以下模块:
用于将下载的数据以及发送过来的数据进行储存的数据储存库,
用于获取网络网址的获取模块,
用于将数据库内的数据进行对比的对比模块,
用于将安全网址内的特定符号进行删除的去除模块,
其中所述获取模块、数据储存厍分别与对比模块连接,且所述对比模块与去除模块连接,通过获取模块获取识别网络地址,然后发送给对应的对比模块,对比模块将对应的数据库内的特点符号与获取的网址进行比较,一旦比较成功,立即将网站发送给去除模块,由去除模块去除该网址内的特点符号,最后由对应游览器打开,即可识别网络内容。
进一步,还包括二维码对比模块,用于将正确的二维码与数据储存库内的二维码进行对比,确定客户是否为安全网页开发客户。
本发明得到的一种网页内容识别方法及系统,通过预先对网页开发客户进行安全认证,并在创造网页时在网页的对应网址上加入特定符号,然后用户内也下载该特点符号,当用于需要识别网络内容时,预先判断该网络内容的网站是否安全,一旦安全,方可识别网络内容,最终从真正意义上解决了目前网络内容的安全性难以识别的问题。
附图说明
图1是本实施例中一种网页内容识别方法的流程示意图;
图2是本实施例中一种网页内容识别的结构示意图。
附图标记中:1.数据储存库;2.获取模块3.对比模块;4.去除模块;5.二维码对比模块。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
实施例:
如图1、图2所示,本实施例提供的一种网页内容识别方法,其具体包括以下步骤:
a)预先生成两个能够下载的网络数据包,该两个网络数据包内均包含有一个特定符号;且其中一个网络数据包作为供网络内容设计的人员使用的创造包,另一个网络数据包作为供网络使用者使用的使用包,其中创造包需要客户注册,然后才能看到里面的特定符号,使用包内的特定符号是加密处理;
b)使用者在对应的能够连接网络的终端中下载使用包,创造者在对应的能够连接网络的终端中下载创造包;并注册成为安全网页开发客户,生成注册账号和密码;
c)根据注册的账号和密码登入即可获取下载在手机终端中创造包内的特定符号;
d)安全网页开发客户在开发网页以及网页内容时,将创造包内的特定符号添加到网页网址内;说明此网页内容为安全网页内容;
e)使用者需要打开对应的网页时,系统自动获取该网页的全部网址并将下载过来的使用包内的特定符号与该网页上的特定符号进行对比,若匹配,说明该网络内容为安全,此时将该网页内的特定符号删除,立即跳转到该网页对应的内容进行快速的识别;若识别不匹配,立即显示,该网页内容为不安全,禁止打开。
进一步,在步骤d中,所述特定的符号加入到网页网址的最后。
进一步,在步骤b中,在创建成为安全网页开发客户时,根据创建的账号和密码自动生成二维码,且将对应的账号、二维码发送给安装有对应创造包的移动终端,在步骤c中,根据创建的账号、密码以及对应的二维码与移动终端进行比较,一旦三者均相同,此时立即将创造包内的特点符号供安全网页开发客户使用。
本实施例还公开了一种网页内容识别系统,包括采用所述的一种网页内容识别方法,其还包括以下模块:
用于将下载的数据以及发送过来的数据进行储存的数据储存库1,
用于获取网络网址的获取模块2,
用于将数据库内的数据进行对比的对比模块3,
用于将安全网址内的特定符号进行删除的去除模块4,
其中所述获取模块2、数据储存库1分别与对比模块3连接,且所述对比模块3与去除模块4连接,通过获取模块2获取识别网络地址,然后发送给对应的对比模块3,对比模块3将对应的数据库内的特点符号与获取的网址进行比较,一旦比较成功,立即将网站发送给去除模块4,由去除模块4去除该网址内的特点符号,最后由对应游览器打开,即可识别网络内容。
进一步,还包括二维码对比模块5,用于将正确的二维码与数据储存库1内的二维码进行对比,确定客户是否为安全网页开发客户。
通过预先对网页开发客户进行安全认证,并在创造网页时在网页的对应网址上加入特定符号,然后用户内也下载该特点符号,当用于需要识别网络内容时,预先判断该网络内容的网站是否安全,一旦安全,方可识别网络内容,最终从真正意义上解决了目前网络内容的安全性难以识别的问题,最终实现对网页内容进行安全识别,并将不必要的网页进行隔离,最终提高网络安全。

Claims (5)

1.一种网页内容识别方法,其特征在于,具体包括以下步骤:
a)预先生成两个能够下载的网络数据包,该两个网络数据包内均包含有一个特定符号;且其中一个网络数据包作为供网络内容设计的人员使用的创造包,另一个网络数据包作为供网络使用者使用的使用包,其中创造包需要客户注册,然后才能看到里面的特定符号,使用包内的特定符号是加密处理;
b)使用者在对应的能够连接网络的终端中下载使用包,创造者在对应的能够连接网络的终端中下载创造包;并注册成为安全网页开发客户,生成注册账号和密码;
c)根据注册的账号和密码登入,即可获取下载在手机终端中创造包内的特定符号;
d)安全网页开发客户在开发网页以及网页内容时,将创造包内的特定符号添加到网页网址内;说明此网页内容为安全网页内容;
e)使用者需要打开对应的网页时,系统自动获取该网页的全部网址并将下载过来的使用包内的特定符号与该网页上的特定符号进行对比,若匹配,说明该网络内容为安全,此时将该网页内的特定符号删除,立即跳转到该网页对应的内容进行快速的识别;若识别不匹配,立即显示,该网页内容为不安全,禁止打开。
2.根据权利要求1所述的一种网页内容识别方法,其特征在于,在步骤d中,所述特定的符号加入到网页网址的最后。
3.根据权利要求1或2所述的一种网页内容识别方法,其特征在于,在步骤b中,在创建成为安全网页开发客户时,根据创建的账号和密码自动生成二维码,且将对应的账号、二维码发送给安装有对应创造包的移动终端,在步骤c中,根据创建的账号、密码以及对应的二维码与移动终端进行比较,一旦三者均相同,此时立即将创造包内的特点符号供安全网页开发客户使用。
4.一种网页内容识别系统,包括采用上述权利要求1-3中任意一项权利要求所述的一种网页内容识别方法,其特征在于,
用于将下载的数据以及发送过来的数据进行储存的数据储存库(1),
用于获取网络网址的获取模块(2),
用于将数据库内的数据进行对比的对比模块(3),
用于将安全网址内的特定符号进行删除的去除模块(4),
其中所述获取模块(2)、数据储存库(1)分别与对比模块(3)连接,且所述对比模块(3)与去除模块(4)连接,通过获取模块(2)获取识别网络地址,然后发送给对应的对比模块(3),对比模块(3)将对应的数据库内的特点符号与获取的网址进行比较,一旦比较成功,立即将网站发送给去除模块(4),由去除模块(4)去除该网址内的特点符号,最后由对应游览器打开,即可识别网络内容。
5.根据权利要求4所述的一种网页内容识别系统,其特征在于,还包括二维码对比模块(5),用于将正确的二维码与数据储存库(1)内的二维码进行对比,确定客户是否为安全网页开发客户。
CN201710690756.7A 2017-08-14 2017-08-14 一种网页内容识别方法及系统 Pending CN107451434A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710690756.7A CN107451434A (zh) 2017-08-14 2017-08-14 一种网页内容识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710690756.7A CN107451434A (zh) 2017-08-14 2017-08-14 一种网页内容识别方法及系统

Publications (1)

Publication Number Publication Date
CN107451434A true CN107451434A (zh) 2017-12-08

Family

ID=60491101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710690756.7A Pending CN107451434A (zh) 2017-08-14 2017-08-14 一种网页内容识别方法及系统

Country Status (1)

Country Link
CN (1) CN107451434A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110198A (zh) * 2009-12-28 2011-06-29 北京安码科技有限公司 一种网页防伪的方法
CN103577735A (zh) * 2013-10-24 2014-02-12 广东欧珀移动通信有限公司 一种多用户快速登录与切换的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110198A (zh) * 2009-12-28 2011-06-29 北京安码科技有限公司 一种网页防伪的方法
CN103577735A (zh) * 2013-10-24 2014-02-12 广东欧珀移动通信有限公司 一种多用户快速登录与切换的方法及系统

Similar Documents

Publication Publication Date Title
US10771963B2 (en) Method and browser for browsing web page, and storage medium
CN104462152B (zh) 一种网页的识别方法及装置
US8856937B1 (en) Methods and systems for identifying fraudulent websites
Hara et al. Visual similarity-based phishing detection without victim site information
CN107944025A (zh) 信息推送方法和装置
US8448260B1 (en) Electronic clipboard protection
WO2017076210A1 (zh) 一种用于应用信息的风险管理的方法与设备
CN104504335A (zh) 基于页面特征和url特征的钓鱼app检测方法及系统
CN104980404B (zh) 保护账号信息安全的方法和系统
WO2013097742A1 (zh) 识别被篡改网页以及识别被劫持网址的方法及装置
CN104486140A (zh) 一种检测网页被劫持的装置及其检测方法
US9973525B1 (en) Systems and methods for determining the risk of information leaks from cloud-based services
CN105205356B (zh) 一种app应用重打包检测方法
CN103268449A (zh) 一种手机恶意代码的高速检测方法和系统
CN105701198B (zh) 页面验证方法和装置
CN107656910A (zh) 用于生成表单的方法和装置
CN103984747B (zh) 屏幕信息处理方法和装置
Natatsuka et al. Poster: A first look at the privacy risks of voice assistant apps
CN108920909B (zh) 仿冒移动应用程序判别方法及系统
CN109284590A (zh) 访问行为安全防护的方法、设备、存储介质及装置
CN107431693A (zh) 消息发送方真实性验证
CN105740453B (zh) 信息推送方法和装置
CN108256078A (zh) 信息获取方法和装置
CN105354506B (zh) 隐藏文件的方法和装置
CN103793499B (zh) 一种利用浏览器地址栏获取应用信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171208