CN104035999B - 基于家长个性化推荐管控的安全网络浏览系统 - Google Patents

基于家长个性化推荐管控的安全网络浏览系统 Download PDF

Info

Publication number
CN104035999B
CN104035999B CN201410263662.8A CN201410263662A CN104035999B CN 104035999 B CN104035999 B CN 104035999B CN 201410263662 A CN201410263662 A CN 201410263662A CN 104035999 B CN104035999 B CN 104035999B
Authority
CN
China
Prior art keywords
list
parent
module
address
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410263662.8A
Other languages
English (en)
Other versions
CN104035999A (zh
Inventor
赵雪美
张琨
郭林锋
王羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201410263662.8A priority Critical patent/CN104035999B/zh
Publication of CN104035999A publication Critical patent/CN104035999A/zh
Application granted granted Critical
Publication of CN104035999B publication Critical patent/CN104035999B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统,网络浏览模块用于显示家长所指定的主题相关信息,家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,网络过滤系统模块包括查询模块、文本分类模块和结果处理模块。家长可以利用系统给出的主题选项进行直观选择,并在显示模块按家长指定的主题分类搜索到相关信息,按类别分类醒目的显示出来;对孩子浏览的网页,由网络内容过滤模块进行过滤,使孩子能访问安全网页。

Description

基于家长个性化推荐管控的安全网络浏览系统
技术领域
本发明涉及网络浏览技术领域,具体而言涉及一种基于家长个性化推荐管控的安全网络浏览系统。
背景技术
针对当前复杂的网络内容,各种信息扑面而来,由于现在的儿童接触网络比较早,在浏览网页时若不能很好的选择网页内容,会严重影响他们的认知及成长,这给家长们带来很大的烦恼。而当前的儿童浏览器存在家长管控方式受限,家长本身并不知道有哪些网站可以访问并且对各网站的地址也不熟悉,所以通过网站推荐的地址会使得家长感到束手无策,这样不能较好地控制孩子的浏览行为。
对于过滤网络的内容,目前大多数采用以下几种方法:基于分级标签的监管方法、基于URL过滤的方法及基于关键词过滤的方法。基于分级标签的监管方法有效的先决条件是信息发布者具有良好的自律性;基于URL过滤的方法有效的先决条件是预先知道含有不安全信息的网址;基于关键词过滤的方法没有考虑整个文本信息的主题含义,通常效果不是很理想。当前的基于内容的过滤系统缺乏反馈机制,不能很好的适应家长的定制需求。
发明内容
针对现有技术的家长管控系统中,家长指定网站过于依赖家长本身的知识储备的缺陷,本发明目的在于提供一种基于家长个性化推荐管控的安全网络浏览系统,家长可以利用系统给出的主题选项进行直观选择,并在显示模块按家长指定的主题分类搜索到相关信息,按类别分类醒目的显示出来;对孩子浏览的网页,由网络内容过滤模块进行过滤,使孩子能访问安全网页。
本发明的上述目的通过独立权利要求的技术特征实现,从属权利要求以另选或有利的方式发展独立权利要求的技术特征。
为达成上述目的,本发明所采用的技术方案如下:
一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统,其中:
所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成;
所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址;
所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块,其中:
所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页;如果属于灰名单地址列表,则禁止访问;
所述文本分类模块用于进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类;
所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
进一步的实施例中,所述文本分类模块按照下述方式进行文本分类处理:
首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维;
然后,利用VSM进行文本表示,再计算TF-IDF权值,
最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
进一步的实施例中,所述黑、白、灰名单地址列表根据输入字符和匹配结果自动更新。
由以上本发明的技术方案可知,本发明的有益效果在于:针对当前网络化时代,各种网络内容铺天盖地而来,其中包括大量不健康的网络内容,严重影响了儿童的身心健康,针对这个问题本发明采用家长可管控的安全浏览系统;当前用于儿童浏览网页的系统缺乏引导性的功能,使得家长很难控制需要访问的网页主题,针对这个问题本发明采用具有推荐主题的家长管控方式,系统事先已经将整个网络内容分成几个大的主题,家长只需从这些主题中做出选择即可;当前的系统过滤精度不够高、速度不够快,针对这个问题本发明所采用的系统事先将家长指定的主题分类存储,将网址加入白名单地址列表,该主题下的网页内容是访问频率比较高的,这类信息可以直接利用网址查询,查询不到的可以利用网络内容过滤系统进行分类,将属于指定主题的网址加入白名单列表,将属于禁止主题的网址加入黑名单地址列表,否则将网址加入灰名单地址列表以供家长审核,若审核通过,则将网页地址移入白名单地址列表,否则将网页地址移入黑名单地址列表。运用该系统即方便又快捷。
附图说明
图1为本发明一实施方式基于家长个性化推荐管控的安全网络浏览系统的原理框图。
图2为图1基于家长个性化推荐管控的安全网络浏览系统的系统处理过程示意图。
图3为图1实施例中内容过滤系统的原理框图。
图4为图1实施例中文本分类模块的原理框图。
图5为图1实施例中结果处理模块的处理示意图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
图1所示为本发明一实施方式基于家长个性化推荐管控的安全网络浏览系统的原理框图,其中,一种基于家长个性化推荐管控的安全网络浏览系统,包括网络浏览模块、家长管控模块以及内容过滤系统。
所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成。
如图1所示,所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址。
如图3所示,所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块。
所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页;如果属于灰名单地址列表,则禁止访问。
如果在黑、白、灰名单地址列表中没有查询到,即该输入字符的前缀和后缀匹配在三个地址列表中查找不存在,则使用HTTP协议下的文本传输协议捕获网页文本信息。
所述文本分类模块用于对前述捕获的文本信息进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类。
作为优选的实施方式,如图4所示,前述文本分类模块按照下述方式进行文本分类处理:
首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维;
然后,利用VSM进行文本表示,再计算TF-IDF权值,
最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
本实施例中,在LSI降维的基础上,再用GA进行优化降维,LSI和GA相结合不仅可以大大降低文本空间的维数,而且也进一步提高了分类的精度。
所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,结合图5所示,判别模块判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
如图2所示为系统处理过程示意,结合图1所示,下面具体介绍前述实施例的基于家长个性化推荐管控的安全网络浏览系统的处理过程,该处理过程包括以下步骤:
步骤1,首先家长通过口令密码进入管控系统进入家长管控模块,家长可以实现指定允许孩子访问的主题,可以指定不允许孩子访问的主题,可以指定允许访问的具体的网页地址,也可以指定禁止访问的网页地址,还可以审查灰名单列表中的网页是否被允许,灰名单列表中存储着系统认为和家长指定的主题相关的网页地址信息。系统捕获家长的指定允许访问的主题信息,系统会按主题搜索到相关信息,分类显示在浏览首页,供浏览使用。
步骤2,从安全浏览模块的地址输入框输入网址。
步骤3,网络过滤模块捕获输入的字符.
步骤4,按照前缀和后缀匹配的原则查找存储在高速闪存中的黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览该网页,地址会被送到服务器,服务器送回相对应的网页内容,访问结束。如果属于灰名单地址列表,则禁止访问。
步骤5,(如图4)如果查找不存在,则在访问服务器后,使用HTTP协议下的文本传输协议捕获网页文本信息,将文本信息进行预处理,即利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维,在LSI降维的基础上,再用GA进行优化降维,LSI和GA相结合不仅可以大大降低文本空间的维数,而且也进一步提高了分类的精度。然后利用VSM进行文本表示,计算TF-IDF权值,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。(如图5)将分类的结果查询主题库,通过与主题库中的特征值和特征向量比对,确定网页所属的主题类别,如果属于家长允许的主题,则进入步骤6,如果属于家长禁止的主题,则进入步骤7,否则如果属于系统推荐主题,进入步骤8。否则进入步骤7.
步骤6,将该网页发送到显示端,并将网页的地址存储到白名单地址列表。进入步骤1或者结束。进入步骤1或者结束。
步骤7,屏蔽掉该网页内容,并将网页地址存储到黑名单地址列表。进入步骤1或者结束。
步骤8,屏蔽掉该网页内容,并将网页地址加入灰名单地址列表。进入步骤1或者结束。
如图5所示,其中的主题库可包括前述的家长指定主题库、家长禁止主题库,主题库中存储着事先分类好的几种主题,每种主题下的特征向量和特征值,系统将其中若干种主题作为禁止主题,并且对家长指定的主题利用KNN算法找出相近主题作为系统推荐主题。对分类结果查找出主题时,如果属于系统推荐主题时就将该网页加入灰名单地址列表,供家长审核,选择将该网页移入黑名单还是白名单。
间隔一段时间,黑、白、灰名单将地址列表根据输入字符和匹配结果自动更新,,以显示最近孩子关心的内容。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (3)

1.一种基于家长个性化推荐管控的安全网络浏览系统,其特征在于,包括网络浏览模块、家长管控模块以及内容过滤系统,其中:
所述网络浏览模块用于显示家长所指定的主题相关信息,其中,家长指定的主题包括多个大类,每一个大类由若干个小类组成;
所述家长管控模块包括家长指定主题库、家长禁止主题库、黑名单地址列表、白名单地址列表以及灰名单地址列表,所述黑名单地址列表用于存储禁止访问的黑名单地址,所述白名单地址列表用于存储允许访问的白名单地址,所述灰名单地址列表用于存储待确认的灰名单访问地址;
所述网络过滤系统模块包括查询模块、文本分类模块和结果处理模块,其中:
所述查询模块用于根据输入的字符按照前缀和后缀匹配的原则查询黑、白、灰名单地址列表,如果属于黑名单,直接禁止访问;如果属于白名单,直接允许浏览网页,地址被送到服务器,服务器送回相对应的网页内容,访问结束;如果属于灰名单地址列表,则禁止访问;并且,如果在黑、白、灰名单地址列表中没有查询到,即输入字符的前缀和后缀匹配在三个地址列表中查找不存在,则使用HTTP协议下的文本传输协议捕获网页文本信息,然后通过所述文本分类模块进行处理;
所述文本分类模块用于在用户输入的字符在所述黑、白、灰名单地址均不存在时对获取到的网页文本信息进行文本预处理,将预处理后的文本信息存入文本信息库,然后将库中信息进行特征提取,计算特征权值,得出特征向量,然后利用分类器进行分类;
所述结果处理模块包括一个知识库和判别模块,该知识库中存储有各个主题的特征向量和特征值,该判别模块用于将上述分类结果与知识库中的特征值和特征向量比对,判别上述文本的主题类别:如果属于家长指定的主题,则将该文本的地址加入所述白名单地址列表并允许访问;若属于系统推荐主题,则将该文本的地址加入灰名单地址列表并暂时禁止观看,供家长查看后选择是否允许访问;否则,将该文本的地址加入黑名单列表并禁止访问。
2.根据权利要求1所述的基于家长个性化推荐管控的安全网络浏览系统,其特征在于,所述文本分类模块按照下述方式进行文本分类处理:
首先,利用基于遗传算法(GA)和潜在语义索引(LSI)综合的方法进行文本特征降维;
然后,利用VSM进行文本表示,再计算TF-IDF权值,
最后,利用基于支持向量机和贝叶斯算法相结合的分类器算法进行文本分类,得到分类结果。
3.根据权利要求1或2所述的基于家长个性化推荐管控的安全网络浏览系统,其特征在于,所述黑、白、灰名单地址列表根据输入字符和匹配结果自动更新。
CN201410263662.8A 2014-06-13 2014-06-13 基于家长个性化推荐管控的安全网络浏览系统 Expired - Fee Related CN104035999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410263662.8A CN104035999B (zh) 2014-06-13 2014-06-13 基于家长个性化推荐管控的安全网络浏览系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410263662.8A CN104035999B (zh) 2014-06-13 2014-06-13 基于家长个性化推荐管控的安全网络浏览系统

Publications (2)

Publication Number Publication Date
CN104035999A CN104035999A (zh) 2014-09-10
CN104035999B true CN104035999B (zh) 2018-01-05

Family

ID=51466769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410263662.8A Expired - Fee Related CN104035999B (zh) 2014-06-13 2014-06-13 基于家长个性化推荐管控的安全网络浏览系统

Country Status (1)

Country Link
CN (1) CN104035999B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550182A (zh) * 2014-11-01 2016-05-04 江苏威盾网络科技有限公司 一种基于云端的网页分类控制装置及方法
CN104408346A (zh) * 2014-11-27 2015-03-11 柳州市网中网络策划中心 基于虹膜验证的互联网数据管理系统
CN104376107A (zh) * 2014-11-27 2015-02-25 张芳 具有滤波的基于虹膜验证的网络数据管理系统
CN104408350A (zh) * 2014-11-27 2015-03-11 柳州市网中网络策划中心 基于指纹验证的网络管理系统
CN104363241A (zh) * 2014-11-27 2015-02-18 张芳 具有滤波的基于虹膜验证的因特网管理系统
CN104408351A (zh) * 2014-11-27 2015-03-11 柳州市网中网络策划中心 具有滤波的基于指纹验证的网络数据管理系统
CN104408348A (zh) * 2014-11-27 2015-03-11 柳州市网中网络策划中心 具有滤波的基于指纹验证的互联网管理系统
CN104363123A (zh) * 2014-11-27 2015-02-18 张芳 具有滤波的基于虹膜验证的互联网数据管理系统
CN104363124A (zh) * 2014-11-27 2015-02-18 张芳 具有滤波的基于虹膜验证的网络管理系统
CN104408353A (zh) * 2014-11-27 2015-03-11 张芳 具有滤波的基于虹膜验证的互联网管理系统
CN106294787A (zh) * 2016-08-12 2017-01-04 北京金山安全软件有限公司 一种推送信息的方法、装置及电子设备
CN108153872A (zh) * 2017-12-25 2018-06-12 佛山市车品匠汽车用品有限公司 一种互联网网页信息过滤的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1947419A (zh) * 2004-04-26 2007-04-11 松下电器产业株式会社 对与家庭网络相连的设备的使用进行家长式控制和监测的方法
EP2538628A2 (en) * 2011-06-22 2012-12-26 Telefonaktiebolaget L M Ericsson AB (Publ) Method for personalizing parental control in a PCC architecture

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8918840B2 (en) * 2002-12-26 2014-12-23 Better Dating Bureau, Inc. Systems and methods for identity-based communication gate for social networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1947419A (zh) * 2004-04-26 2007-04-11 松下电器产业株式会社 对与家庭网络相连的设备的使用进行家长式控制和监测的方法
EP2538628A2 (en) * 2011-06-22 2012-12-26 Telefonaktiebolaget L M Ericsson AB (Publ) Method for personalizing parental control in a PCC architecture

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于潜在语义索引和遗传算法的文本特征提取方法;郝占刚;《情报科学》;20060131;第24卷(第1期);第7-8页 *
智能网页信息过滤系统AIFS的研究与实现;张莉;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20060515;第104-107页 *
未成年人上网内容过滤系统的设计与实现;张沛强;《中国优秀硕士学位论文全文数据库信息科技辑》;20090815;第4-14页 *

Also Published As

Publication number Publication date
CN104035999A (zh) 2014-09-10

Similar Documents

Publication Publication Date Title
CN104035999B (zh) 基于家长个性化推荐管控的安全网络浏览系统
KR102131099B1 (ko) 지식 그래프에 기초한 사용자 인터페이스 요소의 동적 수정 방법
US7739221B2 (en) Visual and multi-dimensional search
US7917514B2 (en) Visual and multi-dimensional search
US20150032728A1 (en) System and method of generating a set of search results
US20090282010A1 (en) Creation and enrichment of search based taxonomy for finding information from semistructured data
CN103412881B (zh) 提供搜索结果的方法及系统
CN104951448B (zh) 一种为用户推送订阅类别的消息的方法和服务器
CN107786537B (zh) 一种基于互联网交叉搜索的孤页植入攻击检测方法
CN104809177A (zh) 一种基于客户端的网页评论、推荐方法及系统
CN102930054A (zh) 数据搜索方法及系统
CN102915380A (zh) 用于对数据进行搜索的方法和系统
CN103177075A (zh) 基于知识的实体检测和消歧
CN103685308A (zh) 一种钓鱼网页的检测方法及系统、客户端、服务器
CN103180845B (zh) 将用户生成内容的项目匹配到实体
CN108027820A (zh) 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统
CN105718533A (zh) 信息推送方法和装置
CN107273416A (zh) 网页暗链检测方法、装置及计算机可读存储介质
CN111753171A (zh) 一种恶意网站的识别方法和装置
CN103235821A (zh) 原创内容的搜索方法和搜索服务器
CN104572719A (zh) 信息收集方法及装置
CN108280102A (zh) 上网行为记录方法、装置及用户终端
WO2017086992A1 (en) Malicious web content discovery through graphical model inference
CN108446378B (zh) 基于用户搜索的方法、系统及计算机存储介质
CN103475673A (zh) 钓鱼网站识别方法、装置及客户端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180105

Termination date: 20190613