CN109582856A - 一种网络搜索行为的管控方法及装置 - Google Patents
一种网络搜索行为的管控方法及装置 Download PDFInfo
- Publication number
- CN109582856A CN109582856A CN201811185481.2A CN201811185481A CN109582856A CN 109582856 A CN109582856 A CN 109582856A CN 201811185481 A CN201811185481 A CN 201811185481A CN 109582856 A CN109582856 A CN 109582856A
- Authority
- CN
- China
- Prior art keywords
- search
- behavior
- web
- result data
- web search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000000284 extract Substances 0.000 claims abstract description 26
- 238000011217 control strategy Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims description 165
- 230000002159 abnormal effect Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/554—Detecting local intrusion or implementing counter-measures involving event detection and direct action
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2149—Restricted operating environment
Abstract
本发明提供了一种网络搜索行为的管控方法及装置,所述方法包括:获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;若所述终端设备用户的网络搜索行为属于待管控网络搜索行为,则根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。基于本发明实施例提供的方法可以对搜索结果数据进行分析提取指定参数可以准确推断用户的搜索类型,进而反推出用户输入的搜索关键词,对其判断即可有效获知用户的网络搜索行为是否属于待管控网络搜索行为。
Description
技术领域
本发明涉及互联网技术领域,特别是涉及一种网络搜索行为的管控方法及装置。
背景技术
随着互联网的不断普及,智能终端设备已经成为了人们的交流、学习以及娱乐工具的主流设备。尤其是各种视频、搜索、游戏等应用程序的开发,使得智能终端的使用范围以及使用群体也再不断扩大。
但是,由于互联网是建立在自由开放的基础上的,对于青少年、老人等容易在上网过程中可能会遇到许多诈骗等不良信息,容易导致上述用户群体上当受骗,进而造成身心以及财产等受到损失。
发明内容
本发明提供了一种网络搜索行为的管控方法及装置以克服上述问题或者至少部分地解决上述问题。
根据本发明的一个方面,提供了一种网络搜索行为的管控方法,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
若所述终端设备用户的网络搜索行为属于待管控网络搜索行为,则根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
可选地,所述获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对所述搜索结果数据进行解析,获取所述搜索结果数据中的广告数据包,并提取所述广告数据包的特征参数。
可选地,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为之前,还包括:
预先设置包括多个搜索关键词的词汇表;
分别将所述词汇表中的各搜索关键词输入搜索引擎进行搜索,获取所述搜索引擎基于所述各搜索关键词返回的搜索结果数据;
解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数。
可选地,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
将所述各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为所述正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
可选地,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
构建网络学习模型;
基于所述广告数据包的特征参数以及对应的搜索关键词训练所述网络学习模型;其中,所述搜索关键词作为所述网络模型的输出,与所述搜索关键词对应的广告数据包的特征参数作为所述网络学习模型的输入。
可选地,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
将所述指定参数输入所述网络学习模型;
通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
可选地,所述通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
通过所述网络学习模型对所述广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于所述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
可选地,所述根据预设管控策略对所述终端设备用户的网络搜索行为进行管控,包括:
禁止所述终端设备中任一搜索引擎根据所述搜索关键词执行搜索操作;和/或
禁止所述终端设备运行携带有所述搜索关键词的应用程序和/或网页链接。
根据本发明的另一个方面,还提供了一种网络搜索行为的管控装置,包括:
数据获取模块,配置为获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
判断模块,配置为基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
管控模块,配置为当所述终端设备用户的网络搜索行为属于待管控网络搜索行为时,根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
可选地,所述数据获取模块还配置为:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对所述搜索结果数据进行解析,获取所述搜索结果数据中的广告数据包,并提取所述广告数据包的特征参数。
可选地,所述装置还包括:
设置模块,配置为预先设置包括多个搜索关键词的词汇表;
结果获取模块,配置为分别将所述词汇表中的各搜索关键词输入搜索引擎进行搜索,获取所述搜索引擎基于所述各搜索关键词返回的搜索结果数据;
解析模块,配置为解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数。
可选地,所述装置还包括划分模块,配置为:
将所述各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为所述正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
可选地,所述装置还包括构建模块,配置为:
构建网络学习模型;
基于所述广告数据包的特征参数以及对应的搜索关键词训练所述网络学习模型;其中,所述搜索关键词作为所述网络模型的输出,与所述搜索关键词对应的广告数据包的特征参数作为所述网络学习模型的输入。
可选地,所述判断模块,包括:
输入单元,配置为将所述指定参数输入所述网络学习模型;
分析单元,配置为通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
可选地,所述分析单元还配置为:
通过所述网络学习模型对所述广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于所述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
可选地,所述管控模块还配置为:
禁止所述终端设备中任一搜索引擎根据所述搜索关键词执行搜索操作;和/或
禁止所述终端设备运行携带有所述搜索关键词的应用程序和/或网页链接。
根据本发明的另一个方面,还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行上述任一项所述的网络搜索行为的管控方法。
根据本发明的另一个方面,还提供了一种计算设备,包括:
处理器;
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行上述任一项所述的网络搜索行为的管控方法。
本发明提供了一种对用户的网络搜索行为的管控方法即装置,通过获取终端设备当前运行的应用程序所返回的搜索结果数据并提取指定参数,以及基于指定参数获取与搜索结果数据对应的搜索关键词,以根据搜索关键词判断用终端设备用户的网络搜索行为是否需要进行管控。在本发明中,搜索结果数据是基于搜索关键词所直接得到的相关数据,通过对其进行分析提取指定参数可以推断用户的搜索类型,进而获取用户进行网络搜索行为时基于当前应用程序输入的搜索关键词,通过对其判断即可有效获知用户的网络搜索行为是否属于待管控网络搜索行为。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是根据本发明实施例的网络搜索行为的管控方法流程示意图;
图2是根据本发明实施例的搜索结果示意图;
图3是根据本发明实施例的网络搜索行为的管控装置结构示意图;
图4是根据本发明优选实施例的网络搜索行为的管控装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是根据本发明实施例的网络搜索行为的管控方法流程示意图,如图1所示,根据本发明实施例的网络搜索行为的管控方法可以包括:
步骤S102,获取终端设备当前运行的应用程序返回的搜索结果数据,提取上述搜索结果数据中的指定参数;
步骤S104,基于指定参数获取与上述搜索结果数据对应的至少一个搜索关键词,并根据上述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
步骤S106,若终端设备用户的网络搜索行为属于待管控网络搜索行为,则根据预设管控策略对终端设备用户的网络搜索行为进行管控。
本发明实施例提供了一种对用户的网络搜索行为的管控方法,通过获取终端设备当前运行的应用程序所返回的搜索结果数据并在其中提取指定参数,进而基于指定参数获取与搜索结果数据对应的搜索关键词,以根据搜索关键词判断用终端设备用户的网络搜索行为是否需要进行管控。在本发明实施例中,搜索结果数据是基于搜索关键词所直接得到的相关数据,通过对其进行分析提取指定参数可以推断用户的搜索类型,进而获取用户进行网络搜索行为时基于当前应用程序输入的搜索关键词,通过对其判断即可有效获知用户的网络搜索行为是否属于待管控网络搜索行为。
上文所介绍的用户的网络搜索行为可以是搜索网页、视频、网址、小说、漫画等多种类型的网络搜索行为。而终端设备当前运行的应用程序可以是安装于终端设备中可提供上述搜索功能的应用程序,如浏览器、视频软件、漫画软件等,本发明不做限定。
在步骤S102中提及,需要获取终端设备当前运行的应用程序返回的搜索结果数据以提取指定参数,可选地,其可以包括:先获取终端设备当前运行的应用程序返回的搜索结果数据;再对上述搜索结果数据进行解析,获取搜索结果数据中的广告数据包,并提取广告数据包的特征参数。
应用程序在接收到用户的搜索关键词后,会基于上述搜索关键词进行搜索并返回搜索结果,通常情况下,应用程序在返回搜索结果的同时还会在搜索结果页向用户推荐的与用户搜索意图相关广告,因此,上述步骤S102在提取搜索结果数据中的指定参数时,可以通过对搜索结果数据进行解析获取广告数据包,进而提取广告数据包中的特征参数。广告数据包中的特征参数可以是文字参数、图片参数或是携带的网页链接等其他特征参数。
本发明实施例基于广告数据包的特征参数获取相应的搜索关键词时所采用的方法优选为深度学习算法。深度学习是机器学习中一种基于对数据进行表征学习的方法。因此,采用本发明实施例所提供的管控方法对用户的网络搜索行为进行管控之前,还可以预先对不同搜索关键词对应的搜索结果数据中的广告数据包以及广告数据包的特征参数进行深度学习。
在本发明一优选实施例中,执行上述步骤S102之前,还可以执行以下步骤:
S1、预先设置包括多个搜索关键词的词汇表;
S2、分别将词汇表中的各搜索关键词输入搜索引擎进行搜索,获取搜索引擎基于各搜索关键词返回的搜索结果数据;
S3、解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取广告数据包中的特征参数。
也就是说,在本发明实施例中,通过提前在各应用程序中对多种类型的搜索关键词执行网络搜索操作,进而获取应用程序返回的搜索结果数据中的广告数据包,并提取广告数据包的特征参数,并与对应的搜索关键词对应存储后进行深度学习,在后续对用户的网络搜索行为进行判断时可以更加准确、高效地进行判断。
上文提及,应用程序可以包括如浏览器、视频软件、漫画软件等,因此,预先基于词汇表中的搜索关键词进行搜索时,可以分别基于终端设备中的各应用程序执行搜索操作,而在存储数据时,可以以应用程序的类型进行数据存储,也可以以搜索关键词类型进行存储。在存储数据时,可以将广告数据包及特征参数存储在词汇表中对应的搜索关键词中,也可以单独设置存储区域,将广告数据包及特征参数与相应的搜索关键词对应存储。其中,预先设置的词汇表可以是基于用户日常用语形成,也可以是基于网络用户历史搜索记录汇总形成,或是由其他方式形成,本发明不做限定。
在上述步骤S3解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取广告数据包中的特征参数之后,还可以包括:
S4,构建网络学习模型;
S5,基于广告数据包的特征参数以及对应的搜索关键词训练网络学习模型;其中,搜索关键词作为网络模型的输出,与搜索关键词对应的广告数据包的特征参数作为网络学习模型的输入。
上述实施例中提及,基于广告数据包的特征参数获取相应的搜索关键词时所采用的方法优选为深度学习算法。深度学习算法最近变得越来越流行和越来越有用的算法,然而深度学习得益于层出不穷的神经网络模型架构。深度学习是指多层神经网络上运用各种机器学习算法解决图像,文本等各种问题的算法集合。深度学习从大类上可以归入神经网络。深度学习是一个框架,包含多个重要算法,如常用的CNN(Convolutional NeuralNetworks,卷积神经网络)、RNN(Recurrent neural Network,多层反馈循环神经网络神经网络)。因此,本发明优选实施例可先构建网络学习模型,进而基于广告数据包的特征参数以及对应的搜索关键词对已构建的网络学习模型进行训练。对模型进行训练之前,可以先基于广告数据包的特征参数以及对应的搜索关键词构建数据集,选取数据集中的指定比例的数据作为训练集对网络学习模型进行训练,其他数据作为验证集,对网络学习模型进行验证,以提升网络学习模型输入搜索关键词的高效性和准确性。实际训练过程中,可将广告数据包的特征参数作为网络学习模型的输入,对应的搜索关键词作为网络学习模型的输出。结合网络学习模型对广告数据包的特征参数和对应的搜索关键词进行深度学习,在后续判断用户的网络搜索行为中通过网络学习模型对监控到的搜索结果数据中的数据包进行分析学习,使得输出的搜索关键词与用户实际输入的搜索关键词有较高相似度,进而准确并高效对用户的搜索行为进行判断,预防潜在危害。实际应用中,除了上述实施例提及的对广告数据包进行分析提取特征参数之外,还可以结合cookie进行分析,或是其他方式进行分析。
对于网络搜索行为的管控主要是在识别用户基于终端设备中的应用程序所进行的搜索行为是正常搜索行为还是异常搜索行为。举例来说,对于青少年或儿童来讲,当其搜索关于学习知识、生活常识、食品资料时均属于正常搜索行为,而搜索与其年龄不符的内容或对其有害的内容则属于异常搜索行为。由于用户在应用程序输入的搜索关键字是能够直观反映用户搜索意图的,因此,在创创建词汇表时,可以先将各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词,并分别为正常搜索关键词和异常搜索关键词添加正常标识和异常标识。本发明实施例中的预设规则可以是结合终端设备用户的年龄以及搜关键词属性进行设定。
可选地,上述步骤S104基于指定参数获取与上述搜索结果数据对应的至少一个搜索关键词,并根据上述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为可以进一步包括:将指定参数输入网络学习模型;通过网络学习模型对指定参数进行分析,输出与搜索结果数据对应的至少一个搜索关键词,此外,还可以输出根据搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为的判断结果。
前文介绍,指定参数可以为搜索结果数据中广告数据包的特征参数。因此,通过网络学习模型判断用户的网络搜索行为是否属于待管控网络搜索行为时,可以通过网络学习模型对广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;基于上述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。当网络学习模型输出的搜索关键词的标识为正常标识时,说明终端设备用户的网络搜索行为不属于待管控网络搜索行为,此时,可以忽略用户此次的搜索操作,并继续对用户的网络搜索行为进行监控;当网络学习模型输出的搜索关键词的标识为异常标识时,说明终端设备用户的网络搜索行为属于待管控网络搜索行为,并对该网络搜索行为进行管控。在本发明实施例中,对用户的网络搜索行为监控可以是全天候的监控,也可以是对一天或一周内的特定时间监控,本发明不做限定。
对终端设备用户的网络搜索行为进行管控时,可根据预设管控策略进行管控,如禁止终端设备中任一搜索引擎根据上述搜索关键词执行搜索操作;和/或禁止终端设备运行携带有上述搜索关键词的应用程序和/或网页链接。当然,实际应用中,还可以采用其他方式对用户的搜索行为进行管控,此处不再赘述。
此外,本发明实施例还可以实时或者周期性汇总用户的网络搜索行为,包括获取用户在指定时间周期内所分析出的搜索关键词、基于上述搜索关键词的搜索次数、频率或是其他搜索信息进行汇总,还可以是使用终端设备中各应用程序的次数等等进而生成报告以供随时查看。由于待管控终端可能会基于本地路由器的防火墙进行联网,因此,上述网络搜索行为的相关数据可通过路由器进行获取。对于汇总后的报告,可发送至该路由器的主控终端设备中进行查看。通常情况下,对于被监控网络搜索行为的终端设备用户可能为认知、辨别能力较差的儿童、青少年或是老人的用户群体,通过对其搜索行为的监控可以有效减小甚至避免上述用户群体对有害信息的访问。其中,对于终端设备网络搜索行为的汇总报告可以发送至路由器的主控终端设备中,由主控终端设备进行查看,以及时获知儿童或老人的上网行为,并采取相应的管控措施。
上文介绍,对终端设备用户的网络搜索行为进行管控时,可根据预设管控策略进行管控,除此之外,还可以由路由器的主控终端设备用户自定义设置管控策略,如自定义添加限制访问网址列表、限制访问应用程序列表等方式对终端设备用户的网络搜索行为进行管控。本发明实施例中对于网络搜索行为的管控,除了限制终端设备访问相关网址或应用,还可以分析终端设备向网络服务器发送的信息的特征,如果终端设备向其他未被限制的网址发送具有相同或相似特征的信息时,该行为同样会被限制。除了上文所介绍的方式之外,还可以有其他方式对终端用户的网络搜索行为进行管控,此处不再赘述。
以用户基于搜索引擎获取网络信息为例进行详细说明。
图2示出根据本发明一实施例的搜索引擎搜索结果示意图,当监测到用户发生网络搜索行为时,获取搜索引擎返回的搜索结果数据中的广告数据,同时提取广告数据中的特征参数。
基于图2可知,获取到搜索结果数据时,可以提取“猜你喜欢”广告位中的特征参数,如文字信息以及图片信息;对上述信息进行分析后推测用户基于搜索引擎输入的搜索词的类型为食物。与此同时,可将广告数据包中的特征参数输入至预先构建的网络学习模型中,通过网络学习模型对广告数据包中的特征参数进行分析后,输出用户可能输入的搜索关键词为“烤鸭”,此时,即可判断用户的网络搜索行为不属于待管控网络搜索行为,那么该次网络搜索行为可以忽略。
那么,假设基于搜索引擎的搜索结果数据中得到广告数据包为“零元购”、“免息贷款”等信息,此时说明用户存在上当的可能性,此时就会通过禁止用户使用搜索引擎或使用其携带有“贷款”等字样的应用程序。
基于同一发明构思,本发明实施例还提供了一种网络搜索行为的管控装置,如图3所示,本发明实施例的网络搜索行为的管控装置可以包括:
数据获取模块310,配置为获取终端设备当前运行的应用程序返回的搜索结果数据,提取上述搜索结果数据中的指定参数;
判断模块320,配置为基于指定参数获取与上述搜索结果数据对应的至少一个搜索关键词,并根据上述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
管控模块330,配置为当终端设备用户的网络搜索行为属于待管控网络搜索行为时,根据预设管控策略对终端设备用户的网络搜索行为进行管控。
在本发明一优选实施例中,数据获取模块310还可以配置为:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对上述搜索结果数据进行解析,获取上述搜索结果数据中的广告数据包,并提取广告数据包的特征参数。
在本发明一优选实施例中,上述装置还可以包括:
设置模块340,配置为预先设置包括多个搜索关键词的词汇表;
结果获取模块350,配置为分别将词汇表中的各搜索关键词输入搜索引擎进行搜索,获取搜索引擎基于各搜索关键词返回的搜索结果数据;
解析模块360,配置为解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取广告数据包中的特征参数。
在本发明一优选实施例中,上述装置还可以包括划分模块370,配置为:
将各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
在本发明一优选实施例中,上述装置还可以包括构建模块380,配置为:
构建网络学习模型;
基于广告数据包的特征参数以及对应的搜索关键词训练网络学习模型;其中,搜索关键词作为网络模型的输出,与搜索关键词对应的广告数据包的特征参数作为网络学习模型的输入。
在本发明一优选实施例中,判断模块320可以包括:
输入单元321,配置为将指定参数输入网络学习模型;
分析单元322,配置为通过网络学习模型对指定参数进行分析,输出与搜索结果数据对应的至少一个搜索关键词,并根据搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
在本发明一优选实施例中,分析单元322还可以配置为:
通过网络学习模型对广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
在本发明一优选实施例中,管控模块330还可以配置为:禁止终端设备中任一搜索引擎根据搜索关键词执行搜索操作;和/或
禁止终端设备运行携带有搜索关键词的应用程序和/或网页链接。
基于同一发明构思,本发明实施例还提供了一种计算机存储介质,计算机存储介质存储有计算机程序代码,当计算机程序代码在计算设备上运行时,导致计算设备执行上述任一项所述的网络搜索行为的管控方法。
于同一发明构思,本发明实施例还提供了一种计算设备,包括:
处理器;
存储有计算机程序代码的存储器;
当计算机程序代码被处理器运行时,导致计算设备执行上述任一项所述的网络搜索行为的管控方法。
本发明实施例提供了一种对用户的网络搜索行为的管控方法及装置,基于本发明实施例提供的方法可以对搜索结果数据中的广告数据包进行分析,进而确定用户的网络搜索行为的类型以及可能输入的搜索关键词,以根据搜索关键词判断用终端设备用户的网络搜索行为是否需要进行管控。在本发明实施例中,搜索结果数据是基于搜索关键词所直接得到的相关数据,通过对其进行分析提取指定参数可以推断用户的搜索类型,进而获取用户进行网络搜索行为时基于当前应用程序输入的搜索关键词,通过对其判断即可有效获知用户的网络搜索行为是否属于待管控网络搜索行为。进一步地,本发明实施例还基于实际的搜索关键词以及对应的广告数据包构建并训练网络学习模型,通过网络学习模型对监控到的搜索结果数据中的数据包进行分析学习,使得输出的搜索关键词与用户实际输入的搜索关键词有较高相似度,进而准确并高效对用户的搜索行为进行判断,预防潜在危害。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。
本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM),磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。
根据本发明实施例的一个方面,提供了A1.一种网络搜索行为的管控方法,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
若所述终端设备用户的网络搜索行为属于待管控网络搜索行为,则根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
A2.根据A1所述的方法,其中,所述获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对所述搜索结果数据进行解析,获取所述搜索结果数据中的广告数据包,并提取所述广告数据包的特征参数。
A3.根据A1所述的方法,其中,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为之前,还包括:
预先设置包括多个搜索关键词的词汇表;
分别将所述词汇表中的各搜索关键词输入搜索引擎进行搜索,获取所述搜索引擎基于所述各搜索关键词返回的搜索结果数据;
解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数。
A4.根据A3所述的方法,其中,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
将所述各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为所述正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
A5.根据A4所述的方法,其中,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
构建网络学习模型;
基于所述广告数据包的特征参数以及对应的搜索关键词训练所述网络学习模型;其中,所述搜索关键词作为所述网络模型的输出,与所述搜索关键词对应的广告数据包的特征参数作为所述网络学习模型的输入。
A6.根据A5所述的方法,其中,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
将所述指定参数输入所述网络学习模型;
通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
A7.根据A6所述的方法,其中,所述通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
通过所述网络学习模型对所述广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于所述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
A8.根据A1-A7任一项所述的方法,其中,所述根据预设管控策略对所述终端设备用户的网络搜索行为进行管控,包括:
禁止所述终端设备中任一搜索引擎根据所述搜索关键词执行搜索操作;和/或
禁止所述终端设备运行携带有所述搜索关键词的应用程序和/或网页链接。
根据本发明实施例的另一个方面,还提供了B9.一种网络搜索行为的管控装置,包括:
数据获取模块,配置为获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
判断模块,配置为基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
管控模块,配置为当所述终端设备用户的网络搜索行为属于待管控网络搜索行为时,根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
B10.根据B9所述的装置,其中,所述数据获取模块还配置为:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对所述搜索结果数据进行解析,获取所述搜索结果数据中的广告数据包,并提取所述广告数据包的特征参数。
B11.根据B9所述的装置,其中,还包括:
设置模块,配置为预先设置包括多个搜索关键词的词汇表;
结果获取模块,配置为分别将所述词汇表中的各搜索关键词输入搜索引擎进行搜索,获取所述搜索引擎基于所述各搜索关键词返回的搜索结果数据;
解析模块,配置为解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数。
B12.根据B11所述的装置,其中,还包括划分模块,配置为:
将所述各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为所述正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
B13.根据B12所述的装置,其中,还包括构建模块,配置为:
构建网络学习模型;
基于所述广告数据包的特征参数以及对应的搜索关键词训练所述网络学习模型;其中,所述搜索关键词作为所述网络模型的输出,与所述搜索关键词对应的广告数据包的特征参数作为所述网络学习模型的输入。
B14.根据B13所述的装置,其中,所述判断模块,包括:
输入单元,配置为将所述指定参数输入所述网络学习模型;
分析单元,配置为通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
B15.根据B14所述的装置,其中,所述分析单元还配置为:
通过所述网络学习模型对所述广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于所述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
B16.根据B9-B15任一项所述的装置,其中,所述管控模块还配置为:
禁止所述终端设备中任一搜索引擎根据所述搜索关键词执行搜索操作;和/或
禁止所述终端设备运行携带有所述搜索关键词的应用程序和/或网页链接。
根据本发明实施例的另一个方面,还提供了C17.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行A1-A8任一项所述的网络搜索行为的管控方法。
根据本发明实施例的另一个方面,还提供了D18.一种计算设备,包括:
处理器;
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行A1-A8任一项所述的网络搜索行为的管控方法。
Claims (10)
1.一种网络搜索行为的管控方法,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
若所述终端设备用户的网络搜索行为属于待管控网络搜索行为,则根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
2.根据权利要求1所述的方法,其中,所述获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数,包括:
获取终端设备当前运行的应用程序返回的搜索结果数据;
对所述搜索结果数据进行解析,获取所述搜索结果数据中的广告数据包,并提取所述广告数据包的特征参数。
3.根据权利要求1所述的方法,其中,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为之前,还包括:
预先设置包括多个搜索关键词的词汇表;
分别将所述词汇表中的各搜索关键词输入搜索引擎进行搜索,获取所述搜索引擎基于所述各搜索关键词返回的搜索结果数据;
解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数。
4.根据权利要求3所述的方法,其中,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
将所述各搜索关键词按照预设规则划分为正常搜索关键词和异常搜索关键词;
分别为所述正常搜索关键词和异常搜索关键词添加正常标识和异常标识。
5.根据权利要求4所述的方法,其中,所述解析出各搜索关键词对应搜索结果数据中的广告数据包,并提取所述广告数据包中的特征参数之后,还包括:
构建网络学习模型;
基于所述广告数据包的特征参数以及对应的搜索关键词训练所述网络学习模型;其中,所述搜索关键词作为所述网络模型的输出,与所述搜索关键词对应的广告数据包的特征参数作为所述网络学习模型的输入。
6.根据权利要求5所述的方法,其中,所述基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
将所述指定参数输入所述网络学习模型;
通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
7.根据权利要求6所述的方法,其中,所述通过所述网络学习模型对所述指定参数进行分析,输出与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为,包括:
通过所述网络学习模型对所述广告数据包中的特征参数包进行分析,获取并输出与广告数据包对应的至少一个搜索关键词;
基于所述搜索关键词的标识判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为。
8.一种网络搜索行为的管控装置,包括:
数据获取模块,配置为获取终端设备当前运行的应用程序返回的搜索结果数据,提取所述搜索结果数据中的指定参数;
判断模块,配置为基于所述指定参数获取与所述搜索结果数据对应的至少一个搜索关键词,并根据所述搜索关键词判断终端设备用户的网络搜索行为是否属于待管控网络搜索行为;
管控模块,配置为当所述终端设备用户的网络搜索行为属于待管控网络搜索行为时,根据预设管控策略对所述终端设备用户的网络搜索行为进行管控。
9.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行权利要求1-7任一项所述的网络搜索行为的管控方法。
10.一种计算设备,包括:
处理器;
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行权利要求1-7任一项所述的网络搜索行为的管控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185481.2A CN109582856A (zh) | 2018-10-11 | 2018-10-11 | 一种网络搜索行为的管控方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185481.2A CN109582856A (zh) | 2018-10-11 | 2018-10-11 | 一种网络搜索行为的管控方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109582856A true CN109582856A (zh) | 2019-04-05 |
Family
ID=65920265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811185481.2A Pending CN109582856A (zh) | 2018-10-11 | 2018-10-11 | 一种网络搜索行为的管控方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109582856A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188262A (zh) * | 2019-07-23 | 2019-08-30 | 武汉斗鱼网络科技有限公司 | 一种异常目标确定方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066755A1 (en) * | 2011-10-31 | 2013-05-10 | Pureclick Llc | System and method for click fraud protection |
CN103617278A (zh) * | 2013-12-09 | 2014-03-05 | 北京奇虎科技有限公司 | 一种地址栏搜索的控制方法及装置 |
CN104484407A (zh) * | 2014-12-17 | 2015-04-01 | 陆俊 | 一种识别诈骗信息的方法和系统 |
CN105354285A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 嵌入搜索引擎中的知识搜索方法、装置以及搜索引擎 |
CN107147623A (zh) * | 2017-04-24 | 2017-09-08 | 绿网天下(福建)网络科技股份有限公司 | 一种特定浏览器过滤网址的方法 |
-
2018
- 2018-10-11 CN CN201811185481.2A patent/CN109582856A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066755A1 (en) * | 2011-10-31 | 2013-05-10 | Pureclick Llc | System and method for click fraud protection |
CN103617278A (zh) * | 2013-12-09 | 2014-03-05 | 北京奇虎科技有限公司 | 一种地址栏搜索的控制方法及装置 |
CN104484407A (zh) * | 2014-12-17 | 2015-04-01 | 陆俊 | 一种识别诈骗信息的方法和系统 |
CN105354285A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 嵌入搜索引擎中的知识搜索方法、装置以及搜索引擎 |
CN107147623A (zh) * | 2017-04-24 | 2017-09-08 | 绿网天下(福建)网络科技股份有限公司 | 一种特定浏览器过滤网址的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188262A (zh) * | 2019-07-23 | 2019-08-30 | 武汉斗鱼网络科技有限公司 | 一种异常目标确定方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175325B (zh) | 基于词向量和句法特征的评论分析方法及可视化交互界面 | |
US9672251B1 (en) | Extracting facts from documents | |
US20070033188A1 (en) | Method and system for extracting web data | |
US10032081B2 (en) | Content-based video representation | |
US9288124B1 (en) | Systems and methods of classifying sessions | |
US20170249389A1 (en) | Sentiment rating system and method | |
CN108446813A (zh) | 一种电商服务质量综合评价的方法 | |
CN107784066A (zh) | 信息推荐方法、装置、服务器及存储介质 | |
US20150121265A1 (en) | Systems and methods for facilitating open source intelligence gathering | |
CN109726318A (zh) | 用于识别欺诈性发布者网络的方法和系统 | |
CN109005145A (zh) | 一种基于自动特征抽取的恶意url检测系统及其方法 | |
KR20150031234A (ko) | 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트 | |
CN109522822A (zh) | 一种视频检测方法及装置 | |
CN107578263A (zh) | 一种广告异常访问的检测方法、装置和电子设备 | |
CN104348642B (zh) | 一种垃圾信息过滤方法和装置 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
CN111767443A (zh) | 一种高效的网络爬虫分析平台 | |
CN104050243B (zh) | 一种将搜索与社交相结合的网络搜索方法及其系统 | |
US20180005248A1 (en) | Product, operating system and topic based | |
CN106874368B (zh) | 一种rtb竞价广告位价值分析方法及系统 | |
CN106909454A (zh) | 一种规则处理方法和设备 | |
CN109582856A (zh) | 一种网络搜索行为的管控方法及装置 | |
CN109145581A (zh) | 基于浏览器渲染性能的防模拟登录方法、装置及服务器 | |
CN110413861B (zh) | 基于网络爬虫的链接提取方法、装置、设备及存储介质 | |
CN104077353B (zh) | 一种黑链检测的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |
|
RJ01 | Rejection of invention patent application after publication |