CN114372220A - 处理网页访问行为的方法和装置 - Google Patents

处理网页访问行为的方法和装置 Download PDF

Info

Publication number
CN114372220A
CN114372220A CN202011102900.9A CN202011102900A CN114372220A CN 114372220 A CN114372220 A CN 114372220A CN 202011102900 A CN202011102900 A CN 202011102900A CN 114372220 A CN114372220 A CN 114372220A
Authority
CN
China
Prior art keywords
function
time
called
functions
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011102900.9A
Other languages
English (en)
Inventor
刘辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202011102900.9A priority Critical patent/CN114372220A/zh
Publication of CN114372220A publication Critical patent/CN114372220A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/566Dynamic detection, i.e. detection performed at run-time, e.g. emulation, suspicious activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及互联网技术领域,提供了一种处理网页访问行为的方法和装置,计算机设备可以是手机、平板电脑、可穿戴设备、个人电脑、车载设备等,该方法包括:确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量;当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理;或者,当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。以上方法可以在保护用户隐私的同时避免网页功能的损失。

Description

处理网页访问行为的方法和装置
技术领域
本申请涉及互联网技术领域,具体涉及一种处理网页访问行为的方法和装置。
背景技术
随着互联网技术的快速发展,互联网为人们的工作和生活带来了非常便利的服务。
很多网站为了对用户推送更为精准的信息,根据用户访问网页的行为来生成表征用户个人特征的信息指纹,并基于信息指纹向用户推送广告,从而侵犯了用户的隐私。一种保护用户的隐私的方法是对浏览器所调用的信息会进行简化提取,降低基于简化信息生成的信息指纹的区分度,然而,这种方式会导致网页的部分功能因无法获得足够的信息而丧失,影响用户体验。
发明内容
本申请提供了一种处理网页访问行为的方法,能够避免网页功能的损失。
第一方面,提供了一种处理网页访问行为的方法,包括:确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量;当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理;或者,当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。
该方法可以由访问目标网页的计算机设备执行。对于绘制信息指纹的网页,其通常会在较短的时间内调用大量的函数;对于未绘制信息指纹的网页,通常不会在较短的时间内调用大量的函数;因此,可以根据浏览器在第一时段内所调用的函数的第一数量确定浏览器调用函数的模式。当第一数量大于等于数量阈值时,说明浏览器访问的目标网页有较大的概率在收集用户信息绘制信息指纹,可以对目标网页的函数调用结果进行反跟踪处理,以保护用户隐私;当第一数量小于数量阈值时,说明浏览器访问的目标网页有较大的概率是未绘制信息指纹的网页,可以不对目标网页的函数调用结果进行反跟踪处理,以便于用户能够正常使用网页的功能。因此,本实施例能够在保护用户隐私的同时避免了网页功能的丧失,确保了用户体验。
可选地,所述第一时段内的所述目标网页为非首次被访问的网页。
该方法中,由于首次访问目标网页时,还没有生成对应的用户的信息指纹,因此即使不进行反跟踪处理也不会产生跟踪的行为,因而在首次访问目标网页时不进行反跟踪处理,可以减少无效的反跟踪处理流程,在不影响反跟踪效果的情况下还能够节约系统资源。
可选地,所述目标网页在所述第一时段内调用的函数属于第一函数集合。
该方法中,当计算机设备首次访问目标网页且短时间内调用的函数数量超过预设的数量阈值时,可以根据所调用的函数生成第一函数集合,该第一函数集合中的函数能够表征此时发生了跟踪行为。当计算机设备在非首次访问目标网页时的第一时段内,调用的函数属于第一函数集合时,可以确定此时目标网页存在跟踪行为。因此,本实施例能够更准确地识别出存在跟踪行为的网页。
可选地,所述第一数量为N,N为大于1的正整数,所述目标网页在所述第一时段内调用的N个函数的顺序与所述N个函数在所述第一函数集合中的顺序相同。
该方法中,当计算机设备再次访问目标网页的第一时段内,按照时间顺序调用N个函数,当这N个函数调用的顺序和第一函数集合中的函数调用的顺序相同时,确定为跟踪模式。该方法实现了在函数调用的数量、类型的基础上,融入了函数的调用顺序作为确定跟踪行为的依据,能够更准确地识别出存在跟踪行为的网页。
可选地,所述方法还包括:确定第二数量,所述第二数量为所述目标网页在第二时段内调用的函数的数量,所述第二时段位于所述第一时段之前,所述第二时段内的所述目标网页为首次被访问的网页;当所述第二数量大于等于所述数量阈值时,生成所述第一函数集合,所述第一函数集合包括所述目标网页在所述第二时段内调用的全部函数或部分函数。
该方法中,第二时段为首次确定目标网页存在跟踪行为的时段,目标网页在该第二时段内调用的函数数量为第二数量。当第二数量大于上述数量阈值时,可以根据该第二时段内所调用的函数生成第一函数集合,其中,可以将第二时段内所调用的函数全部作为第一函数集合,也可以将第二时段内所调用的函数的部分作为第一函数集合。计算机设备将第一函数集合作为后续的参考对象来判断后续目标网页的函数调用模式是否为跟踪模式,从而能够更准确地识别出存在跟踪行为的网页。
可选地,所述目标网页在第二时段内调用的函数属于第二函数集合,所述第二函数集合为预设的函数集合。
该方法中,开发者可以预先设置一个函数集合,输入计算机设备,作为上述第二函数集合,该第二函数集合中的函数的特征能够表征网页处于跟踪模式下的函数调用特征。计算机设备在通过浏览器首次访问目标网页时,将一个固定的时间段作为第二时段,将第二时段内所调用的函数组成的集合生成上述第一函数集合,例如可以将第二时段所调用的函数的全部或者部分作为第一函数集合。当通过浏览器访问目标网页时,调用的函数集合属于预设的第二函数集合时,则表征第二时段内所调用的函数的特征符合跟踪模式下的函数调用特征,因此能够更准确地识别出存在跟踪行为的网页。
可选地,所述方法还包括:接收更新信息,所述更新信息用于更新所述第二函数集合;根据所述更新信息更新所述第二函数集合。
该方法中,通过开发人员输入的更新信息对第二函数集合进行动态更新,能够更准确地识别出存在跟踪行为的网页。
可选地,所述第一函数集合中的函数的顺序与所述目标网页在所述第二时段内调用的函数的顺序相同。
该方法中实现了在函数调用的数量、类型的基础上,融入了函数的调用顺序作为确定跟踪行为的依据,能够更准确地识别出存在跟踪行为的网页。
可选地,所述第一时段的起始时刻为调用第一函数的时刻,所述第一函数属于所述第一函数集合,所述第一函数集合还包括第二函数,所述第二函数被调用的时刻位于所述第一函数被调用的时刻之前,所述第二函数被调用的时刻为第二时段的起始时刻,所述第二时段的时长与所述第一时段的时长相同,所述第一函数被调用的时刻与第二函数被调用的时刻的间隔大于等于所述第二时段的时长,或者,所述第一函数被调用的时刻与第二函数被调用的时刻的间隔小于所述第二时段的时长,并且,所述第二时段内所述第一函数集合中的函数被调用的数量小于所述数量阈值。
该方法中,第一函数集合中包括多个网页存在跟踪行为时所调用的可以函数,第二时段可以为第一时段之前的时段。当计算机设备通过浏览器的浏览器引擎检测到第一函数集合中的第二函数被调用的时候,可以将第二函数被调用的时刻设置为第二时段的起始点,即将第二时段作为一个滑动窗口,并将第二函数被调用的时刻作为这个滑动窗口的起始点。然后,浏览器引擎继续检测第一函数集合中的函数,当检测到第一函数被调用的时候,如果两个函数被调用的时间间隔超过了第二时段的时长,即第一函数和第二函数不处于第二时段这个滑动窗口的时段内,则确定第二时段内调用的可疑函数的数量还没有达到数量阈值,因此认为此时网页不存在跟踪行为。如果第一函数和第二函数被调用的时刻的间隔小于上述第二时段的时长,即二者处于第二时段这个滑动窗口的时段内,且第二时段内所网页所调用的属于可疑函数的数量小于上述数量阈值,则可以继续检测下一个可疑函数,直到第二时段内所调用的可疑函数的数量达到数量阈值为止,此时认为网页存在跟踪行为。该方法通过上述滑动窗口的方式,能够基于检测到的可疑函数触发一个滑动窗口的时段内所调用的可疑函数的数量的检测,在实现有效检测网页跟踪行为的同时,避免了过多无效的检测,因此能够合理节约计算资源。
可选地,当所述第二数量大于等于所述数量阈值时,所述方法还包括:记录所述目标网页的标识,所述标识用于确定所述第一时段内的所述目标网页为非首次被访问的网页。
该方法中,计算机设备可以将首次访问发生跟踪行为的目标网页时,将这个目标网页的标识记录下来,作为恶意网页的记录。计算机设备可以通过再次访问这个目标网页时,判断这个目标网页是不是记录了标识的网页,来确定是否需要进行反跟踪处理。该方法由此结合了所记录的恶意网页的标识来判断当前的函数的调用模式,提高了恶意网页的监控力度,进一步确保了用户隐私的安全性。
可选地,所述反跟踪处理包括:采用随机数加噪。
该方法能够有效实现阻止网页跟踪用户信息且易于实现。
第二方面,提供了一种处理网页访问行为的装置,包括由软件和/或硬件组成的单元,该单元用于执行第一方面所述的技术方案中任意一种方法。
第三方面,提供了一种计算机设备,包括处理器和存储器,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得该终端设备执行第一方面所述的技术方案中任意一种方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得该处理器执行第一方面所述的技术方案中任意一种方法。
第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在终端设备上运行时,使得该终端设备执行第一方面所述的技术方案中任意一种方法。
附图说明
图1是本申请实施例提供的一例终端设备100的结构示意图;
图2是本申请实施例提供的终端设备100的软件结构框图;
图3是本申请实施例提供的处理网页访问行为的方法的应用场景图;
图4是本申请实施例提供的一例处理网页访问行为的方法的流程示意图;
图5是本申请实施例提供的一例预设的函数集合的动态调整的信令图;
图6是本申请实施例提供的一例计算机设备首次访问目标网页时的信令图交互图;
图7是本申请实施例提供的一例基于滑动窗口的方式确定跟踪模式的流程图;
图8是本申请实施例提供的一例滑动窗口和函数的调用时间的时序示意图;
图9是本申请实施例提供的又一例滑动窗口和函数的调用时间的时序示意图;
图10是本申请实施例提供的又一例滑动窗口和函数的调用时间的时序示意图;
图11是本申请实施例提供的又一例滑动窗口和函数的调用时间的时序示意图;
图12是本申请实施例提供的又一例滑动窗口和函数的调用时间的时序示意图;
图13是本申请实施例提供的又一例滑动窗口和函数的调用时间的时序示意图;
图14是本申请实施例提供的一例用户非首次访问目标网页时的信令交互图;
图15是本申请实施例提供的一例处理网页访问行为的装置结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
以下,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者更多个该特征。
本申请实施例提供的处理网页访问行为的方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
示例性的,图1是本申请实施例提供的一例终端设备100的结构示意图。终端设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universalserial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对终端设备100的具体限定。在本申请另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是终端设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现终端设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现终端设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现终端设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备100充电,也可以用于终端设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他终端设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备100的结构限定。在本申请另一些实施例中,终端设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过终端设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
终端设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。图1中的天线1和天线2的结构仅为一种示例。终端设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在终端设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
终端设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,终端设备100可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,终端设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。终端设备100可以支持一种或多种视频编解码器。这样,终端设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行终端设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储终端设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
终端设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端设备100可以设置至少一个麦克风170C。在另一些实施例中,终端设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端设备100根据压力传感器180A检测所述触摸操作强度。终端设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定终端设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测终端设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,终端设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。终端设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当终端设备100是翻盖机时,终端设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测终端设备100在各个方向上(一般为三轴)加速度的大小。当终端设备100静止时可检测出重力的大小及方向。还可以用于识别终端设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。终端设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端设备100通过发光二极管向外发射红外光。终端设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端设备100附近有物体。当检测到不充分的反射光时,终端设备100可以确定终端设备100附近没有物体。终端设备100可以利用接近光传感器180G检测用户手持终端设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。终端设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。终端设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,终端设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,终端设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,终端设备100对电池142加热,以避免低温导致终端设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,终端设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备100可以接收按键输入,产生与终端设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端设备100的接触和分离。终端设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端设备100中,不能和终端设备100分离。
终端设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明终端设备100的软件结构。
图2是本申请实施例的终端设备100的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供终端设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,终端设备振动,指示灯闪烁等。
Android runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(media libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
为了便于理解,本申请以下实施例将以具有图1和图2所示结构的终端设备为例,结合附图和应用场景,对本申请实施例提供的处理网页访问行为的方法进行具体阐述。
本申请实施例所描述的方案可以应用在如图3所示的场景中,包括端侧的计算机设备和云测的网页服务器,端侧和云侧的设备可以通过网页进行数据交互。需要说明的是,网页通常由超文本标记语言(hypertext markup language,HTML)、层叠样式表(cascadingstyle sheets,CSS)和脚本语言(javascript,JS)组成,网页通常在浏览器中运行,浏览器为网页的运行提供环境,例如为网页提供网络交互、脚本语言解析、页面渲染等功能。
浏览器引擎能够通过JS的函数调用获取浏览器以及浏览器的操作系统的信息,例如获取user agent、platform、cookies enabled、timezone、content language、canvas、list of adblock、do not track、navigator properties等属性(attribute),以及这些属性的相似度比例(similarity ratio)和真值(value)等等。网页服务器能够跟踪浏览器访问网页的行为,通过浏览器引擎获取上述信息并基于这些信息绘制信息指纹(fingerprint),例如,user agent代表浏览器在访问网页时发送的请求中携带的浏览器标识,可以是一段字符,一般包括操作系统标识以及版本标识、浏览器品牌以及版本标识、浏览器内核标识以及版本标识;user agent的区分度比较高,比如在90天内,user agent发生的重复概率为0.45%;此外,user agent相对稳定,一般不会改变;因此,浏览器的信息和操作系统的信息中的部分或者全部能够用于绘制信息指纹(fingerprint),来表征用户的身份,从而导致用户的隐私发生泄漏。
端侧的计算机设备可以通过检测引擎检测网页服务器是否存在跟踪浏览器的行为,其中,检测引擎的检测策略可以从云侧的策略配置服务获取,下面,以图4为例介绍本申请提供的阻止网页服务器绘制信息指纹的方法。
如图4所示,方法400包括:
S410,确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量。
S420,当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理。
S430,当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。
方法400可以由端侧的计算机设备执行。对于绘制信息指纹的网页,其通常会在较短的时间内调用大量的函数,以获取多个信息源,然后再进行哈希处理,生成信息指纹;对于未绘制信息指纹的网页,通常不会在较短的时间内调用大量的函数。这里可以依据预先设置的数量阈值作为判定条件,该数量阈值能够表征跟踪模式下的目标网页对函数的调用量的特征,其可以是用户根据经验设置的,也可以是通过计算机设备对多种场景进行深度学习得到的,本申请实施例对此不做限定。当计算机设备通过浏览器访问网页的时候,计算机设备可以获取访问目标网页的一个时段内浏览器所调用的函数的数量,当一个时段内浏览器访问目标网页所调用的函数的数量大于或者等于数量阈值时,说明浏览器访问的目标网页有较大的概率在收集用户信息绘制指纹,即存在对用户信息进行跟踪的行为,计算机设备则对目标网页的调用函数结果进行反追踪处理,从而避免生成信息指纹,阻止目标网页对用户身份进行追踪,进而有效保护了用户隐私。计算机设备还可以在访问目标网页的一个时段内所调用的函数的数量没有到达数量阈值时,说明浏览器访问的目标网页有较大的概率是未绘制信息指纹的网页,即目标网页没有发生跟踪行为,则可以对目标网页的函数调用结果不进行反跟踪处理,以便于用户能够正常使用网页的功能。本实施例能够在保护用户隐私的同时,有效避免网页功能的丧失,确保了用户体验。
当用户通过浏览器访问网页的时候,计算机设备可以依据网页访问的历史记录来判断所访问的目标网页是否为首次访问的网页,例如网页访问的历史记录中存在该目标网页的网址,则确定该目标网页为非首次访问的网页,如果网页访问的历史记录中并不存在该目标网页的网址,则确定该目标网页为首次访问的网页。
当计算机设备通过浏览器访问目标网页时,无论是否为首次访问该目标网页,均可以统计一个时段内目标网页所调用的函数的数量,然后依据这个数量和预设的数量阈值之间的大小关系来判断是否进行反跟踪处理。可选地,计算机设备可以在目标网页为非首次访问的网页,并且函数调用的数量大于或等于数量阈值的时候进行反跟踪处理,而在首次访问网页时,即使函数调用的数量小于数量阈值,也不进行反跟踪处理。由于首次访问目标网页时,还没有生成对应的用户的信息指纹,因此即使不进行反跟踪处理也不会产生跟踪的行为,因而在首次访问目标网页时不进行反跟踪处理,可以减少无效的反跟踪处理流程,在保证用户隐私的同时还能够节约系统资源。
在一些实施例中,当计算机设备首次访问目标网页时,统计在一段时间内所调用的函数的数量,如果这段时间内所调用的函数的数量大于或等于数量阈值,则生成一个表征产生跟踪行为的函数集合,该函数集合可以包括在这个时段内调用的全部函数,也可以包括这个时段内调用的部分函数,例如将这个时段内所调用的所有函数或者部分函数作为这个函数集合。当计算机设备再次访问目标网页时,如果调用的函数属于首次访问目标网页所生成的函数集合,可以确定此时目标网页存在跟踪行为。因此,本实施例能够更准确地识别出存在跟踪行为的网页。
在一些实施例中,当计算机设备首次访问目标网页的时候,开发者还可以预先输入一个预设的函数集合,表1所示的函数为该预设的函数集合中的函数的一种示例,包括采集的函数调用的信息、调用的函数、函数的参数描述和样例。
表1
Figure BDA0002725998590000131
Figure BDA0002725998590000141
Figure BDA0002725998590000151
上述预设的函数集合可以是开发者依据经验得到的,例如开发者通过采集跟踪模式下网页调用的函数的类型并进行汇总得到的。可选地,该预设的函数集合还可以根据运营管理人员输入的跟踪模式下的函数调用的数量、类型和顺序的变化情况,进行更新,实现动态调整,进一步提高识别存在跟踪行为的网页的准确性。如图5是为一个预设的函数集合的动态调整的信令图。
当计算机设备首次访问目标网页且短时间内调用的函数数量大于或等于预设的数量阈值时,所调用的函数可以属于上述预设的函数集合,也可以不属于预设的函数集合。如果此时调用的函数属于预设的函数集合,计算机设备将这个预设的函数集合作为首次访问目标网页时跟踪模式的判断依据,从而能够更准确地识别出存在跟踪行为的网页。
可选地,计算机设备还可以是将首次访问目标网页时,一段时间内调用的函数的顺序和预设的函数集合中的顺序相同时,确定此时目标网页处于跟踪模式,该方法在函数调用的数量、类型的基础上,还结合了函数的调用顺序作为确定是否存在跟踪行为的依据,因此能够更准确地识别出存在跟踪行为的网页。
可选地,计算机设备还可以记录处于跟踪模式的目标网页的标识,将目标网页标记为可疑的恶意网页,当再次访问目标网页时,计算机设备能够结合所记录的恶意网页的标识来判断目标网页是否存在跟踪行为,从而提高了恶意网页的监控力度,进一步确保了用户隐私的安全性。
在一些实施例中,可以将上述基于预设的函数集合、数量阈值和函数类型确定目标网页的函数调用模式作为检测策略,由策略配置服务来实现检测。图6为一个实施例所示的计算机设备首次访问目标网页时的信令图交互图,图6中的可疑函数可以是预设的函数集合中的函数。计算机设备访问目标网页时,一段时间内的函数调用情况的获取方式可以采用滑动窗口的方式。图7为本申请提供的一种基于滑动窗口确定跟踪模式的流程图。具体的,用户操作终端侧的计算机设备,通过浏览器访问目标网页。当用户第一次访问目标网页时,浏览器引擎根据预设的检测策略设置一个滑动窗口,该滑动窗口为一个时间窗口。浏览器引擎将这个滑动窗口的时长发送至检测引擎。检测引擎基于这个滑动窗口的时长设置一个相同时长的滑动检测窗口。如果浏览器发现目标网页调用了上述预设的函数集合中的函数,则通知检测引擎,检测引擎则根据上述滑动检测窗口进行检测。如果检测引擎检测到目标网页在这个滑动检测窗口的时长内所调用的函数数量大于或等于数量阈值,则确定目标网页的函数调用的模式为满足跟踪模式的判定条件,此时目标网页存在跟踪行为;如果滑动检测窗口的时长内目标网页所调用的函数数量小于数量阈值,则目标网页的函数调用的模式不满足跟踪模式的判定条件,此时目标网页不存在跟踪行为。可选的,当确定目标网页存在跟踪行为时,计算机设备还可以记录该目标网页的标识,所记录的信息格式可以如表2所示的示例。
表2
Figure BDA0002725998590000161
此处以一个具体的示例来说明采用滑动窗口确定函数的调用模式的具体过程。当浏览器引擎在渲染页面时,如果本地不存在检测到预设的函数集合中的函数被调用的记录时,则准备启动检测;当浏览器引擎检测到函数集合中的一个函数被调用时,则通知检测引擎,检测引擎开始创建一个滑动窗口,以滑动窗口为1秒,数量阈值是5为例,这个预设的函数集合中的第一个函数被调用的时间记为0毫秒(ms),如图8所示,横轴为时间轴,虚线框在横轴的长度为基于时间的滑动窗口的时长的示意图。在图8中,函数集合中被第一个调用的函数记为函数A。当检测引擎检测到函数集合中第二个被调用的函数B时,将函数B的调用时间和函数A的调用时间进行对比,如果时间间隔没有超过1秒,且滑动窗口中只有一个函数A,并没有超过5个的数量阈值,则直接把函数B加入此时滑动窗口所对应的函数集合(即,该滑动窗口中目标网页调用的函数数量加1),如图9所示。继续依次检测处于函数集合中的函数C、D、E和F等函数。如图10所示,如果函数C和函数D的调用时间与函数A的间隔没有超过1秒,则将函数C和D加入这个函数集合口,此时该函数集合中的函数的数量也没有超过5个,不能确定网页存在跟踪行为。当函数E被调用的时候,函数E和函数A被调用的时间间隔为1100毫秒,超过了1秒,如图11所示,函数E则不会被纳入这个函数集合。这时,当前的滑动窗口则不再有效,可以将滑动窗口往后移动,把函数A移出这个函数集合,以函数B的调用时间作为新的滑动窗口的起始点,这时,函数E和函数B被调用的时间间隔没有超过1秒,则把函数E添加至该函数集合中,如图12所示。当再下一个函数F被调用的时候,和函数B的调用时间间隔为950毫秒,小于1秒,则将函数F添加该函数集合中。这时,该函数集合中的函数数量到达5个,达到了数量阈值,如图13所示,此时可以确定网页存在跟踪行为,函数调用的模式为跟踪模式。采用上述滑动窗口的方式,能够基于检测到的处于预设的函数集合中的函数触发跟踪行为的检测,避免了过多无效的检测,因此能够合理节约计算资源。
在一些实施例中,当计算机设备再次访问目标网页时,一段时间内调用的函数数量超过数量阈值时,根据这个时间段内调用的函数的类型作为确定跟踪模式的依据,例如是将再次访问和首次访问目标网页时所调用的函数类型进行对比,如果一致,或者相似度大于一定的阈值,可以确定此时网页存在跟踪行为;如果不一致或者相似度小于一定的阈值,则可以确定不存在跟踪行为。该方法在网页调用的函数的数量基础上,结合了函数调用的类型来作为确定跟踪行为的依据,能够更准确的识别出存在跟踪行为的网页。如图14所示,图14为用户非首次访问目标网页时的信令交互图,图14中的可疑网址可以是存在跟踪行为时所记录标识的网址,可疑函数可以表征具有跟踪行为的函数,例如首次访问具有跟踪行为的目标网页所生成的函数集合中的函数。可选地,本实施例中的函数的调用模式也可以采用如图8至图13所示的滑动窗口方式进行确定,其实现原理和技术效果不再赘述。
可选地,当计算机设备再次访问目标网页,且处于跟踪模式时,所调用的函数数量为多个。当在这个时段内调用的函数的顺序和首次访问所生成的函数集合中函数调用的顺序相同时,即所调用的函数的序列相同,则可以确定此时目标网页存在跟踪行为,计算机设备执行反跟踪处理。该方法在函数调用的数量、类型的基础上,融入了函数的调用顺序作为确定跟踪行为的依据,能够更准确地识别出存在跟踪行为的网页。
可选地,计算机设备在访问目标网页且发生跟踪行为的时候,将目标网页的标识记录下来,作为具有跟踪用户行为的恶意网页的记录。该目标网页的标识可以是网页的统一资源定位(uniform resource locator,URL)地址或者网站名称等。当计算机设备在访问目标网页时,可以先判断目标网页是不是记录了标识的网页,即判断当前访问的这个网页是否为具有跟踪记录的恶意网页,如果不存在这样的标识,那么确定不进行反跟踪处理;如果具有这样的标识,则认为该网页为存在跟踪行为的恶意网页,此时可以进一步依据一段时间内调用的函数数量、函数类型和/或函数调用的顺序,确定是否需要进行反跟踪处理,由此结合了所记录的恶意网页的标识来判断当前的网页调用行为,能够更准确地识别出存在跟踪行为的网页。
可选地,本申请实施例所涉及的反跟踪处理可以包括采用随机数进行加噪,也可以称为加熵,即对函数调用的结果加入随机噪声来增大信息区分度从而阻止网页跟踪,该方法能够有效实现阻止网页跟踪用户信息且易于实现。可选地,反跟踪处理也可以是加入其他的噪声,例如高斯白噪声等,本申请实施例对此也不做限定,只要是能够增大函数调用的结果的信息区分度即可,就能够阻止网页跟踪,起到保护用户隐私的作用。
上文详细介绍了本申请提供的处理网页访问行为的方法的示例。可以理解的是,相应的装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请可以根据上述方法示例对处理网页访问行为的装置进行功能模块的划分,例如,可以将各个功能划分为各个功能模块,也可以将两个或两个以上的功能集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图15示出了本申请提供的一种处理网页访问行为的装置的结构示意图。装置1500包括确定模块1501和反跟踪模块1502。
确定模块1501,用于确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量。
反跟踪模块1502,用于当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理;或者,当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。
可选地,所述第一时段内的所述目标网页为非首次被访问的网页。
可选地,所述目标网页在所述第一时段内调用的函数属于第一函数集合。
可选地,所述第一数量为N,N为大于1的正整数,所述目标网页在所述第一时段内调用的N个函数的顺序与所述N个函数在所述第一函数集合中的顺序相同。
可选地,确定模块1501还用于,确定第二数量,所述第二数量为所述目标网页在第二时段内调用的函数的数量,所述第二时段位于所述第一时段之前,所述第二时段内的所述目标网页为首次被访问的网页。
可选地,确定模块1501还用于,当所述第二数量大于等于所述数量阈值时,生成所述第一函数集合,所述第一函数集合包括所述目标网页在所述第二时段内调用的全部函数或部分函数。
可选地,所述目标网页在第二时段内调用的函数属于第二函数集合,所述第二函数集合为预设的函数集合。
可选地,装置1500还包括接收模块和更新模块,所述更新模块用于:接收更新信息,所述更新模块用于:根据所述更新信息更新所述第二函数集合,所述更新信息用于更新所述第二函数集合。
可选地,所述第一函数集合中的函数的顺序与所述目标网页在所述第二时段内调用的函数的顺序相同。
可选地,所述第一时段的起始时刻为调用第一函数的时刻,所述第一函数属于所述第一函数集合,所述第一函数集合还包括第二函数,所述第二函数被调用的时刻位于所述第一函数被调用的时刻之前,所述第二函数被调用的时刻为第二时段的起始时刻,所述第二时段的时长与所述第一时段的时长相同,所述第一函数被调用的时刻与第二函数被调用的时刻的间隔大于等于所述第二时段的时长,或者,所述第一函数被调用的时刻与第二函数被调用的时刻的间隔小于所述第二时段的时长,并且,所述第二时段内所述第一函数集合中的函数被调用的数量小于所述数量阈值。
可选地,装置1500还包括记录模块,所述记录模块用于,当所述第二数量大于等于所述数量阈值时,记录所述目标网页的标识,所述标识用于确定所述第一时段内的所述目标网页为非首次被访问的网页。
可选地,所述反跟踪处理包括:采用随机数加噪。
装置1500执行处理网页访问行为的方法的具体方式以及产生的有益效果可以参见方法实施例中的相关描述。
本申请实施例还提供了一种计算机设备。本实施例提供的计算机设备可以是图1所示的终端设备100,用于执行上述处理网页访问行为的方法,因此可以达到与上述实现方法相同的效果。在采用集成的单元的情况下,终端设备可以包括处理模块、存储模块和通信模块。其中,处理模块可以用于对终端设备的动作进行控制管理,例如,可以用于支持终端设备执行显示单元、检测单元和处理单元执行的步骤。存储模块可以用于支持终端设备执行存储程序代码和数据等。通信模块,可以用于支持终端设备与其他设备的通信。
其中,处理模块可以是处理器或控制器。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digital signal processing,DSP)和微处理器的组合等等。存储模块可以是存储器。通信模块具体可以为射频电路、蓝牙芯片、Wi-Fi芯片等与其他终端设备交互的设备。
在一个实施例中,当处理模块为处理器,存储模块为存储器时,本实施例所涉及的计算机设备可以为具有图1所示结构的终端设备。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行上述任一实施例所述的处理网页访问行为的方法。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的处理网页访问行为的方法。
其中,本实施例提供的电子设备、计算机可读存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (24)

1.一种处理网页访问行为的方法,其特征在于,包括:
确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量;
当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理;或者,
当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。
2.根据权利要求1所述的方法,其特征在于,
所述第一时段内的所述目标网页为非首次被访问的网页。
3.根据权利要求2所述的方法,其特征在于,所述目标网页在所述第一时段内调用的函数属于第一函数集合。
4.根据权利要求3所述的方法,其特征在于,所述第一数量为N,N为大于1的正整数,所述目标网页在所述第一时段内调用的N个函数的顺序与所述N个函数在所述第一函数集合中的顺序相同。
5.根据权利要求3或4所述的方法,其特征在于,还包括:
确定第二数量,所述第二数量为所述目标网页在第二时段内调用的函数的数量,所述第二时段位于所述第一时段之前,所述第二时段内的所述目标网页为首次被访问的网页;
当所述第二数量大于等于所述数量阈值时,生成所述第一函数集合,所述第一函数集合包括所述目标网页在所述第二时段内调用的全部函数或部分函数。
6.根据权利要求5所述的方法,其特征在于,所述目标网页在第二时段内调用的函数属于第二函数集合,所述第二函数集合为预设的函数集合。
7.根据权利要求6所述的方法,其特征在于,还包括:
接收更新信息,所述更新信息用于更新所述第二函数集合;
根据所述更新信息更新所述第二函数集合。
8.根据权利要求5至7中任一项所述的方法,其特征在于,所述第一函数集合中的函数的顺序与所述目标网页在所述第二时段内调用的函数的顺序相同。
9.根据权利要求5至8中任一项所述的方法,其特征在于,当所述第二数量大于等于所述数量阈值时,所述方法还包括:
记录所述目标网页的标识,所述标识用于确定所述第一时段内的所述目标网页为非首次被访问的网页。
10.根据权利要求3至9中任一项所述的方法,其特征在于,所述第一时段的起始时刻为调用第一函数的时刻,所述第一函数属于所述第一函数集合,所述第一函数集合还包括第二函数,所述第二函数被调用的时刻位于所述第一函数被调用的时刻之前,所述第二函数被调用的时刻为第二时段的起始时刻,所述第二时段的时长与所述第一时段的时长相同,
所述第一函数被调用的时刻与第二函数被调用的时刻的间隔大于等于所述第二时段的时长,或者,
所述第一函数被调用的时刻与第二函数被调用的时刻的间隔小于所述第二时段的时长,并且,所述第二时段内所述第一函数集合中的函数被调用的数量小于所述数量阈值。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述反跟踪处理包括:采用随机数加噪。
12.一种处理网页访问行为的装置,其特征在于,包括:
确定模块,用于确定第一数量,所述第一数量为目标网页在第一时段内调用的函数的数量;
反跟踪模块,用于当所述第一数量大于等于数量阈值时,对所述目标网页调用函数的结果进行反跟踪处理;或者,当所述第一数量小于数量阈值时,确定不对所述目标网页调用函数的结果进行反跟踪处理。
13.根据权利要求12所述的装置,其特征在于,
所述第一时段内的所述目标网页为非首次被访问的网页。
14.根据权利要求13所述的装置,其特征在于,所述目标网页在所述第一时段内调用的函数属于第一函数集合。
15.根据权利要求14所述的装置,其特征在于,所述第一数量为N,N为大于1的正整数,所述目标网页在所述第一时段内调用的N个函数的顺序与所述N个函数在所述第一函数集合中的顺序相同。
16.根据权利要求14或15所述的装置,其特征在于,所述确定模块还用于:
确定第二数量,以及当所述第二数量大于等于所述数量阈值时,生成所述第一函数集合,所述第二数量为所述目标网页在第二时段内调用的函数的数量,所述第二时段位于所述第一时段之前,所述第二时段内的所述目标网页为首次被访问的网页,所述第一函数集合包括所述目标网页在所述第二时段内调用的全部函数或部分函数。
17.根据权利要求16所述的装置,其特征在于,所述目标网页在第二时段内调用的函数属于第二函数集合,所述第二函数集合为预设的函数集合。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括接收模块和更新模块,
所述接收模块用于:接收更新信息,所述更新信息用于更新所述第二函数集合;
所述更新模块用于:根据所述更新信息更新所述第二函数集合。
19.根据权利要求16至18中任一项所述的装置,其特征在于,所述第一函数集合中的函数的顺序与所述目标网页在所述第二时段内调用的函数的顺序相同。
20.根据权利要求16至19中任一项所述的装置,其特征在于,所述装置还包括记录模块,所述记录模块用于:
当所述第二数量大于等于所述数量阈值时,记录所述目标网页的标识,所述标识用于确定所述第一时段内的所述目标网页为非首次被访问的网页。
21.根据权利要求14至20中任一项所述的装置,其特征在于,所述第一时段的起始时刻为调用第一函数的时刻,所述第一函数属于所述第一函数集合,所述第一函数集合还包括第二函数,所述第二函数被调用的时刻位于所述第一函数被调用的时刻之前,所述第二函数被调用的时刻为第二时段的起始时刻,所述第二时段的时长与所述第一时段的时长相同,
所述第一函数被调用的时刻与第二函数被调用的时刻的间隔大于等于所述第二时段的时长,或者,
所述第一函数被调用的时刻与第二函数被调用的时刻的间隔小于所述第二时段的时长,并且,所述第二时段内所述第一函数集合中的函数被调用的数量小于所述数量阈值。
22.根据权利要求12至21中任一项所述的装置,其特征在于,所述反跟踪处理包括:采用随机数加噪。
23.一种计算机设备,其特征在于,其特征在于,包括:处理器、存储器和接口;
所述处理器、存储器和接口相互配合,所述处理器用于执行如权利要求1至11中任一项所述的方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行权利要求1至11中任一项所述的方法。
CN202011102900.9A 2020-10-15 2020-10-15 处理网页访问行为的方法和装置 Pending CN114372220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011102900.9A CN114372220A (zh) 2020-10-15 2020-10-15 处理网页访问行为的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011102900.9A CN114372220A (zh) 2020-10-15 2020-10-15 处理网页访问行为的方法和装置

Publications (1)

Publication Number Publication Date
CN114372220A true CN114372220A (zh) 2022-04-19

Family

ID=81137772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011102900.9A Pending CN114372220A (zh) 2020-10-15 2020-10-15 处理网页访问行为的方法和装置

Country Status (1)

Country Link
CN (1) CN114372220A (zh)

Similar Documents

Publication Publication Date Title
CN113704014B (zh) 日志获取系统、方法、电子设备及存储介质
US11868463B2 (en) Method for managing application permission and electronic device
CN113722058B (zh) 一种资源调用方法及电子设备
CN113704205B (zh) 日志存储的方法、芯片、电子设备和可读存储介质
CN114553814B (zh) 处理推送消息的方法和装置
CN110751503B (zh) 广告处理方法和电子设备
CN113254409A (zh) 文件共享方法、系统及相关设备
CN114363462A (zh) 一种界面显示方法及相关装置
CN111615820B (zh) 通过向grs服务器发送关键值进行域名解析的方法及设备
CN113641271A (zh) 应用窗口的管理方法、终端设备及计算机可读存储介质
CN115438354A (zh) 一种用户隐私保护方法及装置
CN112416984A (zh) 一种数据处理方法及其装置
CN115022982B (zh) 多屏协同无感接入方法、电子设备及存储介质
CN113380240B (zh) 语音交互方法和电子设备
CN113407300B (zh) 应用误杀评估方法及相关设备
CN114691248B (zh) 显示虚拟现实界面的方法、装置、设备和可读存储介质
CN114971107A (zh) 一种隐私风险反馈方法、装置及第一终端设备
CN114911400A (zh) 分享图片的方法和电子设备
CN114079642A (zh) 一种邮件处理方法及电子设备
CN114372220A (zh) 处理网页访问行为的方法和装置
CN112286596A (zh) 消息显示方法及电子设备
CN116048831B (zh) 一种目标信号处理方法和电子设备
CN117133311B (zh) 音频场景识别方法及电子设备
CN114006976B (zh) 一种界面显示方法及终端设备
CN114077323B (zh) 电子设备的触摸屏防误触方法、电子设备及芯片系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination