CN111783063A - 一种操作的验证方法和装置 - Google Patents

一种操作的验证方法和装置 Download PDF

Info

Publication number
CN111783063A
CN111783063A CN202010538272.2A CN202010538272A CN111783063A CN 111783063 A CN111783063 A CN 111783063A CN 202010538272 A CN202010538272 A CN 202010538272A CN 111783063 A CN111783063 A CN 111783063A
Authority
CN
China
Prior art keywords
data
verification
target
page
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010538272.2A
Other languages
English (en)
Inventor
张伟望
覃建策
田本真
陈邦忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Perfect World Beijing Software Technology Development Co Ltd
Original Assignee
Perfect World Beijing Software Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Perfect World Beijing Software Technology Development Co Ltd filed Critical Perfect World Beijing Software Technology Development Co Ltd
Priority to CN202010538272.2A priority Critical patent/CN111783063A/zh
Priority to PCT/CN2020/112684 priority patent/WO2021248707A1/zh
Publication of CN111783063A publication Critical patent/CN111783063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/36User authentication by graphic or iconic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种操作的验证方法和装置,其中,该方法包括:获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据;根据第一数据对目标对象进行验证得到第一验证结果,并根据第二数据对目标验证操作进行验证得到第二验证结果;根据第一验证结果和第二验证结果确定目标验证操作对应的目标验证结果,其中,目标验证结果用于指示目标验证操作是否通过验证。本申请解决了相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。

Description

一种操作的验证方法和装置
技术领域
本申请涉及计算机领域,尤其涉及一种操作的验证方法和装置。
背景技术
验证码作为用户认证的一种有效手段,已经被业界广泛采用,来抵御互联网黑产的攻击。其主要原理在于,黑产通常需要通过大量重复性的访问来获取利益,而验证码可以有效的增加每次访问的成本。但是随着近年来深度学习的崛起,利用计算机自动识别网站验证码变得越来越容易。很多验证码的形式都可以有相应成熟的深度学习模型解决方案,这大大降低了黑产破解图片或文字验证码的难度,也使得验证结果的准确率大大降低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种操作的验证方法和装置,以至少解决相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种操作的验证方法,包括:
获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
根据本申请实施例的另一方面,还提供了一种操作的验证装置,包括:
第一获取模块,用于获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
第一验证模块,用于根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第一确定模块,用于根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,验证页面用于对目标对象在验证页面上执行的目标验证操作进行验证,目标时间段包括从显示验证页面到结束执行目标验证操作的时间,第一数据是目标对象在开始执行目标验证操作之前产生的浏览行为数据,第二数据是目标对象执行目标验证操作产生的验证行为数据;根据第一数据对目标对象进行验证得到第一验证结果,并根据第二数据对目标验证操作进行验证得到第二验证结果;根据第一验证结果和第二验证结果确定目标验证操作对应的目标验证结果,其中,目标验证结果用于指示目标验证操作是否通过验证的方式,通过从显示验证页面开始获取验证页面上产生的行为数据,将验证页面上产生的行为数据划分为浏览行为和验证行为两个维度分别进行验证得到各自的验证结果,再将两个维度的验证结果进行融合得到目标验证操作的最终验证结果,达到了提高验证通过难度的目的,从而实现了提高对验证页面上执行的验证操作进行验证的准确率的技术效果,进而解决了相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的操作的验证方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的操作的验证方法的流程图;
图3是根据本申请可选的实施方式的一种操作的验证过程的示意图;
图4是根据本申请可选的实施方式的模型训练过程的示意图;
图5是根据本申请可选实施例的一种基于用户行为的人机验证方法的示意图;
图6是根据本申请实施例的一种可选的操作的验证装置的示意图;
图7是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种操作的验证的方法实施例。
可选地,在本实施例中,上述操作的验证方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的操作的验证方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的操作的验证方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的操作的验证方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
步骤S204,根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
步骤S206,根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
通过上述步骤S202至步骤S206,通过从显示验证页面开始获取验证页面上产生的行为数据,将验证页面上产生的行为数据划分为浏览行为和验证行为两个维度分别进行验证得到各自的验证结果,再将两个维度的验证结果进行融合得到目标验证操作的最终验证结果,达到了提高验证通过难度的目的,从而实现了提高对验证页面上执行的验证操作进行验证的准确率的技术效果,进而解决了相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。
在步骤S202提供的技术方案中,验证页面用于对目标对象在验证页面上执行的目标验证操作进行验证。验证页面可以是显示了验证码的页面,比如:应用程序的登录或注册页面上显示了验证码,则该登录或注册页面可以称为验证页面,或者,用户在登录或者注册页面进行了登录或者注册操作后跳转到一个新的页面,页面上显示了验证码用于对用户的操作进行验证,该新跳转的页面也可以称为验证页面。
可选地,在本实施例中,目标对象可以但不限于指对验证页面执行操作的对象,比如:注册用户使用的注册帐号,非注册用户使用的临时帐号等等。
可选地,在本实施例中,上述验证码可以但不限于包括:滑块验证码,图片选择验证码,文字点选验证码,语义理解的问答题验证码等等任何形式的用于对操作进行人机验证的验证码。
可选地,在本实施例中,获取第一数据和第二数据的方式可以但不限于包括以下之一:
方式一,采集目标时间段内目标对象在显示的验证页面上产生的全部行为数据,再根据开始执行目标验证操作的时间将采集到的行为数据划分为上述第一数据和第二数据。
方式二,从显示验证页面开始采集验证页面上执行操作的行为数据作为第一数据,直至检测到开始执行目标验证操作。再从检测到开始执行目标验证操作开始采集验证页面上执行操作的行为数据作为第二数据,直至结束执行目标验证操作。
可选地,在本实施例中,第一数据是目标对象在开始执行目标验证操作之前产生的浏览行为数据,第二数据是目标对象执行目标验证操作产生的验证行为数据。行为数据可以但不限于为从打开验证页面到完成验证的时间段内目标对象在验证页面上执行任何类型的操作产生的数据。
可选地,在本实施例中,操作类型可以但不限于包括:鼠标的移动,点击,移出边界,移入边界,页面滚动,键盘的输入等,移动端还可以包含陀螺仪的变化等。记录的行为数据还可以同时包括操作发生时刻的时间戳。行为数据还包括目标对象开始验证的时间点,可以根据该时间对行为数据序列进行切割,分为两个部分,其一为用于表示页面浏览行为的浏览行为数据作为第一数据,其二为用于表示验证码操作行为的验证行为数据作为第二数据。
可选地,在本实施例中,为了增加前端破解的难度,采集第一数据和第二数据的前端代码上可以增加复杂的前端代码混淆。
在步骤S204提供的技术方案中,分别对第一数据和第二数据进行验证,第一数据用于对目标对象的对象类型进行验证,第二数据用于对目标验证操作是否通过进行验证。
可选地,在本实施例中,第一数据是验证开始阶段之前的行为数据,具有较大的随机性,不容易影响操作之间相似性的判断,不宜用作对目标验证操作进行验证的数据,但是开始阶段之前的行为数据能够较好地体现出目标对象是真实用户还是机器人入侵,因此可以用作对象类型的验证。而执行验证操作时的动作,如拖动滑块,点击文字等,具有很明确的范式结构,比较适用于进行操作之间相似性的判断,将验证操作时产生的第二数据用作操作相似性的验证。
在步骤S206提供的技术方案中,可以将第一验证结果和第二验证结果进行融合得到目标验证结果。
可选地,在本实施例中,验证结果的融合方式可以但不限于包括:方式一,对第一验证结果和第二验证结果进行标准化处理后进行求和,取平均数或者加权求和等运算,根据运算结果判定目标验证操作是否通过验证。方式二,将第一验证结果和第二验证结果输入到训练好的分类模型中自动对验证结果进行融合输出目标验证操作是否通过验证的最终结果。
作为一种可选的实施例,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
S11,对所述第一数据进行特征提取,得到所述第一数据对应的数据特征;
S12,对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果。
可选地,在本实施例中,可以但不限于从第一数据中提取出数据特征从而体现出第一数据的属性特征,再按照得到的数据特征确定目标对象所属于的目标对象类型。
可选地,在本实施例中,划分的对象类型可以但不限于包括正常用户和攻击者等等。
可选地,在本实施例中,对数据特征进行分类的方式可以但不限于包括:查找具有对应关系的特征和对象类型得到数据特征对应的目标对象类型,使用训练后的模型对数据特征进行自动分类等等。
作为一种可选的实施例,对所述第一数据进行特征提取,得到所述第一数据对应的数据特征包括:
S21,按照数据的产生方式将所述第一数据划分为多种数据类型的数据;
S22,分别对所述多种数据类型的数据中每种数据类型的数据进行特征提取,得到所述每种数据类型的数据对应的数据特征;
对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果包括:
S23,分别对所述每种数据类型的数据对应的数据特征进行分类,得到所述每种数据类型的数据对应的对象类型;
S24,对所述每种数据类型的数据对应的对象类型进行融合,得到所述目标对象类型。
可选地,在本实施例中,对于不同数据类型的第一数据可以但不限于分别进行特征提取和分类,再对得到的不同分类结果进行融合得到第一验证结果。不同数据类型的数据可以根据数据的特点设定不同的分类标准,从而提高分类的准确率。
可选地,在本实施例中,按照数据的产生方式可以但不限于将第一数据划分为鼠标轨迹数据和键盘输入数据等等。
可选地,在本实施例中,对每种数据类型的数据对应的对象类型进行融合的方式可以但不限于包括加权求和,取平均数等等运算,再根据运算结果所落入的阈值范围确定目标对象类型。
作为一种可选的实施例,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
S31,将所述第一数据输入目标特征分类模型,其中,所述目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的;
S32,获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果,其中,所述行为数据样本所标注的对象类型中包括所述目标对象类型。
可选地,在本实施例中,可以但不限于通过模型训练得到目标特征分类模型来自动检测第一数据所对应的目标对象类型。
可选地,在本实施例中,目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的。目标特征分类模型可以但不限于包括深度神经网络dnn,卷积神经网络cnn,循环神经网络rnn等结构。
作为一种可选的实施例,获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果包括:
S41,通过特征提取层对所述第一数据进行特征提取,得到数据特征,其中,所述目标特征分类模型包括依次连接的第一输入层、所述特征提取层、分类层和第一输出层,所述第一输入层用于接收所述第一数据;
S42,通过所述分类层对所述数据特征进行分类,得到所述数据特征属于多个对象类型中每种对象类型的概率;
S43,通过所述第一输出层根据所述数据特征属于多个对象类型中每种对象类型的概率,从所述多个对象类型中确定所述目标对象类型,并输出所述目标对象类型。
可选地,在本实施例中,目标特征分类模型可以但不限于包括依次连接的第一输入层、特征提取层、分类层和第一输出层,其中,第一输入层用于接收第一数据,特征提取层用于对第一数据进行特征提取得到数据特征,分类层用于对数据特征进行分类,得到分类结果,第一输出层用于根据分类层得到的分类结果输出目标对象类型。
可选地,在本实施例中,分类层得到的分类结果可以但不限于是数据特征对应多个对象类型中每种对象类型的概率。第一输出层根据每种对象类型的概率对目标对象类型进行判定。比如:可以设定概率阈值,将高于概率阈值的最高概率对应的对象类型作为目标对象类型。
可选地,在本实施例中,可以针对不同目标验证操作的类型,训练不同的目标特征分类模型。
可选地,在本实施例中,上述特征提取层可以但不限于采用长短期记忆网络(LSTM)的模型结构,LSTM的待调优的超参数可以但不限于包括:LSTM的细胞状态大小、输出长度、L1及L2正则化系数、优化算法、学习率等。
可选地,在本实施例中,上述分类层可以但不限于采用逻辑回归(LR)的模型网络。
在一个可选的实施方式中,根据第一数据对目标对象进行验证得到第一验证结果的过程可以但不限于包括以下步骤:
步骤A,对第一数据进行采样,其中连续的鼠标移动轨迹,连续的页面滚动可以按固定时间间隔采样(比如:鼠标轨迹固定采样间隔可以设置为100ms)。键盘输入选取其中连续输入最长的一段作为代表,如果超过最大长度,则随机截取其中连续的一段输入(比如:键盘输入序列的最大输入长度可以设置为64)。
步骤B,将鼠标轨迹数据和键盘输入行为序列数据分别输入两个不同的深度模型,进行自动的特征提取。其中,可以但不限于对鼠标轨迹数据和键盘输入行为序列数据进行标准化处理后输入到模型中,鼠标轨迹数据的每一帧被表示为一个特征向量,该向量可以但不限于包括四位,第一位表示操作类型,可以为:点击,按下,抬起,移动,移出边界,移入边界,滚动等等。第二位和第三位分别为鼠标所在的x,y轴坐标。第四位为操作发生的时间。键盘输入行为序列数据的每一帧也可以被表示为一个特征向量,该向量可以但不限于包括两位,第一位表示键盘输入的字母或符号对应的ascii码。第二位表示键盘输入对应的时间。
步骤C,对两个特征提取模型输出的结果进行加权求和来得到操作可能来自攻击者的概率,可以使用1代表攻击者,0代表普通用户,0.5作为中间阈值,将概率大于0.5的分类为攻击者,概率小于0.5的分类为普通用户。
作为一种可选的实施例,根据所述第二数据对所述目标验证操作进行验证得到第二验证结果包括:
S51,确定所述第二数据是否符合所述验证页面对应的验证条件;
S52,在确定所述第二数据不符合所述验证条件的情况下,确定所述第二验证结果用于指示所述目标验证操作未通过验证;
S53,在确定所述第二数据符合所述验证条件的情况下,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果,其中,所述目标数据是从已通过验证的验证操作中提取的数据。
可选地,在本实施例中,首先对第二数据进行规则验证,即确定第二数据是否符合验证条件,如滑块的拖动轨迹应当与滑块放置位置有关,文字点击的位置应当与文字在图片中的相对位置相匹配。如果规则验证失败,则直接将目标验证操作判定为攻击者的攻击行为。
可选地,在本实施例中,在第二数据是否符合验证条件的验证中可以加入一定的误差容忍阈值,以便应对实际生产环境中可能出现的数据采集误差,从而提高验证结果的准确率。
可选地,在本实施例中,对于确定为符合验证条件的第二数据,再根据其与从已通过验证的验证操作中提取的目标数据之间的相似度确定该目标验证操作是否通过验证,从而得到第二验证结果。
作为一种可选的实施例,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果包括:
S61,对所述第二数据进行编码,得到编码数据;
S62,将所述编码数据输入目标单分类模型,其中,所述目标单分类模型是使用所述目标数据对初始单分类模型进行训练得到的;
S63,获取所述目标单分类模型输出的验证标识作为所述第二验证结果,其中,所述验证标识用于指示所述编码数据是否通过验证。
可选地,在本实施例中,可以但不限于通过训练后的目标单分类模型自动检测第二数据与历史目标数据之间的相似度,从而自动判定第二数据是否通过验证。
可选地,在本实施例中,可以但不限于使用自编码器对第二数据进行编码。比如:4层的自编码器,其中,该自编码器包括的三个大小分别为128,64,128的隐层。其中64为最终编码的表示长度。此处自编码器的深度,和隐层的大小为可以调优的超参数,此处给出的是实际使用的一个例子,本申请对此不作限定。
可选地,在本实施例中,在对第二数据进行编码之前可以先对第二数据进行预处理。例如:首先去除第二数据中非鼠标操作类型的数据,再去除数据中表示操作类型的字段,只保留鼠标坐标及时间字段。将上述序列按均匀时间间隔采样至100个坐标时间对,得到一个长度为300的向量作为预处理后的第二数据进行编码。
可选地,在本实施例中,上述目标单分类模型可以但不限于使用SVDD(Supportvector domain description,支持向量数据描述)模型的模型结构。
可选地,在本实施例中,上述SVDD模型的训练数据(即目标数据)可以全部来自于正常用户数据(即已通过验证的验证操作),数据易于获得,数据标签准确度高,可以直接进行线上的数据集扩充和模型迭代。
可选地,在本实施例中,上述目标数据可以但不限于包括以下来源:内网IP段所产生的数据,IP白名单及用户白名单所产生的数据,也可以通过分析网站每日流量的规律,找到流量正常的自然日,并把所有数据作为正常用户数据。前述流量正常是指没有突发的流量高峰,流量符合长期的规律性,如早上和傍晚出现峰值,半夜出现低谷等。
可选地,在本实施例中,上述SVDD模型待训练的超参数可以但不限于包括:核函数的选择,软间隔系数等。上述核函数还可以包括二级超参数,如系数、指数等。
通过上述过程,对用户验证码行为使用异常检测模型进行验证,异常检测模型为单分类模型,因此只需要一类数据进行训练即可。因为正常用户数据非常容易获得,而攻击者的数据难以标记,所以使用该模型分类不存在数据收集上的难题,从而降低了模型训练的难度,使用的训练数据更加准确也提高了模型训练的精度。
作为一种可选的实施例,获取所述目标单分类模型输出的验证标识作为所述第二验证结果包括:
S71,通过单分类层确定所述编码数据与所述目标数据之间的相似度,其中,所述目标单分类模型包括依次连接的第二输入层,所述单分类层和第二输出层,所述第二输入层用于接收所述编码数据;
S72,通过所述第二输出层确定所述相似度与目标相似度之间的关系;
S73,在所述相似度高于所述目标相似度的情况下,通过所述第二输出层输出第一验证标识,其中,所述第一验证标识用于指示所述编码数据通过验证;
S74,在所述相似度不高于所述目标相似度的情况下,通过所述第二输出层输出第二验证标识,其中,所述第二验证标识用于指示所述编码数据未通过验证。
可选地,在本实施例中,目标单分类模型包括依次连接的第二输入层,单分类层和第二输出层,第二输入层用于接收编码数据,单分类层用于确定编码数据与目标数据之间的关系,可以给根据编码数据和目标数据之间的相似度为编码数据确定一个分值,可以分值越高表示相似度越高,也可以分值越低表示相似度越高。第二输出层用于根据单分类层的输出判定编码数据是否通过验证,根据分值确定相似度是否高于目标相似度,对于高于目标相似度的编码数据确定其通过验证,对于低于目标相似度的编码数据确定其未通过验证。
比如:普通用户行为分类标签为0,对应模型的唯一分类。选取分值阈值为1,分值大于1表示编码数据与目标数据的相似度不高于目标相似度,将其判定为不属于普通用户行为,即判定为攻击者伪造数据,而分值小于1表示编码数据与目标数据的相似度高于目标相似度,则判将其定为普通用户数据。
在一个可选的实施方式中,提供了一种对用户在验证页面上的操作进行验证的方式,图3是根据本申请可选的实施方式的一种操作的验证过程的示意图,如图3所示,该过程可以但不限于包括以下步骤:
步骤S302,获取用户在验证页面上的操作产生的用户行为数据。
步骤S304,将获取到的数据切分为页面浏览行为作为第一数据和验证码操作行为作为第二数据。
步骤S306,使用LSTM+LR模型分类页面浏览行为,得到分类结果。
步骤S308,使用自编码器+SVDD单分类模型处理验证码操作行为,得到分类结果。
步骤S310,融合上述两个结果得到最终判断。
在上述过程中,对于用户或攻击者提交的验证行为数据,基于深度模型对行为数据特征进行自动提取,提高了特征提取的效率,也提高了验证的准确性。
作为一种可选的实施例,在对所述第二数据进行编码,得到所述编码数据之后,还包括:
S81,确定所述编码数据在多个数据类型中所对应的目标数据类型,其中,所述多个数据类型是对历史编码数据进行聚类得到的;
S82,获取产生属于所述目标数据类型的数据对应的对象的访问频率,其中,所述访问频率用于指示产生属于所述目标数据类型的数据对应的对象访问所述验证页面的频率;
S83,在所述访问频率高于目标频率的情况下,将所述目标对象的对象标识确定为可疑标识;
S84,在所述对象标识被确定为所述可疑标识的次数高于目标次数的情况下,上调使用所述目标单分类模型对来自所述对象标志的数据进行处理时的所述目标相似度。
可选地,在本实施例中,多个数据类型是对历史编码数据进行聚类得到的。比如:可以收集一定时间的用户数据,然后使用mean-shift算法对数据进行聚类,得到n个聚类中心,其中,n取决于mean-shift算法的窗口大小,窗口大小可以根据具体验证码的数据特点和需要达到的效果进行调整。
可选地,在本实施例中,确定编码数据在多个数据类型中所对应的目标数据类型的方式可以但不限于为计算编码数据距离上述各个聚类中心的距离,找出距离最近的聚类中心。如果编码数据距离该聚类中心的距离小于设定的阈值,则认为该编码数据属于该聚类中心所代表的聚类簇,从而将该聚类簇确定为目标数据类型。
可选地,在本实施例中,目标对象的对象标识可以但不限于包括:用户id,用户ip地址等等。例如:将上述编码数据所对应的用户ip地址与确定出的聚类簇内其他行为对应的用户ip进行绑定,绑定后的ip将合并计算其访问频率。如果合并频率超过某一阈值,则将最新访问的ip设为可疑标识,如果同一个ip多次被设为可疑标识,则将其加入ip黑名单。
可选地,在本实施例中,对于加入黑名单的ip,一方面可以在前端替换一些非用户友好的验证码对其进行测试。另一方面可以调低目标单分类模型的分数阈值,即上调目标相似度,使得该用户ip产生的行为数据有更大的概率被分类为攻击者。或者也可以使用一些特定的页面,将验证码验证改为要求用户进行手机验证,或是要求用户回答密保问题等,从而极大的增加攻击者的暴力访问的成本。
可选地,在本实施例中,对于对象标识被确定为可疑标识的次数高于目标次数的情况,也可以对目标特征分类模型的模型阈值进行调整,从而提高该用户ip产生的行为数据被分类为攻击者的可能性。
攻击者在使用真实的用户数据进行攻击时,往往这一类数据获取渠道有限,不会非常多,不像软件生成的随机轨迹那样无穷无尽。攻击者往往基于一个或一组真人操作数据,进行一些微小的修改,作为新的伪造行为。然而这种方式产生新行为往往存在机器学习模型可以发现的相似之处,从而可以将其有效的归为一类。通过上述步骤,利用了伪造行为之间的相似度进行聚类分析。虽然攻击者可以使用成千上万个ip进行访问,使网站方无法定位其存在,但是可以通过构造行为的相似性,将这些ip进行捆绑判定。这样虽然攻击者使用的是真实的用户行为(比如自己或其他用户的操作),分类模型无法将其拦截,但是通过相似性聚类依然可以发现他们的存在,从而提高了验证的准确性。
作为一种可选的实施例,在根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果之前,还包括:
S91,从采集的数据集中获取目标数据,其中,所述目标数据是从已通过验证的验证操作中提取的数据;
S92,使用所述目标数据对初始单分类模型进行训练,得到目标单分类模型,其中,所述目标单分类模型用于根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
S93,使用所述目标单分类模型对所述数据集中的数据进行验证,得到验证结果为未通过验证的数据;
S94,从所述数据集中获取所述目标数据对应的第一浏览行为数据以及验证结果为未通过验证的数据对应的第二浏览行为数据;
S95,将所述第一浏览行为数据对应的对象类型标注为第一对象类型,并将所述第二浏览行为数据对应的对象类型标注为第二对象类型,得到标注了对象类型的浏览行为数据样本;
S96,使用所述标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练,得到目标特征分类模型,其中,所述目标特征分类模型用于根据所述第一数据对所述目标对象进行验证得到第一验证结果。
可选地,在本实施例中,可以首先采集目标数据对初始单分类模型进行训练,得到目标单分类模型,再利用目标单分类模型生成目标特征分类模型的训练数据对初始特征分类模型进行训练,得到目标特征分类模型。
可选地,在本实施例中,上述数据集可以但不限于包括用户行为日志等等。
在一个可选的实施方式中,提供了一种训练模块,用于执行模型的训练过程,训练模块可以用于每日更新线上模型,用于应对攻击者新产生的伪造行为。图4是根据本申请可选的实施方式的模型训练过程的示意图,如图4所示,该训练过程可以但不限于包括以下步骤:
步骤S402,训练基于每天记录的验证行为数据日志,首先收集当日用户行为日志,基于内网IP段,以及用户白名单,IP白名单等过滤出肯定为普通用户行为的数据,即目标数据。
步骤S404,使用上述过滤出的用户行为数据,更新原有用户数据集,并用更新后的数据集训练SVDD单分类模型。
步骤S406,使用预先分割的测试数据集进行验证,此验证数据集中同时包含用户标签数据和攻击者标签数据,验证得到模型的召回率和准确率,如果达标则更新线上模型。
步骤S408,使用更新后的SVDD模型对当日所有行为数据进行检测,提取出所有被分类为攻击者数据的行为数据,加入攻击者数据集。
步骤S410,使用更新后的用户数据集和攻击者数据集同时训练LSTM+LR模型,并使用预先分割的测试集进行验证,验证得到模型的召回率和准确率,如果达标则更新线上模型。
作为一种可选的实施例,在获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据之前,还包括:
S101,在检测到在显示的操作页面上执行的目标操作的情况下,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址;
S102,从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址;
S103,在查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,显示所述验证页面;
S104,在未查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,对所述验证页面进行预设操作,其中,所述预设操作用于指示所述验证页面存在安全风险。
可选地,在本实施例中,在显示验证页面之前,可以但不限于对验证页面的安全性进行确认,确认的方式可以是预先将操作页面地址和验证页面地址之间的对应关系存储起来,以标识出各个操作页面对应的合法的验证页面,在对用户的操作进行人机验证之前,首先对页面页面进行验证,获取操作页面的第一页面地址和验证页面的第二页面地址,从而预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址,如果查找到,则认为该验证页面是安全的,如果没有查找到,则认为该验证页面不合法,对其执行预设操作来指示该验证页面存在安全风险。
可选地,在本实施例中,操作页面上执行的目标操作触发了验证页面的显示。操作页面可以但不限于包括游戏登录页面,游戏注册页面,游戏交易页面等等需要对目标对象的类别(真实人类用户或是入侵机器人)进行验证的页面。
可选地,在本实施例中,预设操作用于指示验证页面存在安全风险。比如:预设操作可以但不限于包括:拦截操作、举报操作、风险提示、屏蔽操作等等。
通过上述过程,如果检测到目标对象在操作页面上执行了目标操作,则对操作页面和验证页面的页面地址的对应性进行验证,确定是否已经预先存储了其对应关系,如果是,则显示验证页面,如果否,则确认验证页面是有安全风险的。从而避免验证页面被入侵者劫持导致用户在验证页面上执行操作对用户造成风险和损失的情况发生,从而提高了验证页面的安全性,进而提高了用户操作的安全性,为用户提供了一个安全的操作环境。
作为一种可选的实施例,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址包括:
S111,获取客户端上报的加密数据,其中,所述客户端用于显示所述操作页面和所述验证页面;
S112,获取所述客户端对应的秘钥信息;
S113,使用所述秘钥信息对所述加密数据进行解密,得到所述第一页面地址和所述第二页面地址。
可选地,在本实施例中,页面网址安全性的验证过程可以但不限于是由服务器执行的,客户端将页面地址等信息通过加密的方式进行上报。
可选地,在本实施例中,不同客户端可以但不限于对应不同的秘钥信息,也可以与所有客户端都约定相同的秘钥信息。
通过上述过程,客户端采用加密传输的方式向服务器上报信息,能够进一步提高安全性。
作为一种可选的实施例,在获取所述操作页面的第一页面地址和所述验证页面的第二页面地址之后,还包括:
S121,对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息,其中,所述目标风险信息用于指示在所述操作页面和所述验证页面上进行操作存在的风险;
S122,向所述目标对象展示所述目标风险信息。
可选地,在本实施例中,安全性测试的过程可以但不限于用于对页面上存在的安全风险进行测试,比如:测试操作页面和验证页面上是否存在恶意网站,恶意下载,钓鱼链接,木马病毒等风险,以及在操作页面和验证页面上操作环境是否安全,操作行为是否有保障等等。
可选地,在本实施例中,目标风险信息可以但不限于包括风险值和风险类型中至少之一的信息,比如:可以根据安全性测试的结果对页面的安全风险进行打分,得到风险值,对于操作页面和验证页面可以分别打分得到各自的风险值,也可以将安全性检测的结果融合为一个风险值。展示给目标对象的目标风险信息可以但不限于为得到的风险值,比如:风险值为90分,表示在页面上的操作几乎不会存在风险。风险值为45分,表示在页面上执行操作的风险较高。也可以通过目标风险信息向目标对象展示存在风险的风险类型,比如:风险值为45分,风险类型为:木马,恶意网站和恶意下载。
可选地,在本实施例中,风险类型也可以记录在一个列表中,在得到风险值的同时,对存在的风险类型在列表中进行勾选,将风险值和勾选后的列表展示给目标对象。
通过上述过程,对操作页面和验证页面进行安全性测试,并将得到的目标风险信息展示给目标对象,从而为目标对象提示操作可能存在的安全风险。提高了用户操作的安全性,为用户提供了一个安全的操作环境。
作为一种可选的实施例,对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息包括:
S131,对所述操作页面进行安全性测试,得到第一风险信息,其中,所述第一风险信息用于指示在所述操作页面上进行操作存在的风险;
S132,对所述验证页面进行安全性测试,得到第二风险信息,其中,所述第二风险信息用于指示在所述验证页面上进行操作存在的风险;
S133,根据所述第一风险信息、所述第二风险信息和目标查找结果确定所述目标风险信息,其中,所述目标查找结果用于指示从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址的结果。
可选地,在本实施例中,可以但不限于对操作页面和验证页面分别进行安全性测试,得到各自对应的风险信息,再结合对页面地址对应关系进行验证得到的验证结果来确定目标风险信息。
可选地,在本实施例中,目标查找结果也影响了操作页面和验证页面的安全性,比如:如果目标查找结果为未查找到对应关系,则确认操作页面和验证页面的安全性会降低,如果目标查找结果为查找到对应关系,则确认操作页面和验证页面的安全性会相应有所提升。
本申请还提供了一种可选实施例,该可选实施例提供了一种基于用户行为的人机验证方法。图5是根据本申请可选实施例的一种基于用户行为的人机验证方法的示意图,如图5所示,该方法可以但不限于包括以下步骤:
步骤S502,获取用户行为数据,并将其划分为用户页面浏览行为和用户验证码操作行为。
步骤S504,对于用户页面浏览行为进行鼠标、滚轮等行为的固定时间间隔的采样,对键盘数据截取最大固定长度,得到浏览行为数据。使用LSTM+LR模型对浏览行为数据进行分类,得到分类结果。
步骤S506,对于用户验证码操作行为,将其作为验证行为数据使用自编码器进行编码,得到行为编码作为编码数据。使用SVDD单分类模型对其进行分类,得到分类结果。
步骤S508,融合上述两种分类结果得到最终判断结果。
可选地,在本可选实施例中,在使用自编码器进行编码得到行为编码之后,上述方法还可以但不限于包括以下步骤:
步骤S510,对行为编码使用mean-shift算法进行聚类,根据聚类结果对相关的ip进行绑定。
步骤S512,对绑定ip的访问频率进行联合计数。
步骤S514,如果联合访问频率超过指定阈值,则将最新访问的ip标记为可疑,如果ip多次被标记为可疑,则将其加入黑名单。
步骤S516,对于黑名单ip,将其反馈给前端增加其验证难度,同时反馈给分类模型,增加其分类为正常用户的难度。
通过上述过程,基于深度网络自动提取数据特征,避免了手动提取特征的局限性,也提高了特征提取的效率和准确性。收集的用户行为不限于验证过程,并将用户行为划分为页面浏览行为和验证码操作行为两个特征差别较大的序列,并针对两种序列使用不同的模型进行分类,丰富了验证过程的维度和信息量,从而提高了验证准确率。使用单分类模型对用户数据进行分类,避免了收集攻击者数据的困难。使用聚类模型对攻击者伪造行为进行相似性分析,避免了攻击者在破解了前端代码后,直接使用真实用户行为进行虚假验证。从而提高了对验证操作进行验证的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述操作的验证方法的操作的验证装置。图6是根据本申请实施例的一种可选的操作的验证装置的示意图,如图6所示,该装置可以包括:
第一获取模块62,用于获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
第一验证模块64,用于根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第一确定模块66,用于根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
需要说明的是,该实施例中的第一获取模块62可以用于执行本申请实施例中的步骤S202,该实施例中的第一验证模块64可以用于执行本申请实施例中的步骤S204,该实施例中的第一确定模块66可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,通过从显示验证页面开始获取验证页面上产生的行为数据,将验证页面上产生的行为数据划分为浏览行为和验证行为两个维度分别进行验证得到各自的验证结果,再将两个维度的验证结果进行融合得到目标验证操作的最终验证结果,达到了提高验证通过难度的目的,从而实现了提高对验证页面上执行的验证操作进行验证的准确率的技术效果,进而解决了相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。
作为一种可选的实施例,所述第一验证模块包括:
提取单元,用于对所述第一数据进行特征提取,得到所述第一数据对应的数据特征;
分类单元,用于对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果。
作为一种可选的实施例,所述提取单元用于:按照数据的产生方式将所述第一数据划分为多种数据类型的数据;分别对所述多种数据类型的数据中每种数据类型的数据进行特征提取,得到所述每种数据类型的数据对应的数据特征;
所述分类单元用于:分别对所述每种数据类型的数据对应的数据特征进行分类,得到所述每种数据类型的数据对应的对象类型;对所述每种数据类型的数据对应的对象类型进行融合,得到所述目标对象类型。
作为一种可选的实施例,所述第一验证模块包括:
第一输入单元,用于将所述第一数据输入目标特征分类模型,其中,所述目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的;
第一获取单元,用于获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果,其中,所述行为数据样本所标注的对象类型中包括所述目标对象类型。
作为一种可选的实施例,所述第一获取单元用于:
通过特征提取层对所述第一数据进行特征提取,得到数据特征,其中,所述目标特征分类模型包括依次连接的第一输入层、所述特征提取层、分类层和第一输出层,所述第一输入层用于接收所述第一数据;
通过所述分类层对所述数据特征进行分类,得到所述数据特征属于多个对象类型中每种对象类型的概率;
通过所述第一输出层根据所述数据特征属于多个对象类型中每种对象类型的概率,从所述多个对象类型中确定所述目标对象类型,并输出所述目标对象类型。
作为一种可选的实施例,所述第一验证模块包括:
第一确定单元,用于确定所述第二数据是否符合所述验证页面对应的验证条件;
第二确定单元,用于在确定所述第二数据不符合所述验证条件的情况下,确定所述第二验证结果用于指示所述目标验证操作未通过验证;
第三确定单元,用于在确定所述第二数据符合所述验证条件的情况下,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果,其中,所述目标数据是从已通过验证的验证操作中提取的数据。
作为一种可选的实施例,所述第三确定单元用于:
对所述第二数据进行编码,得到编码数据;
将所述编码数据输入目标单分类模型,其中,所述目标单分类模型是使用所述目标数据对初始单分类模型进行训练得到的;
获取所述目标单分类模型输出的验证标识作为所述第二验证结果,其中,所述验证标识用于指示所述编码数据是否通过验证。
作为一种可选的实施例,所述第三确定单元用于:
通过单分类层确定所述编码数据与所述目标数据之间的相似度,其中,所述目标单分类模型包括依次连接的第二输入层,所述单分类层和第二输出层,所述第二输入层用于接收所述编码数据;
通过所述第二输出层确定所述相似度与目标相似度之间的关系;
在所述相似度高于所述目标相似度的情况下,通过所述第二输出层输出第一验证标识,其中,所述第一验证标识用于指示所述编码数据通过验证;
在所述相似度不高于所述目标相似度的情况下,通过所述第二输出层输出第二验证标识,其中,所述第二验证标识用于指示所述编码数据未通过验证。
作为一种可选的实施例,所述装置还包括:
第二确定模块,用于在对所述第二数据进行编码,得到所述编码数据之后,确定所述编码数据在多个数据类型中所对应的目标数据类型,其中,所述多个数据类型是对历史编码数据进行聚类得到的;
第二获取模块,用于获取产生属于所述目标数据类型的数据对应的对象的访问频率,其中,所述访问频率用于指示产生属于所述目标数据类型的数据对应的对象访问所述验证页面的频率;
第三确定模块,用于在所述访问频率高于目标频率的情况下,将所述目标对象的对象标识确定为可疑标识;
调整模块,用于在所述对象标识被确定为所述可疑标识的次数高于目标次数的情况下,上调使用所述目标单分类模型对来自所述对象标志的数据进行处理时的所述目标相似度。
作为一种可选的实施例,所述装置还包括:
第三获取模块,用于在根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果之前,从采集的数据集中获取目标数据,其中,所述目标数据是从已通过验证的验证操作中提取的数据;
第一训练模块,用于使用所述目标数据对初始单分类模型进行训练,得到目标单分类模型,其中,所述目标单分类模型用于根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第二验证模块,用于使用所述目标单分类模型对所述数据集中的数据进行验证,得到验证结果为未通过验证的数据;
第四获取模块,用于从所述数据集中获取所述目标数据对应的第一浏览行为数据以及验证结果为未通过验证的数据对应的第二浏览行为数据;
标注模块,用于将所述第一浏览行为数据对应的对象类型标注为第一对象类型,并将所述第二浏览行为数据对应的对象类型标注为第二对象类型,得到标注了对象类型的浏览行为数据样本;
第二训练模块,用于使用所述标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练,得到目标特征分类模型,其中,所述目标特征分类模型用于根据所述第一数据对所述目标对象进行验证得到第一验证结果。
作为一种可选的实施例,所述装置还包括:
第五获取模块,用于在获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据之前,在检测到在显示的操作页面上执行的目标操作的情况下,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址;
查找模块,用于从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址;
显示模块,用于在查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,显示所述验证页面;
操作模块,用于在未查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,对所述验证页面进行预设操作,其中,所述预设操作用于指示所述验证页面存在安全风险。
作为一种可选的实施例,所述第五获取模块包括:
第二获取单元,用于获取客户端上报的加密数据,其中,所述客户端用于显示所述操作页面和所述验证页面;
第三获取单元,用于获取所述客户端对应的秘钥信息;
解密单元,用于使用所述秘钥信息对所述加密数据进行解密,得到所述第一页面地址和所述第二页面地址。
作为一种可选的实施例,所述装置还包括:
测试模块,用于在获取所述操作页面的第一页面地址和所述验证页面的第二页面地址之后,对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息,其中,所述目标风险信息用于指示在所述操作页面和所述验证页面上进行操作存在的风险;
展示模块,用于向所述目标对象展示所述目标风险信息。
作为一种可选的实施例,所述测试模块包括:
第一测试单元,用于对所述操作页面进行安全性测试,得到第一风险信息,其中,所述第一风险信息用于指示在所述操作页面上进行操作存在的风险;
第二测试单元,用于对所述验证页面进行安全性测试,得到第二风险信息,其中,所述第二风险信息用于指示在所述验证页面上进行操作存在的风险;
第四确定单元,用于根据所述第一风险信息、所述第二风险信息和目标查找结果确定所述目标风险信息,其中,所述目标查找结果用于指示从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址的结果。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述操作的验证方法的服务器或终端。
图7是根据本申请实施例的一种终端的结构框图,如图7所示,该终端可以包括:一个或多个(图中仅示出一个)处理器701、存储器703、以及传输装置705,如图7所示,该终端还可以包括输入输出设备707。
其中,存储器703可用于存储软件程序以及模块,如本申请实施例中的操作的验证方法和装置对应的程序指令/模块,处理器701通过运行存储在存储器703内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的操作的验证方法。存储器703可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器703可进一步包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置705用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置705包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置705为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器703用于存储应用程序。
处理器701可以通过传输装置705调用存储器703存储的应用程序,以执行下述步骤:
获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
采用本申请实施例,提供了一种操作的验证的方案。通过从显示验证页面开始获取验证页面上产生的行为数据,将验证页面上产生的行为数据划分为浏览行为和验证行为两个维度分别进行验证得到各自的验证结果,再将两个维度的验证结果进行融合得到目标验证操作的最终验证结果,达到了提高验证通过难度的目的,从而实现了提高对验证页面上执行的验证操作进行验证的准确率的技术效果,进而解决了相关技术中对验证页面上执行的验证操作进行验证的准确率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图7所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,终端还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行操作的验证方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
这里所寻求的保护的主题的范围在所附条款中进行限定。本发明实施例中还包括在下列编号条款中规定的这些和其他方面:
1.一种操作的验证方法,包括:
获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
2.根据条款1所述的方法,其中,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
对所述第一数据进行特征提取,得到所述第一数据对应的数据特征;
对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果。
3.根据条款2所述的方法,其中,
对所述第一数据进行特征提取,得到所述第一数据对应的数据特征包括:按照数据的产生方式将所述第一数据划分为多种数据类型的数据;分别对所述多种数据类型的数据中每种数据类型的数据进行特征提取,得到所述每种数据类型的数据对应的数据特征;
对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果包括:分别对所述每种数据类型的数据对应的数据特征进行分类,得到所述每种数据类型的数据对应的对象类型;对所述每种数据类型的数据对应的对象类型进行融合,得到所述目标对象类型。
4.根据条款1所述的方法,其中,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
将所述第一数据输入目标特征分类模型,其中,所述目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的;
获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果,其中,所述行为数据样本所标注的对象类型中包括所述目标对象类型。
5.根据条款4所述的方法,其中,获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果包括:
通过特征提取层对所述第一数据进行特征提取,得到数据特征,其中,所述目标特征分类模型包括依次连接的第一输入层、所述特征提取层、分类层和第一输出层,所述第一输入层用于接收所述第一数据;
通过所述分类层对所述数据特征进行分类,得到所述数据特征属于多个对象类型中每种对象类型的概率;
通过所述第一输出层根据所述数据特征属于多个对象类型中每种对象类型的概率,从所述多个对象类型中确定所述目标对象类型,并输出所述目标对象类型。
6.根据条款1所述的方法,其中,根据所述第二数据对所述目标验证操作进行验证得到第二验证结果包括:
确定所述第二数据是否符合所述验证页面对应的验证条件;
在确定所述第二数据不符合所述验证条件的情况下,确定所述第二验证结果用于指示所述目标验证操作未通过验证;
在确定所述第二数据符合所述验证条件的情况下,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果,其中,所述目标数据是从已通过验证的验证操作中提取的数据。
7.根据条款6所述的方法,其中,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果包括:
对所述第二数据进行编码,得到编码数据;
将所述编码数据输入目标单分类模型,其中,所述目标单分类模型是使用所述目标数据对初始单分类模型进行训练得到的;
获取所述目标单分类模型输出的验证标识作为所述第二验证结果,其中,所述验证标识用于指示所述编码数据是否通过验证。
8.根据条款7所述的方法,其中,获取所述目标单分类模型输出的验证标识作为所述第二验证结果包括:
通过单分类层确定所述编码数据与所述目标数据之间的相似度,其中,所述目标单分类模型包括依次连接的第二输入层,所述单分类层和第二输出层,所述第二输入层用于接收所述编码数据;
通过所述第二输出层确定所述相似度与目标相似度之间的关系;
在所述相似度高于所述目标相似度的情况下,通过所述第二输出层输出第一验证标识,其中,所述第一验证标识用于指示所述编码数据通过验证;
在所述相似度不高于所述目标相似度的情况下,通过所述第二输出层输出第二验证标识,其中,所述第二验证标识用于指示所述编码数据未通过验证。
9.根据条款8所述的方法,其中,在对所述第二数据进行编码,得到所述编码数据之后,所述方法还包括:
确定所述编码数据在多个数据类型中所对应的目标数据类型,其中,所述多个数据类型是对历史编码数据进行聚类得到的;
获取产生属于所述目标数据类型的数据对应的对象的访问频率,其中,所述访问频率用于指示产生属于所述目标数据类型的数据对应的对象访问所述验证页面的频率;
在所述访问频率高于目标频率的情况下,将所述目标对象的对象标识确定为可疑标识;
在所述对象标识被确定为所述可疑标识的次数高于目标次数的情况下,上调使用所述目标单分类模型对来自所述对象标志的数据进行处理时的所述目标相似度。
10.根据条款1所述的方法,其中,在根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果之前,所述方法还包括:
从采集的数据集中获取目标数据,其中,所述目标数据是从已通过验证的验证操作中提取的数据;
使用所述目标数据对初始单分类模型进行训练,得到目标单分类模型,其中,所述目标单分类模型用于根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
使用所述目标单分类模型对所述数据集中的数据进行验证,得到验证结果为未通过验证的数据;
从所述数据集中获取所述目标数据对应的第一浏览行为数据以及验证结果为未通过验证的数据对应的第二浏览行为数据;
将所述第一浏览行为数据对应的对象类型标注为第一对象类型,并将所述第二浏览行为数据对应的对象类型标注为第二对象类型,得到标注了对象类型的浏览行为数据样本;
使用所述标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练,得到目标特征分类模型,其中,所述目标特征分类模型用于根据所述第一数据对所述目标对象进行验证得到第一验证结果。
11.根据条款1所述的方法,其中,在获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据之前,所述方法还包括:
在检测到在显示的操作页面上执行的目标操作的情况下,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址;
从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址;
在查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,显示所述验证页面;
在未查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,对所述验证页面进行预设操作,其中,所述预设操作用于指示所述验证页面存在安全风险。
12.根据条款11所述的方法,其中,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址包括:
获取客户端上报的加密数据,其中,所述客户端用于显示所述操作页面和所述验证页面;
获取所述客户端对应的秘钥信息;
使用所述秘钥信息对所述加密数据进行解密,得到所述第一页面地址和所述第二页面地址。
13.根据条款11所述的方法,其中,在获取所述操作页面的第一页面地址和所述验证页面的第二页面地址之后,所述方法还包括:
对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息,其中,所述目标风险信息用于指示在所述操作页面和所述验证页面上进行操作存在的风险;
向所述目标对象展示所述目标风险信息。
14.根据条款13所述的方法,其中,对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息包括:
对所述操作页面进行安全性测试,得到第一风险信息,其中,所述第一风险信息用于指示在所述操作页面上进行操作存在的风险;
对所述验证页面进行安全性测试,得到第二风险信息,其中,所述第二风险信息用于指示在所述验证页面上进行操作存在的风险;
根据所述第一风险信息、所述第二风险信息和目标查找结果确定所述目标风险信息,其中,所述目标查找结果用于指示从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址的结果。
15.一种操作的验证装置,包括:
第一获取模块,用于获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
第一验证模块,用于根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第一确定模块,用于根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
16.根据条款15所述的装置,其中,所述第一验证模块包括:
提取单元,用于对所述第一数据进行特征提取,得到所述第一数据对应的数据特征;
分类单元,用于对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果。
17.根据条款16所述的装置,其中,
所述提取单元用于:按照数据的产生方式将所述第一数据划分为多种数据类型的数据;分别对所述多种数据类型的数据中每种数据类型的数据进行特征提取,得到所述每种数据类型的数据对应的数据特征;
所述分类单元用于:分别对所述每种数据类型的数据对应的数据特征进行分类,得到所述每种数据类型的数据对应的对象类型;对所述每种数据类型的数据对应的对象类型进行融合,得到所述目标对象类型。
18.根据条款15所述的装置,其中,所述第一验证模块包括:
第一输入单元,用于将所述第一数据输入目标特征分类模型,其中,所述目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的;
第一获取单元,用于获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果,其中,所述行为数据样本所标注的对象类型中包括所述目标对象类型。
19.根据条款18所述的装置,其中,所述第一获取单元用于:
通过特征提取层对所述第一数据进行特征提取,得到数据特征,其中,所述目标特征分类模型包括依次连接的第一输入层、所述特征提取层、分类层和第一输出层,所述第一输入层用于接收所述第一数据;
通过所述分类层对所述数据特征进行分类,得到所述数据特征属于多个对象类型中每种对象类型的概率;
通过所述第一输出层根据所述数据特征属于多个对象类型中每种对象类型的概率,从所述多个对象类型中确定所述目标对象类型,并输出所述目标对象类型。
20.根据条款15所述的装置,其中,所述第一验证模块包括:
第一确定单元,用于确定所述第二数据是否符合所述验证页面对应的验证条件;
第二确定单元,用于在确定所述第二数据不符合所述验证条件的情况下,确定所述第二验证结果用于指示所述目标验证操作未通过验证;
第三确定单元,用于在确定所述第二数据符合所述验证条件的情况下,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果,其中,所述目标数据是从已通过验证的验证操作中提取的数据。
21.根据条款20所述的装置,其中,所述第三确定单元用于:
对所述第二数据进行编码,得到编码数据;
将所述编码数据输入目标单分类模型,其中,所述目标单分类模型是使用所述目标数据对初始单分类模型进行训练得到的;
获取所述目标单分类模型输出的验证标识作为所述第二验证结果,其中,所述验证标识用于指示所述编码数据是否通过验证。
22.根据条款21所述的装置,其中,所述第三确定单元用于:
通过单分类层确定所述编码数据与所述目标数据之间的相似度,其中,所述目标单分类模型包括依次连接的第二输入层,所述单分类层和第二输出层,所述第二输入层用于接收所述编码数据;
通过所述第二输出层确定所述相似度与目标相似度之间的关系;
在所述相似度高于所述目标相似度的情况下,通过所述第二输出层输出第一验证标识,其中,所述第一验证标识用于指示所述编码数据通过验证;
在所述相似度不高于所述目标相似度的情况下,通过所述第二输出层输出第二验证标识,其中,所述第二验证标识用于指示所述编码数据未通过验证。
23.根据条款22所述的装置,其中,所述装置还包括:
第二确定模块,用于在对所述第二数据进行编码,得到所述编码数据之后,确定所述编码数据在多个数据类型中所对应的目标数据类型,其中,所述多个数据类型是对历史编码数据进行聚类得到的;
第二获取模块,用于获取产生属于所述目标数据类型的数据对应的对象的访问频率,其中,所述访问频率用于指示产生属于所述目标数据类型的数据对应的对象访问所述验证页面的频率;
第三确定模块,用于在所述访问频率高于目标频率的情况下,将所述目标对象的对象标识确定为可疑标识;
调整模块,用于在所述对象标识被确定为所述可疑标识的次数高于目标次数的情况下,上调使用所述目标单分类模型对来自所述对象标志的数据进行处理时的所述目标相似度。
24.根据条款15所述的装置,其中,所述装置还包括:
第三获取模块,用于在根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果之前,从采集的数据集中获取目标数据,其中,所述目标数据是从已通过验证的验证操作中提取的数据;
第一训练模块,用于使用所述目标数据对初始单分类模型进行训练,得到目标单分类模型,其中,所述目标单分类模型用于根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第二验证模块,用于使用所述目标单分类模型对所述数据集中的数据进行验证,得到验证结果为未通过验证的数据;
第四获取模块,用于从所述数据集中获取所述目标数据对应的第一浏览行为数据以及验证结果为未通过验证的数据对应的第二浏览行为数据;
标注模块,用于将所述第一浏览行为数据对应的对象类型标注为第一对象类型,并将所述第二浏览行为数据对应的对象类型标注为第二对象类型,得到标注了对象类型的浏览行为数据样本;
第二训练模块,用于使用所述标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练,得到目标特征分类模型,其中,所述目标特征分类模型用于根据所述第一数据对所述目标对象进行验证得到第一验证结果。
25.根据条款15所述的装置,其中,所述装置还包括:
第五获取模块,用于在获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据之前,在检测到在显示的操作页面上执行的目标操作的情况下,获取所述操作页面的第一页面地址和所述验证页面的第二页面地址;
查找模块,用于从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址;
显示模块,用于在查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,显示所述验证页面;
操作模块,用于在未查找到具有对应关系的所述第一页面地址和所述第二页面地址的情况下,对所述验证页面进行预设操作,其中,所述预设操作用于指示所述验证页面存在安全风险。
26.根据条款25所述的装置,其中,所述第五获取模块包括:
第二获取单元,用于获取客户端上报的加密数据,其中,所述客户端用于显示所述操作页面和所述验证页面;
第三获取单元,用于获取所述客户端对应的秘钥信息;
解密单元,用于使用所述秘钥信息对所述加密数据进行解密,得到所述第一页面地址和所述第二页面地址。
27.根据条款25所述的装置,其中,所述装置还包括:
测试模块,用于在获取所述操作页面的第一页面地址和所述验证页面的第二页面地址之后,对所述操作页面和所述验证页面进行安全性测试,得到所述操作页面和所述验证页面对应的目标风险信息,其中,所述目标风险信息用于指示在所述操作页面和所述验证页面上进行操作存在的风险;
展示模块,用于向所述目标对象展示所述目标风险信息。
28.根据条款27所述的装置,其中,所述测试模块包括:
第一测试单元,用于对所述操作页面进行安全性测试,得到第一风险信息,其中,所述第一风险信息用于指示在所述操作页面上进行操作存在的风险;
第二测试单元,用于对所述验证页面进行安全性测试,得到第二风险信息,其中,所述第二风险信息用于指示在所述验证页面上进行操作存在的风险;
第四确定单元,用于根据所述第一风险信息、所述第二风险信息和目标查找结果确定所述目标风险信息,其中,所述目标查找结果用于指示从预先存储的具有对应关系的操作页面地址和验证页面地址中查找具有对应关系的所述第一页面地址和所述第二页面地址的结果。
29.一种存储介质,其中,所述存储介质包括存储的程序,所述程序运行时执行上述条款1至14任一项中所述的方法。
30.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器通过所述计算机程序执行上述条款1至14任一项中所述的方法。

Claims (10)

1.一种操作的验证方法,其特征在于,包括:
获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
2.根据权利要求1所述的方法,其特征在于,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
对所述第一数据进行特征提取,得到所述第一数据对应的数据特征;
对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果。
3.根据权利要求2所述的方法,其特征在于,
对所述第一数据进行特征提取,得到所述第一数据对应的数据特征包括:按照数据的产生方式将所述第一数据划分为多种数据类型的数据;分别对所述多种数据类型的数据中每种数据类型的数据进行特征提取,得到所述每种数据类型的数据对应的数据特征;
对所述数据特征进行分类,得到所述目标对象所对应的目标对象类型作为所述第一验证结果包括:分别对所述每种数据类型的数据对应的数据特征进行分类,得到所述每种数据类型的数据对应的对象类型;对所述每种数据类型的数据对应的对象类型进行融合,得到所述目标对象类型。
4.根据权利要求1所述的方法,其特征在于,根据所述第一数据对所述目标对象进行验证得到第一验证结果包括:
将所述第一数据输入目标特征分类模型,其中,所述目标特征分类模型是使用标注了对象类型的浏览行为数据样本对初始特征分类模型进行训练得到的;
获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果,其中,所述行为数据样本所标注的对象类型中包括所述目标对象类型。
5.根据权利要求4所述的方法,其特征在于,获取所述目标特征分类模型输出的目标对象类型作为所述第一验证结果包括:
通过特征提取层对所述第一数据进行特征提取,得到数据特征,其中,所述目标特征分类模型包括依次连接的第一输入层、所述特征提取层、分类层和第一输出层,所述第一输入层用于接收所述第一数据;
通过所述分类层对所述数据特征进行分类,得到所述数据特征属于多个对象类型中每种对象类型的概率;
通过所述第一输出层根据所述数据特征属于多个对象类型中每种对象类型的概率,从所述多个对象类型中确定所述目标对象类型,并输出所述目标对象类型。
6.根据权利要求1所述的方法,其特征在于,根据所述第二数据对所述目标验证操作进行验证得到第二验证结果包括:
确定所述第二数据是否符合所述验证页面对应的验证条件;
在确定所述第二数据不符合所述验证条件的情况下,确定所述第二验证结果用于指示所述目标验证操作未通过验证;
在确定所述第二数据符合所述验证条件的情况下,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果,其中,所述目标数据是从已通过验证的验证操作中提取的数据。
7.根据权利要求6所述的方法,其特征在于,根据所述第二数据与目标数据之间的相似度确定所述目标验证操作是否通过验证,得到所述第二验证结果包括:
对所述第二数据进行编码,得到编码数据;
将所述编码数据输入目标单分类模型,其中,所述目标单分类模型是使用所述目标数据对初始单分类模型进行训练得到的;
获取所述目标单分类模型输出的验证标识作为所述第二验证结果,其中,所述验证标识用于指示所述编码数据是否通过验证。
8.一种操作的验证装置,其特征在于,包括:
第一获取模块,用于获取目标时间段内目标对象在显示的验证页面上产生的第一数据和第二数据,其中,所述验证页面用于对所述目标对象在所述验证页面上执行的目标验证操作进行验证,所述目标时间段包括从显示所述验证页面到结束执行所述目标验证操作的时间,所述第一数据是所述目标对象在开始执行所述目标验证操作之前产生的浏览行为数据,所述第二数据是所述目标对象执行所述目标验证操作产生的验证行为数据;
第一验证模块,用于根据所述第一数据对所述目标对象进行验证得到第一验证结果,并根据所述第二数据对所述目标验证操作进行验证得到第二验证结果;
第一确定模块,用于根据所述第一验证结果和所述第二验证结果确定所述目标验证操作对应的目标验证结果,其中,所述目标验证结果用于指示所述目标验证操作是否通过验证。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至7任一项中所述的方法。
CN202010538272.2A 2020-06-12 2020-06-12 一种操作的验证方法和装置 Pending CN111783063A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010538272.2A CN111783063A (zh) 2020-06-12 2020-06-12 一种操作的验证方法和装置
PCT/CN2020/112684 WO2021248707A1 (zh) 2020-06-12 2020-08-31 一种操作的验证方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010538272.2A CN111783063A (zh) 2020-06-12 2020-06-12 一种操作的验证方法和装置

Publications (1)

Publication Number Publication Date
CN111783063A true CN111783063A (zh) 2020-10-16

Family

ID=72757602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010538272.2A Pending CN111783063A (zh) 2020-06-12 2020-06-12 一种操作的验证方法和装置

Country Status (2)

Country Link
CN (1) CN111783063A (zh)
WO (1) WO2021248707A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150137A (zh) * 2022-06-23 2022-10-04 浪潮通用软件有限公司 一种基于Redis的高频访问预警方法及设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114049508B (zh) * 2022-01-12 2022-04-01 成都无糖信息技术有限公司 一种基于图片聚类和人工研判的诈骗网站识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241709A (zh) * 2018-08-03 2019-01-18 平安科技(深圳)有限公司 基于滑块验证码验证的用户行为识别方法及装置
CN110348980A (zh) * 2018-04-08 2019-10-18 阿里巴巴集团控股有限公司 安全校验的系统、方法和装置
US20200287900A1 (en) * 2018-05-28 2020-09-10 Alibaba Group Holding Limited Identity verification method and apparatus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622072B (zh) * 2016-07-15 2021-08-17 阿里巴巴集团控股有限公司 一种针对网页操作行为的识别方法及服务器、终端
CN108491714A (zh) * 2018-04-09 2018-09-04 众安信息技术服务有限公司 验证码的人机识别方法
US11030287B2 (en) * 2018-06-07 2021-06-08 T-Mobile Usa, Inc. User-behavior-based adaptive authentication
CN109271762B (zh) * 2018-08-03 2023-04-07 平安科技(深圳)有限公司 基于滑块验证码的用户认证方法及装置
CN111163072B (zh) * 2019-12-24 2022-06-10 五八有限公司 机器学习模型中特征值的确定方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348980A (zh) * 2018-04-08 2019-10-18 阿里巴巴集团控股有限公司 安全校验的系统、方法和装置
US20200287900A1 (en) * 2018-05-28 2020-09-10 Alibaba Group Holding Limited Identity verification method and apparatus
CN109241709A (zh) * 2018-08-03 2019-01-18 平安科技(深圳)有限公司 基于滑块验证码验证的用户行为识别方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150137A (zh) * 2022-06-23 2022-10-04 浪潮通用软件有限公司 一种基于Redis的高频访问预警方法及设备
CN115150137B (zh) * 2022-06-23 2023-06-23 浪潮通用软件有限公司 一种基于Redis的高频访问预警方法及设备

Also Published As

Publication number Publication date
WO2021248707A1 (zh) 2021-12-16

Similar Documents

Publication Publication Date Title
CN111428231B (zh) 基于用户行为的安全处理方法、装置及设备
CN110233849B (zh) 网络安全态势分析的方法及系统
US20210126931A1 (en) System and a method for detecting anomalous patterns in a network
Farahani Feature Selection Based on Cross‐Correlation for the Intrusion Detection System
CN111259219B (zh) 恶意网页识别模型建立方法、识别方法及系统
CN110929203B (zh) 异常用户的识别方法、装置、设备及存储介质
CN111030992B (zh) 检测方法、服务器及计算机可读存储介质
Krishnaveni et al. Ensemble approach for network threat detection and classification on cloud computing
CN111783063A (zh) 一种操作的验证方法和装置
Rahman et al. New biostatistics features for detecting web bot activity on web applications
CN108647497A (zh) 一种基于特征提取的api密钥自动识别系统
CN112437034B (zh) 虚假终端检测方法和装置、存储介质及电子装置
CN110855635A (zh) Url识别方法、装置及数据处理设备
CN118138361A (zh) 一种基于可自主进化智能体的安全策略制定方法和系统
Luz et al. Data preprocessing and feature extraction for phishing URL detection
CN116383786A (zh) 一种基于物联网的大数据信息监管系统及方法
Wang et al. Malware detection using cnn via word embedding in cloud computing infrastructure
Lee et al. Multimodal Large Language Models for Phishing Webpage Detection and Identification
CN114640492A (zh) 一种url检测方法、系统、设备及计算机可读存储介质
CN115278680B (zh) 一种移动应用攻击检测方法、装置、设备和存储介质
CN113221110B (zh) 一种基于元学习的远程访问木马智能分析方法
Švarc et al. Automated Computer Attacks Detection in University Environment
CN111314327A (zh) 一种基于knn离群点检测算法的网络入侵检测方法及系统
Skandarsini et al. Enhancing Cybersecurity: A Multilayered Approach to Phishing Website Detection Using Machine Learning
CN110768980B (zh) 网络人机验证方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination