CN111967043A - 确定数据相似度的方法、装置、电子设备及存储介质 - Google Patents

确定数据相似度的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111967043A
CN111967043A CN202010745067.3A CN202010745067A CN111967043A CN 111967043 A CN111967043 A CN 111967043A CN 202010745067 A CN202010745067 A CN 202010745067A CN 111967043 A CN111967043 A CN 111967043A
Authority
CN
China
Prior art keywords
target
data
target parameter
return data
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010745067.3A
Other languages
English (en)
Other versions
CN111967043B (zh
Inventor
汪杰
万振华
王颉
董燕
李华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kaiyuan Internet Security Technology Co Ltd
Original Assignee
Shenzhen Kaiyuan Internet Security Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kaiyuan Internet Security Technology Co Ltd filed Critical Shenzhen Kaiyuan Internet Security Technology Co Ltd
Priority to CN202010745067.3A priority Critical patent/CN111967043B/zh
Publication of CN111967043A publication Critical patent/CN111967043A/zh
Application granted granted Critical
Publication of CN111967043B publication Critical patent/CN111967043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种确定数据相似度的方法、装置、电子设备及存储介质,涉及互联网技术领域,能够极大地提高确定数据相似度效率。该方法包括:获取网页应用针对访问请求响应的参考返回数据和目标返回数据,所述参考返回数据包括第一目标参数,所述目标返回数据包括第二目标参数,且所述第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值;将所述第一相似度值确定为所述参考返回数据与目标返回数据的相似度值。

Description

确定数据相似度的方法、装置、电子设备及存储介质
技术领域
本申请属于互联网技术领域,尤其涉及一种确定数据相似度的方法、装置、电子设备及存储介质。
背景技术
随着近期爆发的各种高危漏洞,网络安全问题引起了越来越多的关注。越权漏洞,是万维网(world wide web,web)应用程序中一种常见的安全漏洞,是指由于程序员疏忽,没有对某个操作所需的权限或用户进行严格的限制,导致本应没有操作权限的用户可正常进行操作,其威胁在于一个账户即可控制网站或服务器的所有用户数据。例如攻击者使用一个合法账户,就可对存在越权漏洞的其他账户数据进行非法操作,例如查看与其权限不对等的数据。为此,为确定用户获得返回数据的行为是否存在越权,普遍的都是判断web应用返回数据是否一致或者相似度多少,以根据相似度的多少来判断是否越权。
然而,现在确定数据相似度的方法,比如余弦相似度、曼哈度距离、欧几里得距离、明式距离等等,这些算法均是针对整个返回数据来进行比对,导致确定数据相似度的效率较低。
发明内容
本申请实施例提供了一种确定数据相似度的方法、装置、电子设备及存储介质,以解决现在确定数据相似度的效率低的问题。
第一方面,本申请实施例提供了一种确定数据相似度的方法,包括:
获取网页应用针对访问请求响应的参考返回数据和目标返回数据,所述参考返回数据包括第一目标参数,所述目标返回数据包括第二目标参数,且所述第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;
将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值;
将所述第一相似度值作为所述参考返回数据与目标返回数据的相似度值。
采用本申请提供的确定数据相似度的方法,首先获取网页应用针对访问请求响应的参考返回数据和目标返回数据,且由于只需将参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对,可以较快速地测算得到第一目标参数与第二目标参数的相似度值,极大地缩短了确定数据相似度所需要的时间,极大地提高数据相似比对的效率。
可选的,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值之前,还包括:
获取所述参考返回数据的第一状态码和所述目标返回数据的第二状态码;
确认所述第一状态码与所述第二状态码是否相同。
可选的,若所述第一状态码与所述第二状态码相同;
所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
将所述第二状态码对应的第二目标参数与所述第一状态码对应的第一目标参数进行比对,得到所述第一相似度值。
可选的,所述确认所述第一状态码与所述第二状态码是否相同之前,还包括:
获取多个所述参考返回数据,每个所述参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并计算得到每个目标数据字段的平均长度;
根据预设的状态码确定策略,确定第一目标平均长度,并将第一目标平均长度对应的目标数据字段作为所述参考返回数据的所述第一状态码。
可选的,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
将所述第一目标参数的第一键值对与所述第二目标参数的第二键值对进行比对,得到所述第一键值对与所述第二键值对的第二相似度值,将所述第二相似度值作为第一相似度值。
可选的,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值之前,还包括:
获取多个所述参考返回数据;每个所述参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并计算得到每个目标数据字段的平均长度;
根据预设的目标参数确定策略,确定第二目标平均长度,并将第二目标平均长度对应所述参考返回数据中的目标数据字段作为第一目标参数。
可选的,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
若目标访问请求存在多个返回数据,则将参考返回数据的第一目标参数分别与每个返回数据的目标参数进行比对,得到多个相似度值;
根据多个所述相似度值,计算多个所述相似度值的标准差;
基于所述标准差,确定多个所述相似度值中的一个相似度值为所述第一相似度值。
第二方面,本申请实施例提供了一种确定数据相似度的装置,包括:
获取模块,用于获取网页应用针对访问请求响应的参考返回数据和目标返回数据,所述参考返回数据包括第一目标参数,所述目标返回数据包括第二目标参数,且所述第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;
比对模块,用于将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值;
确定模块,用于将所述第一相似度值作为所述参考返回数据与目标返回数据的相似度值。
第三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的确定数据相似度的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的确定数据相似度的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中任一项所述的确定数据相似度的方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的确定数据相似度的方法的流程示意图。
图2是本申请一实施例提供的确定数据相似度的装置的结构示意图。
图3是本申请一实施例提供的电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
请参见图1,图1是本申请实施例提供的一种确定数据相似度的方法的实现流程图。本实施例中,确定数据相似度的方法用于在网页应用访问的过程中确定数据相似度,其执行主体为电子设备。
如图1所示的确定数据相似度的方法包括以下步骤:
S101:获取网页应用针对访问请求响应的参考返回数据和目标返回数据,参考返回数据包括第一目标参数,目标返回数据包括第二目标参数,且第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数。
在步骤S101中,访问请求用于描述用户对网页应用的访问行为。
参考返回数据为基于正常访问行为而响应的包含响应信息的数据。例如,用户B的权限是只能访问获取包含B的数据,现用户B请求获取B的数据,相应的返回数据只包含B的数据,为{“B”:“b”}。
需要说明的是,在本申请的所有实施例中,参考返回数据可预先收集得到,以便于后续与对应的目标返回数据的比对,测算相应的相似度值。例如,对于多个正常的访问请求,收集相应的多个参考返回数据,如存在正常的3个访问请求A、B、C,收集相应的参考返回数据D、E、F。
目标返回数据为基于被修改的访问请求进行访问得到的包含相应请求的目标信息的数据。例如,用户B的权限是只能访问获取包含B的数据,对应的存在获取得到只包含B的数据的参考访问请求,现用户B修改该参考访问请求的cookie和参数并进行访问,得到相应的返回数据{“A”:“a”、“B”:“b”},因用户B超出其访问权限,获得了用户A的数据,则确定该返回数据为目标返回数据。
可以理解的是,因参考返回数据和目标返回数据,均是基于在同一应用中的访问行为而得到的返回数据,参考返回数据和目标返回数据为相同数据格式的数据,故参考返回数据的第一目标参数与目标返回数据的第二目标参数均是对应的数据中相同一个数据字段对应的数据,可对该相同字段的数据进行比对,测算得到之间的相似度值。
第一目标参数为参考返回数据中的目标数据字段对应的数据。例如,现存在一条参考返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},第一目标参数可以为该返回数据中的“data”数据段中的数据,如{“r1”:“2323”,“r2”:“231245”}。
第二目标参数为目标返回数据中的目标数据段对应的数据。例如,现存在一条目标返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},第二目标参数可以为该返回数据中的“data”数据段中的数据,如{“r1”:“2323”,“r2”:“231245”}。
S102:将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值。
在步骤S102中,第一相似度值用于描述目标返回数据的第二目标参数和参考返回数据的第一目标参数的相似性,且从侧面可利用该相似度值表征目标返回数据与参考返回数据的相似性。
例如,参考返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},参考返回数据的第一目标参数为其中data字段的数据;目标返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},目标返回数据的第二目标参数为其中data字段的数据,测算得到参考返回数据的目标参数和目标返回数据的目标参数之间的相似度值为100%。
在本实施例中,将参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对,由于参考返回数据的数据格式与目标返回数据的数据格式相同,因此在进行比对时,可只需将数据中的目标参数进行比对,能够有效地提高数据比对的效率,便于测算得到这两个数据的目标参数之间的相似度值。可以理解的是,参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对的过程,也是确认两个目标参数相似之处的过程。例如,比对12345和12346,逐步比对的过程也是寻找相似的过程,如逐步发现1234为相同的数值。
至于何时将参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对,测算第一目标参数与第二目标参数的第一相似度值,可以包括但不仅限于以下三个场景。
场景1:若检测到与参考访问请求相同或近似的访问请求时,立即检测获取该访问请求的返回数据,并将该返回数据作为目标返回数据,将参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对,测算得到第一目标参数与第二目标参数的第一相似度值。
例如,用户B的权限是只能访问获取包含B的数据,对应的存在获取得到只包含B的数据的参考访问请求。现用户B修改该参考访问请求并进行访问,得到相应的返回数据,该返回数据的目标参数{“A”:“a”、“B”:“b”},该返回数据作为目标返回数据,将该数据与其参考返回数据的目标参数{“B”:“b”}进行比对,测算得到目标返回数据的目标参数与参考返回数据的目标参数之间的相似度值为50%。
场景2:每一预设的时间段模拟回放一次访问请求,确定该访问请求对应的返回数据,将该返回数据的第二目标参数与相应的参考访问请求的参考返回数据的第一目标参数进行比对,测算第一目标参数与第二目标参数的第一相似度值。
例如,在某一时间点,用户B超越其权限,访问请求获取用户A和用户B的数据,并得到返回数据,该返回数据的目标参数为{“A”:“a”、“B”:“b”}。在时隔一个预设的时间段后,重新模拟回访用户B的该访问请求,得到相应的返回数据,该返回数据作为目标返回数据,将该数据的第二目标参数与其参考返回数据的第一目标参数{“B”:“b”}进行比对,测算得到第一目标参数与第二目标参数的第一相似度值为50%。
可以理解的是,在实际应用中,应用产品可能会接收到多个访问请求,故在模拟回放请求时,会模拟回放多个访问请求,得到多个返回数据。
场景3:若在某一时间段内持续检测到多次同一访问请求获取同样的数据时,则获取该访问请求的返回数据作为目标返回数据,将该目标返回数据的第二目标参数与参考返回数据的第一目标参数进行比对,测算得到第一目标参数与第二目标参数的第一相似度值。
应当理解的是,在实际应用中应用产品的运行时,对应用产品的访问行为实时存在,越权访问行为也可能随时发生,即若存在越权访问行为,其对应的返回数据也必将存在,故为了确定是否存在基于越权访问行为得到的返回数据,需要检测每个访问请求对应的返回数据,并将该返回数据的第二目标参数与基于正常访问行为得到的返回数据的第一目标参数进行比对,测算得到第一目标参数与第二目标参数的第一相似度值。
S103:将第一相似度值确定为参考返回数据与目标返回数据的相似度值。
在本实施例中,因第二目标参数和第一目标参数分别是目标返回数据、参考返回数据中的核心参数,故可通过第一相似度值来表征参考返回数据与目标返回数据的相似度值。
采用本申请提供的确定数据相似度的方法,首先获取网页应用针对访问请求响应的参考返回数据和目标返回数据,且由于只需将参考返回数据的第一目标参数与目标返回数据的第二目标参数进行比对,可以较快速地测算得到第一目标参数与第二目标参数的相似度值,极大地缩短了确定数据相似度所需要的时间,极大地提高数据相似比对的效率。
在本申请一实施例中,若第一相似度值等于或大于预设相似度阈值,则确定第二目标参数对应的目标返回数据为越权得到的数据。
在本实施例中,预设相似度阈值为表示返回数据为越权访问得到的数据的最小相似度值。例如,预设相似度阈值为90%,目标返回数据的第二目标参数与参考返回数据的第一目标参数的相似度值为91%,相似度值91%大于预设相似度阈值90%,则表示,该目标参数对应的目标返回数据为越权得到的数据。
可以理解的是,当确定该目标参数对应的目标返回数据为越权得到的数据时,可以确定目标返回数据对应的访问请求对应的业务逻辑存在越权漏洞。
在一些实施例中,存在一种场景是,替换目标参数中的某个参数后,使得目标返回数据的目标参数的相似度值等于或大于预设阈值,但该目标返回数据对应的访问请求不是越权请求。
故,若相似度值等于或大于预设相似度阈值,则确定第二目标参数对应的目标返回数据为越权访问得到的数据,还包括:
确定目标返回数据对应的访问请求是否越权的访问请求;
若是,则确定目标返回数据为越权访问得到的数据。
在本实施例中,确定访问请求对应的用户的权限,基于该用户的权限确定获取的目标返回数据是否在该权限内,若不在该权限内,则确定目标返回数据为越权访问得到的数据,反之,确定该目标返回数据为正常访问得到的数据。
在本申请一实施例中,将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值之前,还包括:
获取参考返回数据的第一状态码和目标返回数据的第二状态码;
确认第一状态码与第二状态码是否相同。
在本实施例中,确认第一状态码与第二状态码是否相同,目的在于根据确认的结果快速地判断参考返回数据与目标返回数据是否相同,若确认的结果为不相同,则表示参考返回数据与目标返回数据必然为不相同的数据响应,也没必要继续将第一目标参数与第二目标参数进行进一步的比对,测算第二目标参数的相似度值,反之,则进一步地测算第一目标参数与第二目标参数的第一相似度值,以便于确定第二目标参数对应的目标返回数据是否为越权得到的数据。
状态码用于描述返回数据的返回状态。例如,存在一返回数据的状态码用status表示,若status的值为0表示成功返回数据;值为1表示失败返回数据;值为2表示网络异常,无法返回数据;值为3表示服务异常,无法返回数据。一般的,应用产品响应一个返回数据时,一般都会响应一个状态码,该状态可以由应用产品自定义,如叫status,或叫code,还可以是其它的数据字段。
可以理解的是,参考返回数据的第一状态码和目标返回数据的第二状态码为相同字段中的数据信息。例如,均是数据字段status的数据信息,如第一状态码的status的值为1,第二状态码的值为1,则表示第一状态码与第二状态码相同。
在本申请一实施例中,若第一状态码与第二状态码相同。
将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值,包括:
将第二状态码对应的第二目标参数与第一状态码对应的第一目标参数进行比对,得到第一相似度值。
在本实施例中,因状态码可以用于表示返回数据的返回状态,如均第一状态码status的值和第二状态码status的值均为1,则表示相应的返回数据为成功返回的数据,如此将第二状态码对应的第二目标参数与第一状态码对应的第一目标参数进行比对,才具有实质的比对意义。
第一状态码和第一目标参数为同一参考返回数据中不同的数据字段。例如,参考返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},第一状态码为目标返回数据中的status字段,第一目标参数为目标返回数据中data字段。
第二状态码和第二目标参数为同一目标返回数据中不同的数据字段,例如,目标返回数据为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},第二状态码为目标返回数据中的status字段,第二目标参数为目标返回数据中data字段。
示例的,当第一状态码的值为1,且第二状态码的值为1,则表示第一状态码与第二状态码相同。进一步地,第二状态码对应的第二目标参数与第一状态码对应的第一目标参数进行比对,得到第二目标参数与第一目标参数的相似度值,如第二状态码对应的第二目标参数为“{“r1”:“2323”,“r2”:“231245”}”,第一状态码对应的第一目标参数为“{“r1”:“2323”,“r2”:“231245”}”,测算得到第二目标参数的相似度值为100%。
在本申请一实施例中,因不同的数据的格式在大多情况下是未知,并不知道数据中的那个数据字段为状态码的字段,故需要预先对状态码所在的数据字段进行确定。
故,本实施例提供了一种确定数据相似度的方法,主要涉及确定数据的状态码的过程。方法包括:
确认第一状态码与第二状态码是否相同之前,还包括:
获取多个参考返回数据,每个参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并基于获取的多个对应的目标数据字段的长度,计算得到每个目标数据字段的平均长度;
根据预设的状态码确定策略,确定第一目标平均长度,并将第一目标平均长度对应的目标数据字段作为参考返回数据的第一状态码。
在本实施例中,因参考返回数据为正常访问得到的数据,其数据格式是符合要求的,故可用于参考确定状态码。
目标数据字段为参考返回数据中的数据字段。例如,参考返回数据中包括status、msg和data等3个数据字段,其中,因msg用于对状态码的详细的中文说明,不作为筛选状态码的数据字段,故将参考返回数据中的status和data作为目标数据字段。
平均长度为多个参考返回数据中相同的目标数据字段的长度的平均值。例如,现存在3个参考返回数据,如参考返回数据A、参考返回数据B和参考返回数据C,且目标数据字段均为data字段和status字段,其中,参考返回数据A中的data字段的长度为2字节,status字段的长度为1字节;参考返回数据B中的data字段的长度为3字节,status字段的长度为1字节;参考返回数据C中的data字段的长度为4字节,status字段的长度为1字节。
基于data字段,获取每个参考返回数据中对应的data字段的长度分别为2字节、3字节、4字节,计算得到该data目标数据字段的平均长度为3字节。另外,基于status字段,获取每个参考返回数据中对应的status字段的长度分别为1字节、1字节、1字节,计算得到获取该status目标数据字段的平均长度为1字节。
可以理解的是,因每个参考返回数据会包括一个或多个目标数据字段,计算得到的平均长度也有一个或多个。例如,每个参考返回数据中存在2个目标数据字段,如status字段和data字段,计算平均长度时,会计算得到2个平均长度。
预设的状态码确定策略用于描述确定状态码的逻辑过程。例如,测算得到目标字段status字段的平均长度为2字节,data字段的平均长度为3字节,则选择平均长度最小的字段为状态码的字段,确定2字节为第一目标平均长度,将第一目标平均长度对应的status作为状态码。
可以理解的是,目标数据字段为从参考返回数据的通用响应参数中确定的数据字段。例如,10个参考返回数据中,超过半数以上的数据中均包括status、msg和data等3个数据字段,则这3个数据字段为通用的响应参数,且进一步地确定status和data为目标数据字段。
示例的,获取到10个参考返回数据,其中9个有status,9个有msg,7个有data,确定均包含有status、mag和data等3个数据字段的参考返回数据,如确定7个参考返回数据A、B、C、D、E、F、G。另外,因字段msg只是用于对状态码的详细的中文说明,不作为筛选状态码的数据字段。所以,在该7个参考返回数据的status和data这个两个数据字段中,确定一个为状态码。首先,计算得到该7个参考返回数据的status字段的平均长度、data字段的平均长度,如参考返回数据A、B、C、D、E、F、G的status字段的长度分别为1字节、1字节、1字节、1字节、1字节、1字节、1字节,则status字段的平均长度为1字节;参考返回数据A、B、C、D、E、F、G的data字段的长度分别为12字节、12字节、12字节、12字节、12字节、12字节、12字节,则data字段的平均长度为4字节。其次,根据预设的状态码确定策略从status字段的平均长度和data字段的平均长度中,确定第一目标平均长度,如确定status字段的平均长度为第一目标平均长度,第一目标平均长度对应的status数据字段作为状态码。
在本申请一实施例中,将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值,包括:
将第一目标参数的第一键值对与第二目标参数的第二键值对进行比对,得到第一目标参数的第一键值对与第二目标参数的第二键值对的第二相似度值,将第二相似度值作为第一相似度值。
在本实施例中,目标参数中包括至少一个数据基本单元,且每个数据基本单元中包括至少一个键值对。键值对用于描述目标参数。每一键值对中包括一个键和与该键对应的值,其中,键值对中的键为对应的值的编号,键值对中的值为与键对应的值。例如,数据基本单元为(r1:3211,r2:11),其中,r1:3211为一个键值对,r2:11也是一个键值对,r1、r2为键,3211为与r1对应的值,11为与r2对应的值,即该数据基本单元包括多个键值对。
例如,目标参数为[{“r1”:“3211”,“r2”:“11”},{“r1”:“2323”,“r2”:“231245”}],其中,{“r1”:“3211”,“r2”:“11”}和{“r1”:“2323”,“r2”:“231245”}均是该目标参数的一个数据基本单元,每个数据基本单元中可包括多个键值对。
需要说明的是,本实施例中是将第一目标参数的每个数据基本单元中的第一键值对与第二目标参数的每个数据基本单元中的第二键值对进行比对,得到第一键值对与第二键值对的第二相似度值。
可以理解的是,若参考返回数据的第一目标参数中包括键值对,而目标返回数据的第二目标参数中不包括键值对,则参考返回数据与目标返回数据必然不相同,即第二相似度值为0,即表示参考返回数据与目标返回数据完全不相同。若参考返回数据的第一目标参数和目标返回数据的第二目标参数中均包括键值对,则分别将第一目标参数中的第一键值对的键与第二目标参数中的第二键值对的键进行比对,得到该第一键值对的键与该第二键值对的键的第三相似度值,和将第一目标参数中的键值对的值与第二目标参数中的键值对的值进行比对,,得到第一键值对的值与第二键值对的值的第四相似度值,最后根据该第三相似度值和该第四相似度值,计算得到第一目标参数的第一键值对与第二目标参数的第二键值对的第二相似度值,即第一目标参数与第二目标参数的第一相似度值。
在一些实施例中,若数据基本单元中存在多个基本单元,即存在多个键值对时,多个键值对中的键可以进行拼接后再比对,与键对应的值也可以拼接后再比对。例如,数据基本单元(r1:3211,r2:11),键值对r1:3211和r2:11,将键r1、r2进行拼接为r1_r2,将值3211、11进行拼接为3211_11。具体地,将第一目标参数的每个数据基本单元中的第一键值对的键与第二目标参数的每个数据基本单元中的第二键值对的键进行比对,得到第一键值对的键与第二键值对的键的第三相似度值,和将第一目标参数的第一键值对的值与第二目标参数的第二键值对的值进行比对,得到第一键值对的值与第二键值对的值的第四相似度值。进一步地,将第一键值对的键与第二键值对的键的第三相似度值和第一键值对的值与第二键值对的值的第四相似度值进行乘运算,测算得到第一目标参数的第一键值对与第二目标参数的第二键值对的第二相似度值,将第二相似度值作为第一相似度值。
可以理解的是,第一目标参数可以包括一个或多个数据基本单元;第二目标参数可以包括一个或多个数据基本单元,或不包括数据基本单元。
示例的,参考返回数据和目标返回数据1、目标返回数据2的数据交换格式均是JS对象简谱(JavaScript Object Notation,JSON)格式,在该格式中,因每个“{}”中的数据均是该数据交换格式的一个基本单元,故可将目标参数部分中的一个“{}”的数据作为一个数据基本单元来比较。其中,参考返回数据的具体数据内容为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},目标返回数据1的具体数据内容为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”},目标返回数据2的具体数据内容为{“status”:“0”,“msg”:“success”,“data”:“456”},其中,目标参数均为data字段。
现将参考返回数据的第一目标参数的每个数据基本单元中的第一键值对与目标返回数据1的第二目标参数的每个数据基本单元中的第二键值对进行比对,即将第一目标参数的键r1_r2与第二目标参数的键r1_r2进行比对,第一目标参数的值2323_231245与第二目标参数的值2323_231245进行比对,得到目标返回数据的目标参数的键的相似度为100%,和值的相似度为100%,将键的相似度为100%和值的相似度为100%相乘,测算得到目标返回数据1的第二目标参数的相似度值为100%,即第二目标参数对应的目标返回数据1与参考返回数据完全相同。
现将参考返回数据的第一目标参数的键值对与目标返回数据2的第二目标参数的键值对进行比对,但因目标返回数据2的第二目标参数中的目标参数中没有键值对,则键的相似度值为0,值的相似度值为0,测算得到第一目标参数的第一键值对与第二目标参数的第二键值对的相似度值为0,即目标返回数据1与参考返回数据完全不相同。
再示例的,参考返回数据的具体数据内容为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”,“r3”:1234}”},目标返回数据的具体数据内容为{“status”:“0”,“msg”:“success”,“data”:“{“r1”:“2323”,“r2”:“231245”}”,“{“r1”:“3211”,“r2”:“11”}”,“{“r1”:“456”,“r2”:“98745”,“r4”:“15963”}”}。其中,参考返回数据和目标返回数据的目标参数均是data字段,且参考返回数据的第一目标参数的数据基本单元为“{“r1”:“2323”,“r2”:“231245”,“r3”:1234}”,该数据基本单元中的键值对的键为r1_r2_r3,键对应的值为2323_231245;目标返回数据的第二目标参数的数据基本单元有3个,分别为“{“r1”:“2323”,“r2”:“231245”}”、“{“r1”:“3211”,“r2”:“11”}”和“{“r1”:“456”,“r2”:“98745”,“r4”:“15963”}”,该3个数据基本单元中键值对的键分别为r1_r2和r1_r2_r4,键对应的值分别为2323_231245、3211_11、456_98745_15963。
进一步地,首先,将第一目标参数的数据基本单元中的第一键值对的键r1_r2_r3和第二目标参数的3个数据基本单元中的第二键值对的键r1_r2和r1_r2_r4,得到键的相似度值为0/3=0%。其次,将第一目标参数的数据基本单元中的第一键值对的值2323_231245与第二目标参数的3个数据基本单元中的第二键值对的值2323_231245、3211_11和456_98745_15963进行比对,得到值的相似度值为0/4=0%。最后,将键的相似度值为0/3=0%与值的相似度值为0/4=0%进行乘运算,得到第二相似度值为0,将该第二相似度值作为第一目标参数与第二目标参数的第一相似度值。
在本申请一实施例中,因不同的数据的格式在大多情况下是未知,并不知道数据中的那个数据字段为目标参数的字段,故需要预先确定目标参数的所在数据字段,以便于进行参考返回数据的目标参数与目标返回数据的目标参数的比对。
故,本申请实施例提供了一种确定数据相似度的方法,主要涉及确定目标参数的过程。方法包括以下步骤:
将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值之前,还包括:
获取多个参考返回数据;每个参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并计算得到每个目标数据字段的平均长度;
根据预设的目标参数确定策略,确定第二目标平均长度,并将第二目标平均长度对应参考返回数据中的目标数据字段作为第一目标参数。
在本实施例中,因参考返回数据为确定的正常访问得到的数据,其数据格式是符合应用产品要求的,故可用于参考确定目标参数,且因参考返回数据与目标返回数据为相同数据格式的数据,可以理解的确定第二目标平均长度对应参考返回数据中的目标数据字段作为第一目标参数后,目标返回数据中的相同目标数据字段为第二目标参数。
目标数据字段为参考返回数据中的数据字段。例如,参考返回数据中包括status、msg和data等3个数据字段,其中,因status为参考返回数据的状态码,故参考返回数据中的msg和data便为目标数据字段。
平均长度为多个参考返回数据中相同的目标数据字段的长度的平均值。例如,存在3个参考返回数据,每个参考返回数据中的data字段的长度分别为2字节、3字节、4字节,则该3个data字段的长度的平均值为3字节。
预设的目标参数确定策略用于描述确定目标参数的逻辑过程。例如,测算得到目标字段msg字段的平均长度为2字节,data字段的平均长度为3字节,则选择平均长度最大的字段为目标参数的字段,确定3字节为第二目标平均长度,将第二目标平均长度对应的data作为目标参数。
示例的,获取到10个参考返回数据,其中9个有status,9个有msg,7个有data,确定均包含有status、mag和data等3个数据字段的参考返回数据,如确定7个参考返回数据A、B、C、D、E、F、G。另外,因字段status为返回数据的状态码。所以,在该7个参考返回数据的msg和data这个两个数据字段中,确定一个为目标参数的数据字段。首先,计算得到该7个参考返回数据的msg字段的平均长度、data字段的平均长度,如参考返回数据A、B、C、D、E、F、G的msg字段的长度分别为1字节、1字节、1字节、1字节、1字节、1字节、1字节,则msg字段的平均长度为1字节;参考返回数据A、B、C、D、E、F、G的data字段的长度分别为12字节、12字节、12字节、12字节、12字节、12字节、12字节,则data字段的平均长度为4字节。其次,根据预设的目标参数确定策略从msg字段的平均长度和data字段的平均长度中,确定第一目标平均长度,如确定data字段的平均长度为第二目标平均长度,第二目标平均长度对应的data数据字段作为目标参数。
可以理解的是,本实施例只是提供了一种确定目标参数的方式,面对不同的返回数据,可以有多种确定目标参数的方式。
在本申请一实施例中,存在一种可能的场景是,同一个访问请求的返回数据有多个,若以该多个返回数据分别与参考返回数据进行比对,得到各自的相似度值,通过该多个相似度值也不能较好地判断是否有越权的行为。
故,本申请实施例提供了一种确定数据相似度的方法,主要涉及基于多个返回数据的目标参数的相似度值,更精准判断目标访问请求的返回数据的相似度值的过程。该方法包括以下步骤:
将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值,包括:
若目标访问请求存在多个返回数据,则将参考返回数据的第一目标参数分别与每个返回数据的目标参数进行比对,得到多个相似度值;
根据多个相似度值,计算多个相似度值的标准差;
基于标准差,确定多个相似度值中的一个相似度值为第一相似度值。
在本实施例,基于同一目标访问请求进行多次访问时,会得到多个返回数据,若该目标访问请求为越权的访问请求,则其对应的返回数据则大概率为越权得到的数据,故需要测算每个返回数据的目标参数与参考返回数据的第一目标参数的相似度值。因存在多个返回数据,且每个返回数据的目标参数与参考返回数据的第一目标参数进行比对并得到一个相似度值,故会得到相应的多个相似度值。
目标返回数据为目标访问请求的多个返回数据中的一个返回数据。
标准差用于描述多个相似度值的离散程度。可以理解的是,通过标准差可以确定集中的相似度值,该相似度值对应的目标参数为目标返回数据的目标参数。例如,存在5个相似度值,分别为70%、70%、90%、90%、90%,计算得到的标准差约为9.8%,通过该标准差构建正态分布描述该多个相似度值的离散程度时,最集中的相似度值是90%、90%、90%这三个数,即确定该相似度值90%为第一相似度值。
示例的,目标访问请求A存在3个返回数据B、C、D,将参考返回数据的第一目标参数分别与B、C、D的目标参数进行比对,得到与B、C、D的目标参数分别对应的相似度值分别为89%、90%、90%,则根据该3个相似度值计算得到标准差,通过标准差确定最集中分布的相似度值为90%,该相似度值对应的返回数据即为目标返回数据,如返回数据C、D,该相似度值作为目标返回数据的目标参数与参考返回数据的第一目标参数的第一相似度值。
在本申请一实施例中,将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值,包括:
若目标访问请求存在多个返回数据,则将参考返回数据的第一目标参数的键值对分别与每个返回数据的目标参数的键值对进行比对,得到每个返回数据的目标参数的与参考返回数据的第一目标参数之间的键值对的相似度值;
根据多个相似度值,计算得到多个相似度值的标准差;
基于标准差,确定多个相似度值中的一个相似度值为第一相似度值。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例的确定数据相似度的方法,图2示出了本申请实施例提供的确定数据相似度的装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图2,该装置100包括:
获取模块101,用于获取网页应用针对访问请求响应的参考返回数据和目标返回数据,参考返回数据包括第一目标参数,目标返回数据包括第二目标参数,且第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;
比对模块102,用于将第一目标参数与第二目标参数进行比对,得到第一目标参数与第二目标参数的第一相似度值;
确定模块103,用于将第一相似度值做为参考返回数据与目标返回数据的相似度值。
可选的,该装置100还包括:状态码获取模块、确认模块。
状态码获取模块,用于获取参考返回数据的第一状态码和目标返回数据的第二状态码;
确认模块,用于确认第一状态码与第二状态码是否相同。
可选的,若确认模块确认第一状态码与第二状态码相同。
比对模块102,还用于将第二状态码对应的第二目标参数与第一状态码对应的第一目标参数进行比对,得到第二目标参数的相似度值。
可选的,该装置100还包括:平均长度测算模块、目标平均长度确定模块。
获取模块101,还用于获取多个参考返回数据;每个参考返回数据包括多个目标数据字段;
平均长度测算模块,用于根据多个参考返回数据中每个参考返回数据中相同的目标数据字段的长度,测算得到每个目标数据字段的平均长度;
目标平均长度确定模块,用于根据预设的状态码确定策略,确定第一目标平均长度,将第一目标平均长度对应的目标数据字段作为状态码,状态码为每个返回数据中的固定数据字段。
可选的,该比对模块102还包括:比对单元、测算单元。
第一比对单元,用于将第一目标参数的键值对与第二目标参数的键值对进行比对,得到第二目标参数的键的相似度值和值的相似度值;
测算单元,用于根据第二目标参数的键的相似度值和值的相似度值,测算得到第二目标参数的相似度值。
可选的,比对单元,还用于将第一目标参数中的第一键值对的键与第二目标参数中的第二键值对的键进行比对,得到第一键值对的键与第二键值对的键的第三相似度值;将第一目标参数中的第一键值对的值与第二目标参数中的第二键值对的值进行比对,得到第一键值对的值与第二键值对的值的第四相似度值。
测算单元,还用于根据第三相似度值和第四相似度值,计算得到第一键值对与第二键值对的第二相似度值,将第二相似度值作为第一相似度值。
可选的,获取模块101,还用于获取多个参考返回数据;每个参考返回数据包括多个目标数据字段;
平均长度测算模块,用于根据多个参考返回数据中每个参考返回数据中相同的目标数据字段的长度,测算得到每个目标数据字段的平均长度;
目标平均长度确定模块,还用于根据预设的目标参数确定策略,确定第二目标平均长度,将第二目标平均长度对应的目标数据字段作为目标参数,目标参数为每个返回数据中的固定数据字段。
可选的,比对模块102,还用于若目标访问请求存在多个返回数据,则将参考返回数据的第一目标参数分别与每个返回数据的目标参数进行比对,得到多个相似度值;根据多个相似度值,计算多个相似度值的标准差;基于标准差,确定多个相似度值中的一个相似度值为第一相似度值。
图3为本申请一实施例提供的电子设备的结构示意图。如图3所示,该实施例的电子设备3包括:至少一个处理器30(图3中仅示出一个处理器)、存储器31以及存储在存储器31中并可在至少一个处理器30上运行的计算机程序32,处理器30执行计算机程序32时实现上述任意各个确定数据相似度的方法实施例中的步骤。
电子设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该电子设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是电子设备3的举例,并不构成对电子设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
处理器30可以是中央处理单元(Central Processing Unit,CPU),该处理器30还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器31在一些实施例中可以是电子设备3的内部存储单元,例如电子设备3的硬盘或内存。存储器31在另一些实施例中也可以是电子设备3的外部存储设备,例如电子设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器31还可以既包括电子设备3的内部存储单元也包括外部存储设备。存储器31用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如计算机程序的程序代码等。存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种电子设备,该电子设备包括:至少一个处理器、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行时实现可实现上述各个方法实施例中的步骤。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口、装置或单元的间接耦合或通讯连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种确定数据相似度的方法,其特征在于,所述方法包括:
获取网页应用针对访问请求响应的参考返回数据和目标返回数据,所述参考返回数据包括第一目标参数,所述目标返回数据包括第二目标参数,且所述第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;
将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值;
将所述第一相似度值作为所述参考返回数据与目标返回数据的相似度值。
2.如权利要求1所述的方法,其特征在于,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值之前,还包括:
获取所述参考返回数据的第一状态码和所述目标返回数据的第二状态码;
确认所述第一状态码与所述第二状态码是否相同。
3.如权利要求2所述的方法,其特征在于,若所述第一状态码与所述第二状态码相同;
所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
将所述第二状态码对应的第二目标参数与所述第一状态码对应的第一目标参数进行比对,得到所述第一相似度值。
4.如权利要求2所述的方法,其特征在于,所述确认所述第一状态码与所述第二状态码是否相同之前,还包括:
获取多个所述参考返回数据,每个所述参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并计算得到每个目标数据字段的平均长度;
根据预设的状态码确定策略,确定第一目标平均长度,并将第一目标平均长度对应的目标数据字段作为所述参考返回数据的所述第一状态码。
5.如权利要求1所述的方法,其特征在于,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
将所述第一目标参数的第一键值对与所述第二目标参数的第二键值对进行比对,得到所述第一键值对与所述第二键值对的第二相似度值,将所述第二相似度值作为所述第一相似度值。
6.如权利要求1所述的方法,其特征在于,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值之前,还包括:
获取多个所述参考返回数据;每个所述参考返回数据包括多个目标数据字段;
基于每个目标数据字段,获取每个参考返回数据中对应的目标数据字段的长度,并计算得到每个目标数据字段的平均长度;
根据预设的目标参数确定策略,确定第二目标平均长度,并将第二目标平均长度对应所述参考返回数据中的目标数据字段作为第一目标参数。
7.如权利要求1所述的方法,其特征在于,所述将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值,包括:
若目标访问请求存在多个返回数据,则将参考返回数据的第一目标参数分别与每个返回数据的目标参数进行比对,得到多个相似度值;
根据多个所述相似度值,计算多个所述相似度值的标准差;
基于所述标准差,确定多个所述相似度值中的一个相似度值为所述第一相似度值。
8.一种确定数据相似度的装置,其特征在于,包括:
获取模块,用于获取网页应用针对访问请求响应的参考返回数据和目标返回数据,所述参考返回数据包括第一目标参数,所述目标返回数据包括第二目标参数,且所述第一目标参数和第二目标参数分别为参考返回数据和目标返回数据中相同的一个数据字段中的参数;
比对模块,用于将所述第一目标参数与所述第二目标参数进行比对,得到所述第一目标参数与所述第二目标参数的第一相似度值;
确定模块,用于将所述第一相似度值作为所述参考返回数据与目标返回数据的相似度值。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
CN202010745067.3A 2020-07-29 2020-07-29 确定数据相似度的方法、装置、电子设备及存储介质 Active CN111967043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010745067.3A CN111967043B (zh) 2020-07-29 2020-07-29 确定数据相似度的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010745067.3A CN111967043B (zh) 2020-07-29 2020-07-29 确定数据相似度的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111967043A true CN111967043A (zh) 2020-11-20
CN111967043B CN111967043B (zh) 2023-08-11

Family

ID=73363469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010745067.3A Active CN111967043B (zh) 2020-07-29 2020-07-29 确定数据相似度的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111967043B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210899A (zh) * 2019-05-23 2019-09-06 中国银行股份有限公司 基于广告相似性的广告推送方法、装置和设备
CN110263550A (zh) * 2019-06-27 2019-09-20 深圳前海微众银行股份有限公司 一种基于页面相似度的扫描方法和装置
CN110278250A (zh) * 2019-06-10 2019-09-24 腾讯科技(深圳)有限公司 终端选择方法、装置和存储介质
CN110688659A (zh) * 2019-09-10 2020-01-14 深圳开源互联网安全技术有限公司 基于iast测试工具动态检测水平越权的方法及系统
CN110705603A (zh) * 2019-09-10 2020-01-17 深圳开源互联网安全技术有限公司 动态判断用户请求数据相似度的方法及系统
CN110795472A (zh) * 2019-11-11 2020-02-14 集奥聚合(北京)人工智能科技有限公司 基于模糊匹配的地址标准化方法、系统、设备及介质
CN110909355A (zh) * 2018-09-17 2020-03-24 北京京东金融科技控股有限公司 越权漏洞检测方法、系统、电子设备和介质
US10635829B1 (en) * 2017-11-28 2020-04-28 Intuit Inc. Method and system for granting permissions to parties within an organization
CN111416811A (zh) * 2020-03-16 2020-07-14 携程旅游信息技术(上海)有限公司 越权漏洞检测方法、系统、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635829B1 (en) * 2017-11-28 2020-04-28 Intuit Inc. Method and system for granting permissions to parties within an organization
CN110909355A (zh) * 2018-09-17 2020-03-24 北京京东金融科技控股有限公司 越权漏洞检测方法、系统、电子设备和介质
CN110210899A (zh) * 2019-05-23 2019-09-06 中国银行股份有限公司 基于广告相似性的广告推送方法、装置和设备
CN110278250A (zh) * 2019-06-10 2019-09-24 腾讯科技(深圳)有限公司 终端选择方法、装置和存储介质
CN110263550A (zh) * 2019-06-27 2019-09-20 深圳前海微众银行股份有限公司 一种基于页面相似度的扫描方法和装置
CN110688659A (zh) * 2019-09-10 2020-01-14 深圳开源互联网安全技术有限公司 基于iast测试工具动态检测水平越权的方法及系统
CN110705603A (zh) * 2019-09-10 2020-01-17 深圳开源互联网安全技术有限公司 动态判断用户请求数据相似度的方法及系统
CN110795472A (zh) * 2019-11-11 2020-02-14 集奥聚合(北京)人工智能科技有限公司 基于模糊匹配的地址标准化方法、系统、设备及介质
CN111416811A (zh) * 2020-03-16 2020-07-14 携程旅游信息技术(上海)有限公司 越权漏洞检测方法、系统、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
RIDHIMA SETH等: "Detection of Transformed Malwares using Permission Flow Graphs", pages 1 - 5 *
姜宇等: "基于点击流的用户矩阵模型相似度个性化推荐", vol. 44, no. 1, pages 219 - 225 *
姜海涛等: "基于状态机的移动应用越权访问漏洞检测方法", vol. 41, no. 4, pages 434 - 441 *
郑玉山;邓正宏;: "数据库应用系统安防体系研究与设计", no. 22, pages 62 - 64 *

Also Published As

Publication number Publication date
CN111967043B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN109428886B (zh) 用于经由区块链进行评论验证和可信度评分的方法和系统
US10740411B2 (en) Determining repeat website users via browser uniqueness tracking
CN111556059A (zh) 异常检测方法、异常检测装置及终端设备
CN111064745A (zh) 一种基于异常行为探测的自适应反爬方法和系统
CN108769070A (zh) 一种越权漏洞检测方法及装置
CN109614327B (zh) 用于输出信息的方法和装置
WO2020055413A1 (en) Blockchain for audit
CN114598504A (zh) 一种风险评估方法、装置、电子设备及可读存储介质
CN112363935A (zh) 数据联调方法、装置、电子设备及存储介质
CN116094849B (zh) 应用访问鉴权方法、装置、计算机设备和存储介质
CN110381114B (zh) 接口请求参数的处理方法、装置、终端设备及介质
JP7464663B2 (ja) プライバシー保持アプリケーションおよびデバイスエラー検出
CN111967043B (zh) 确定数据相似度的方法、装置、电子设备及存储介质
US9098623B2 (en) Static analysis of validator routines
CN116028917A (zh) 权限检测方法及装置、存储介质及电子设备
CN115643044A (zh) 数据处理方法、装置、服务器及存储介质
CN111680334B (zh) 一种磁盘安全访问方法、装置、设备、介质
CN113656286A (zh) 软件测试方法、装置、电子设备及可读存储介质
CN112929395B (zh) 云数据去重方法及系统
CN109150871A (zh) 安全检测方法、装置、电子设备及计算机可读存储介质
CN117171235B (zh) 基于工业标识的数据解析方法及相关设备
CN111814205B (zh) 计算处理方法、系统、设备、存储器、处理器及计算机设备
KR102573726B1 (ko) 정보를 보호하기 위한 방법 및 그 장치
CN111614675B (zh) 请求执行方法、设备、系统及介质
CN118153059A (zh) 一种数据库安全审计方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant