CN113626737B - 一种识别主体链接的方法、装置、电子设备及存储介质 - Google Patents

一种识别主体链接的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113626737B
CN113626737B CN202111187531.2A CN202111187531A CN113626737B CN 113626737 B CN113626737 B CN 113626737B CN 202111187531 A CN202111187531 A CN 202111187531A CN 113626737 B CN113626737 B CN 113626737B
Authority
CN
China
Prior art keywords
link
weight
node
navigation
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111187531.2A
Other languages
English (en)
Other versions
CN113626737A (zh
Inventor
董龙飞
王伟光
刘志宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianji Youmeng Information Technology Co ltd
Original Assignee
Beijing Tianji Youmeng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianji Youmeng Information Technology Co ltd filed Critical Beijing Tianji Youmeng Information Technology Co ltd
Priority to CN202111187531.2A priority Critical patent/CN113626737B/zh
Publication of CN113626737A publication Critical patent/CN113626737A/zh
Application granted granted Critical
Publication of CN113626737B publication Critical patent/CN113626737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例公开了一种识别主体链接的方法、装置、电子设备及存储介质。其中,该方法包括:通过加载至少两个APK构建所述至少两个APK的链接的树结构;确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点向该节点的父节点的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量;将所述权重最小的节点对应的链接确定为所述主体链接。解决了现有下载方式成本过高,且大量下载容易被资源提供站点拉黑的问题,从而给下载商店的下载方式降低了成本,同时缩短了用户下载时间,提升了用户的体验。

Description

一种识别主体链接的方法、装置、电子设备及存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种识别主体链接的方法、装置、电子设备及存储介质。
背景技术
在网络安全风险监测的业务中,会经常涉及针对APK(Android安装包)的风险监测,其中,APK的风险监测主要目标是应用商店。
然而,应用商店的特定APK页面上,除了包含主体APK外,还包含大量的相关APK推荐信息,包括应用商店APK下载。若下载主体APP,需要识别该主体APP相关的所有APK页面,以识别出主体APP对应的主体APK。目前,识别主体APK的方式是,下载主体APP相关的全部APK,进而,再提取每个APK的信息以识别出主体APK的链接。但是这种方式成本过高,且大量下载容易被资源提供站点拉黑。
发明内容
针对现上述技术问题,本申请实施例提出了一种识别主体链接的方法、装置、电子设备及存储介质,以解决上述中获取所需APK的下载链接成本过高的问题。
本申请实施例的第一方面提供了一种识别主体链接的方法,包括:
通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构;
确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量;
将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
在一些实施例中,对应任一节点,所述确定所述树结构中每个节点对应的权重,包括:
将所述节点的第一权重确定为所述节点的权重;或者,
获取所述节点的第二权重;
将所述节点第一权重与第二权重的差值,确定为所述节点的权重,其中,所述第二权重指示所述节点对应的链接是所述主体链接的可能性。
在一些实施例中,所述获取所述节点的第二权重,包括:
获取所述节点对应链接的路径信息和传递参数信息;
获取所述路径信息对应的路径深度值、导航链接系数和关键词权重,以及所述传递参数信息包含的传递参数数量,以及相应链接与该链接基础链接的相关性系数,其中,所述路径深度值指示所述路径的目录层数,所述关键词是表征主体链接信息的词,所述导航链接系数表征所述路径信息是导航链接的可能性;
将路径深度值、导航链接系数、关键词权重、传递参数数量和相关性系数的加权值确定为所述节点的第二权重。
在一些实施例中,所述获取所述路径信息中对应的导航链接系数,包括:
对所述路径信息对应的链接进行分词,得到至少一个词;
获取所述至少一个词中导航元素的数量,所述导航元素是指与导航链接相关的词;
根据所述导航元素的数量确定所述导航链接系数。
在一些实施例中,根据所述导航元素的数量确定所述导航链接系数满足以下任一,
当所述导航元素的数量为0,确定所述导航链接系数为负4;
当所述导航元素的数量为1,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负3;
当所述导航元素的数量小于3,且,所述导航元素包括html,shtml中的一个,确定所述导航链接系数为负1;
当所述导航元素的数量大于1小于3,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负2。
在一些实施例中,所述获取所述路径信息中对应的关键词权重,包括:
对所述路径信息对应的链接进行分词,得到至少一个词;
获取所述至少一个词中与预设关键词库中的关键词相匹配的目标词;
确定每个所述目标词在所述路径信息中的次数作为所述关键词权重;
根据所述至少一个词出现的数量统计出所有词的长度;
对所述所有词的长度进行加权,得到导航链接系数。
在一些实施例中,获取所述路径信息对应的链接与该链接基础链接的相关性系数,包括:
对所述路径信息对应的链接以及所述链接的基础链接进行分词;
将所述路径信息对应的链接与相应基础链接中相同词的数量作为所述相关性系数。
本申请实施例的第二方面提供了一种识别主体链接的装置,包括:
构建模块,用于通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构;
确定第一模块,用于确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量;
确定第二模块,用于将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
本申请实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如上述任意一项实施例所述的方法。
本申请实施例的第四方面提供了一种存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如上述任意一项实施例所述的方法。
本申请实施例,通过确定所述树结构中每个节点对应的权重,将所述权重最小的节点对应的链接确定为所述主体链接,解决了现有下载方式成本过高,且大量下载容易被资源提供站点拉黑的问题。其中,所述权重根据第一权重得到,所述第一权重是相应节点向该节点的父节点的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量。从而给下载商店的下载方式降低了成本,同时缩短了用户下载时间,提升了用户的体验。
附图说明
通过参考附图会更加清楚的理解本申请的特征和优点,附图是示意性的而不应理解为对本申请进行任何限制,在附图中:
图1是本申请提供的一种识别主体链接的方法流程示意图;
图2是本申请提供的一种识别主体链接的方法中形成树结构示意图;
图3是本申请提供的一种识别主体链接的方法具体子节点示意图;
图4是本申请提供的一种识别主体链接的方法具体各个节点加权示意图;
图5是本申请提供的一种识别主体链接的方法具体所有子节点到根节点数量示意图;
图6是本申请提供的一种识别主体链接的方法主体链接示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本申请的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本申请显而易见的可以在没有这些细节的情况下实施。应当理解的是,本申请中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本申请所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本申请所用术语仅为了描述特定实施例,而非限制本申请范围。如本申请说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本申请的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本申请的保护范围。可以理解的是,附图并非按比例绘制。
本申请提供了一种识别主体链接的方法。如图1所示,所述方法包括:
步骤S10,通过加载至少两个APK构建所述至少两个APK的链接的树结构。
步骤S20,确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量。
步骤S30,将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
通过步骤S10、步骤S20和步骤S30能够解决现有识别主体APK的方式,由于下载主体APP相关的全部APK,进而,再提取每个APK的信息以识别出主体APK的链接,造成的下载成本过高的问题,且避免大量下载主体APP被资源提供站点拉黑的情况发生,并且本申请通过步骤S20和步骤S30能够对需要对下载链接关联的内容进行相关行对比,对于不同下载页面的结构是不同,这种方式具有通用性,有些站点关联内容和链接可以在同一HTML标签里。从而给下载商店的下载方式降低了成本,同时缩短了用户下载时间,提升了用户的体验。
具体地,步骤S10通过加载至少两个APK构建所述至少两个APK的链接的树结构,所述树结构例如可以实现为DomTree。可选的,通过浏览器动态加载页面获取构成DOMTree所需数据,将构成DOMTree所需数据转换为需要的DomTree数据结构,其中,浏览器动态加载页面使用了动态web页面加载采集技术,保证了数据的完整性。
在一种实施例中,对应任一节点,所述确定所述树结构中每个节点对应的权重,包括:
将所述节点的第一权重确定为所述节点的权重。
具体地,如图2所示,所述节点的第一权重包含指定字段的链接及其xpath路径,生成树状结构体,方便进行可视化分析及后续处理。
如图3所示,将每条xpath上的link信息保存为根节点。
如图4所示,将每个节点上其子节点中根节点的数量作为每个节点初始权重:
vi=sum(leaf);
其中,vi指示节点的初始权重,leaf指示该节点子节点中所有的跟节点。
如图5所示,将子节点到根节点之间所有的节点的初始值相加,得到叶节点的第一权重,通过wd表示:
wd=Σleaf rootvi
其中,wd指示基于子节点第一权重,Σleaf root指示子节点到根节点。
通过对wd值进行判断,wd值越高,节点为主体APK链接的可能性越低,进而能够通过较低的成本获取主体APK链接下载。
只采用基于树结构的加权判定获取主体APK链接下载还不足以满足我们的需求,会存在某些干扰项,如:导航链接、高速下载链接(实为应用商店自己的App)。为解决这一问题,以APK下载链接的特征为维度进行再次进行加权,得到第二权重,然后综合第一权重和第二权重的两种权值,就可以得出较为精确的结果。
具体地,获取所述节点的第二权重,其中,wl指示第二权重。
将所述节点第一权重与第二权重的差值,确定为所述节点的权重,wf=wd-wl,所述第二权重指示所述节点对应的链接是所述主体链接的可能性,其中,wf指示下载主体链接的权重,wf即所述节点的权重。
优选的,第二权重值实际上是对urlbase代表网页当前的URL路径和urlin代表网页页面内容中所包含的URL路径链接信息中所述得到相关的权重值,其中,urlbase就是指这个网站的url,urlin是指网站内容里面含有url的数量。首先依据URL的结构,将URL中解析为路径(记作path)和查询参数(记作query)部分,这一过程为URL分解:
如https://www.baidu.com/s?wd=dom&rsv_spt=1,将被解析为:
path:www.baidu.com/s
query:wd=dom&rsv_spt=1
在一种实施例中,所述获取所述节点的第二权重,包括:
获取所述节点对应链接的路径信息和传递参数信息。
具体地,路径信息基于path的深度,生成路径深度值weighting,即统计urlin中“/”的数量,其中
weight=url-in.count(/);
传递参数信息,需要获取query中参数的个数,对query中参数的个数进行加权,得到wquery,其中,query中参数的个数即为统计“=”的个数。
获取所述路径信息对应的路径深度值、导航链接系数和关键词权重,以及所述传递参数信息包含的传递参数数量,以及相应链接与该链接基础链接的相关性系数,其中,所述路径深度值指示所述路径的目录层数,所述关键词是表征主体链接信息的词,所述导航链接系数表征所述路径信息是导航链接的可能性;
将路径深度值、导航链接系数、关键词权重、传递参数数量和相关性系数的加权值确定为所述节点的第二权重。其中,需要将路径深度值、导航链接系数、关键词权重、传递参数数量和相关性系数进行相加得到第二权重。
在一种实施例中,对所述路径信息对应的链接进行分词,所述获取所述路径信息中对应的导航链接系数,包括:
对所述路径信息对应的链接进行分词,得到至少一个词。也可以是两个词、三个词、四个词、五个词、六个词以及六个以上的词。
获取所述至少一个词中导航元素的数量,所述导航元素是指与导航链接相关的词,根据所述导航元素的数量确定所述导航链接系数。进一步地,对path做切分分词,得到列表path_words,如www.baidu.com/s切分为:[www,baidu,com,s],统计path_word列表的长度,即其中含有的元素个数,即导航元素,记作lenghtword,且lenghtword>0,从而可以得到导航链接系数,记作win
在一种实施例中,根据所述导航元素的数量确定所述导航链接系数满足以下任一,
当所述导航元素的数量为0,确定所述导航链接系数为负4;
当所述导航元素的数量为1,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负3;
当所述导航元素的数量小于3,且,所述导航元素包括html,shtml中的一个,确定所述导航链接系数为负1;
当所述导航元素的数量大于1小于3,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负2。
在一种实施例中,所述获取所述路径信息中对应的关键词权重,包括:
对所述路径信息对应的链接进行分词,得到至少一个词。用正则表达式对path执行分词,得到列表path_words,如www.baidu.com/s切分为:[www,baidu,com,s]。
获取所述至少一个词中与预设关键词库中的关键词相匹配的目标词,确定每个所述目标词在所述路径信息中的次数作为所述关键词权重。将关键词权重记作wkeyword
根据所述至少一个词出现的数量统计出所有词的长度,对所述所有词的长度进行加权,得到导航链接系数。
在一种实施例中,获取所述路径信息对应的链接与该链接基础链接的相关性系数,包括:
对所述路径信息对应的链接以及所述链接的基础链接进行分词。即对path做切分分词,得到列表path_words。
将所述路径信息对应的链接与相应基础链接中相同词的数量作为所述相关性系数,将相关性系数记作wr
第二权重wl计算方式:wl=weight+wquery-win+wkeyword+wr
最终确认主体链接权值wf计算:
wf=wd-wl,其中,如图6所示,子节点的父节点为最终确认主体链接权值wf,节点为第一权重wd。
通过上述方法可知,本申请针对应用商店页面的实现了启发式主体APK下载链接识别方法。通过以上方法,可从大量不同类型的APK下载页面中迅速的筛选出真正的所需APK的下载链接,大大的减少了APK自动化下载所需要的成本。
对应上述方法,本申请还提供了一种识别主体链接的装置,包括:
构建模块,用于通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构。
确定第一模块,用于确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量。
确定第二模块,用于将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
通过构建模块、确定第一模块和确定第二模块能够解决现有识别主体APK的方式,由于下载主体APP相关的全部APK,进而,再提取每个APK的信息以识别出主体APK的链接,造成的下载成本过高的问题,而且还能够降低了下载的成本,同时缩短了用户下载时间,提升了用户的体验。
本申请还提供了一种电子设备,包括:
存储器以及一个或多个处理器,其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如上述任意一项实施例所述的方法。
本申请还提供了一种存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如上述任意一项实施例所述的方法。
本申请中使用了多种结构图用来说明根据本申请的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本申请。本申请的保护范围以权利要求为准。
应当理解的是,本申请的上述具体实施方式仅仅用于示例性说明或解释本申请的原理,而不构成对本申请的限制。因此,在不偏离本申请的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种识别主体链接的方法,其特征在于,所述方法包括:
通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构;
确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量;
将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
2.根据权利要求1所述的识别主体链接的方法,其特征在于,对应任一节点,所述确定所述树结构中每个节点对应的权重,包括:
将所述节点的第一权重确定为所述节点的权重;或者,
获取所述节点的第二权重;
将所述节点第一权重与第二权重的差值,确定为所述节点的权重,其中,所述第二权重指示所述节点对应的链接是所述主体链接的可能性。
3.根据权利要求2所述的识别主体链接的方法,其特征在于,所述获取所述节点的第二权重,包括:
获取所述节点对应链接的路径信息和传递参数信息;
获取所述路径信息对应的路径深度值、导航链接系数和关键词权重,以及所述传递参数信息包含的传递参数数量,以及相应链接与该链接基础链接的相关性系数,其中,所述路径深度值指示所述路径的目录层数,所述关键词是表征主体链接信息的词,所述导航链接系数表征所述路径信息是导航链接的可能性;
将路径深度值、导航链接系数、关键词权重、传递参数数量和相关性系数的加权值确定为所述节点的第二权重。
4.根据权利要求3所述的识别主体链接的方法,其特征在于,所述获取所述路径信息中对应的导航链接系数,包括:
对所述路径信息对应的链接进行分词,得到至少一个词;
获取所述至少一个词中导航元素的数量,所述导航元素是指与导航链接相关的词;
根据所述导航元素的数量确定所述导航链接系数。
5.根据权利要求4所述的识别主体链接的方法,其特征在于,根据所述导航元素的数量确定所述导航链接系数满足以下任一,
当所述导航元素的数量为0,确定所述导航链接系数为负4;
当所述导航元素的数量为1,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负3;
当所述导航元素的数量小于3,且,所述导航元素包括html,shtml中的一个,确定所述导航链接系数为负1;
当所述导航元素的数量大于1小于3,且,所述导航元素包括top,ios,about,down,game,help中的一个,确定所述导航链接系数为负2。
6.根据权利要求3所述的识别主体链接的方法,其特征在于,所述获取所述路径信息中对应的关键词权重,包括:
对所述路径信息对应的链接进行分词,得到至少一个词;
获取所述至少一个词中与预设关键词库中的关键词相匹配的目标词;
确定每个所述目标词在所述路径信息中的次数作为所述关键词权重;
根据所述至少一个词出现的数量统计出所有词的长度;
对所述所有词的长度进行加权,得到导航链接系数。
7.根据权利要求3所述的识别主体链接的方法,其特征在于,获取所述路径信息对应的链接与该链接基础链接的相关性系数,包括:
对所述路径信息对应的链接以及所述链接的基础链接进行分词;
将所述路径信息对应的链接与相应基础链接中相同词的数量作为所述相关性系数。
8.一种识别主体链接的装置,其特征在于,包括:
构建模块,用于通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构;
确定第一模块,用于确定所述树结构中每个节点对应的权重,所述权重根据第一权重得到,所述第一权重是相应节点指向该节点的父节点方向的路径中,各个节点初始权重的加权值,所述初始权重指示相应节点包含的子节点的数量;
确定第二模块,用于将所述权重最小的节点对应的链接确定为所述主体链接;
所述通过加载至少两个应用程序包APK构建所述至少两个APK的链接的树结构,包括:
通过浏览器动态加载所述至少两个APK所在的页面获取构成所述树结构所需数据,将构成所述树结构所需的数据转换为所述树结构。
9.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如权利要求1-7任一项所述的方法。
10.一种存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如权利要求1-7任一项所述的方法。
CN202111187531.2A 2021-10-12 2021-10-12 一种识别主体链接的方法、装置、电子设备及存储介质 Active CN113626737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111187531.2A CN113626737B (zh) 2021-10-12 2021-10-12 一种识别主体链接的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111187531.2A CN113626737B (zh) 2021-10-12 2021-10-12 一种识别主体链接的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113626737A CN113626737A (zh) 2021-11-09
CN113626737B true CN113626737B (zh) 2022-03-11

Family

ID=78391125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111187531.2A Active CN113626737B (zh) 2021-10-12 2021-10-12 一种识别主体链接的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113626737B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
CN105320661A (zh) * 2014-06-10 2016-02-10 中兴通讯股份有限公司 资源的下载方法及装置
US9378276B1 (en) * 2014-01-03 2016-06-28 Google Inc. Systems and methods for generating navigation filters
CN108920434A (zh) * 2018-06-06 2018-11-30 武汉酷犬数据科技有限公司 一种通用的网页主题内容提取方法和系统
CN109086373A (zh) * 2018-07-23 2018-12-25 东南大学 一种构建公平的链接预测评估系统的方法
CN110955833A (zh) * 2019-11-27 2020-04-03 百度在线网络技术(北京)有限公司 一种搜索方法、装置、服务器、终端设备和介质
CN112749351A (zh) * 2019-10-29 2021-05-04 金色熊猫有限公司 链接地址确定方法、装置、计算机可读存储介质及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
US9378276B1 (en) * 2014-01-03 2016-06-28 Google Inc. Systems and methods for generating navigation filters
CN105320661A (zh) * 2014-06-10 2016-02-10 中兴通讯股份有限公司 资源的下载方法及装置
CN108920434A (zh) * 2018-06-06 2018-11-30 武汉酷犬数据科技有限公司 一种通用的网页主题内容提取方法和系统
CN109086373A (zh) * 2018-07-23 2018-12-25 东南大学 一种构建公平的链接预测评估系统的方法
CN112749351A (zh) * 2019-10-29 2021-05-04 金色熊猫有限公司 链接地址确定方法、装置、计算机可读存储介质及设备
CN110955833A (zh) * 2019-11-27 2020-04-03 百度在线网络技术(北京)有限公司 一种搜索方法、装置、服务器、终端设备和介质

Also Published As

Publication number Publication date
CN113626737A (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN107562620B (zh) 一种埋点自动设置方法和装置
CN103888490B (zh) 一种全自动的web客户端人机识别的方法
CN107273269B (zh) 日志解析方法及装置
CN101258708A (zh) 基于网络的应用的性能评估
CN108334641B (zh) 采集用户行为数据的方法、系统、电子设备、存储介质
US10169037B2 (en) Identifying equivalent JavaScript events
CN112989348B (zh) 攻击检测方法、模型训练方法、装置、服务器及存储介质
US20070016960A1 (en) NTO input validation technique
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
CN106598991A (zh) 一种使用会话方式实现与网站交互表单自动提取的网络爬虫系统
CN110083752A (zh) 房源信息推荐方法、装置、设备及存储介质
CN110351299A (zh) 一种网络连接检测方法和装置
CN109586942A (zh) 网站性能评定方法及装置
CN111353112A (zh) 页面处理方法、装置、电子设备和计算机可读介质
CN114528811B (zh) 文章内容抽取方法、装置、设备及存储介质
CN104462242B (zh) 网页回流量统计方法及装置
CN113360300B (zh) 接口调用链路生成方法、装置、设备及可读存储介质
CN102684925B (zh) 互联网访问来源信息的获取方法和装置
CN113626737B (zh) 一种识别主体链接的方法、装置、电子设备及存储介质
EP2937801B1 (en) Harmful site collection device and method
CN107438053B (zh) 域名识别方法、装置及服务器
CN115795177A (zh) 社交媒体内容推荐方法及装置
CN102918527B (zh) Web应用托管的调查方法和系统
KR102247067B1 (ko) 웹사이트에서 수집된 url을 처리하는 방법, 장치 및 컴퓨터 프로그램
KR101524618B1 (ko) 유해 사이트 수집 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: The invention relates to a method, a device, an electronic device and a storage medium for identifying a main link

Effective date of registration: 20220325

Granted publication date: 20220311

Pledgee: Xiamen International Bank Co.,Ltd. Beijing Branch

Pledgor: Beijing Tianji Youmeng Information Technology Co.,Ltd.

Registration number: Y2022990000173

PE01 Entry into force of the registration of the contract for pledge of patent right