CN114398994A - 基于图像识别的业务异常检测方法、装置、设备及介质 - Google Patents

基于图像识别的业务异常检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN114398994A
CN114398994A CN202210057714.0A CN202210057714A CN114398994A CN 114398994 A CN114398994 A CN 114398994A CN 202210057714 A CN202210057714 A CN 202210057714A CN 114398994 A CN114398994 A CN 114398994A
Authority
CN
China
Prior art keywords
target
image
service
abnormal
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210057714.0A
Other languages
English (en)
Inventor
马从猛
屈清涛
潘刘兵
徐慧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210057714.0A priority Critical patent/CN114398994A/zh
Publication of CN114398994A publication Critical patent/CN114398994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及图像检测技术领域,提供了一种基于图像识别的业务异常检测方法、装置、设备及介质,其中方法包括:基于爬虫技术获取目标应用中目标业务的链接地址;若满足目标业务的业务异常检测条件,则从目标业务的链接地址对应的文件夹中获取目标业务的至少两张页面图像,页面图像为目标设备基于链接地址和目标设备的图像配置信息获取的页面截图;基于目标设备的图像配置信息对至少两张页面图像进行特征聚类,得到至少两张页面图像对应的聚类特征集合;基于聚类特征集合中的异常特征获取目标业务的异常值;若异常值大于或等于预设阈值,则确定目标业务为异常业务。采用本申请,提高了异常业务识别的效率,有利于提高业务的稳定性。

Description

基于图像识别的业务异常检测方法、装置、设备及介质
技术领域
本申请涉及图像检测技术领域,主要涉及了一种基于图像识别的业务异常检测方法、装置、设备及介质。
背景技术
随着计算机网络技术的普及率不断提高,应用场景不断丰富,网络规模不断扩大。在网络发展带来信息爆炸式发展的同时,会面临一些新的挑战,尤其是对于一些异常业务的检测。
目前异常业务的检测手段比较丰富,例如,数据监控、日志监控、接口自动化运行等。但是这些手段对于异常问题发现均存在一定的延迟,例如,数据监控可能需要1个小时数据才会出现明显下降,导致监控系统的告警会慢于用户反馈。因此,如何提高异常业务的检测效率是本领域技术人员待解决的技术问题。
发明内容
本申请实施例提供了一种基于图像识别的业务异常检测方法、装置、设备及介质,能够基于目标设备获取目标业务的页面截图进行业务异常检测,提高了异常业务识别的效率,有利于提高业务的稳定性。
第一方面,本申请实施例提供一种基于图像识别的业务异常检测方法,其中:
基于爬虫技术获取目标应用中目标业务的链接地址
若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
基于所述目标设备的图像配置信息对所述至少两张页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;
基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
第二方面,本申请实施例提供一种基于图像识别的业务异常检测装置,其中:
链接获取单元,用于基于爬虫技术获取目标应用中目标业务的链接地址;
图像获取单元,用于若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
特征获取单元,用于基于所述目标设备的图像配置信息对所述页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;
异常获取单元,用于基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
异常确定单元,用于若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
第三方面,本申请实施例提供一种计算机设备,包括处理器、存储器、通信接口以及计算机程序,其中,上述存储器中存储有上述计算机程序,上述计算机程序被配置由上述处理器执行,所述计算机程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行以实现如第一方面中所描述的部分或全部步骤。
实施本申请实施例,将具有如下有益效果:
采用了上述的基于图像识别的业务异常检测方法、装置、设备及介质之后,先基于爬虫技术获取目标应用中各业务的链接地址。若满足目标应用中目标业务的业务异常检测条件,则从目标业务的链接地址对应的文件夹中获取目标业务的至少两张页面图像。然后基于目标设备的图像配置信息对至少两张页面图像进行特征聚类,得到至少两张页面图像对应的聚类特征集合,再基于聚类特征集合中的异常特征获取目标业务的异常值。若该异常值大于或等于预设阈值,则确定目标业务为异常业务。其中,页面图像是目标设备基于链接地址和目标设备的图像配置信息获取的页面截图。如此,基于目标设备获取目标业务的页面截图确定目标业务的展示页面是否异常,从而判断目标业务是否异常。且目标业务的页面截图多于1个,可综合判断待测业务是否异常,提高了异常识别的效率,有利于提高业务的稳定性。若目标设备的数量为多个,可减少了个别设备的图像误差。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本申请实施例提供的一种基于图像识别的业务异常检测方法的流程示意图;
图2为本申请实施例提供的一种基于图像识别的业务异常检测装置的结构示意图;
图3为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例应用的网络架构包括服务器和电子设备。本申请实施例不限定电子设备和服务器的数量,服务器可同时为多个电子设备提供服务。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器或者可以通过多个服务器组成的服务器集群来实现。
电子设备可以是个人计算机(personal computer,PC)、笔记本电脑或智能手机,还可以是一体机、掌上电脑、平板电脑(pad)、智能电视播放终端、车载终端或便捷式设备等。PC端的电子设备,例如一体机等,其操作系统可以包括但不限于Linux系统、Unix系统、Windows系列系统(例如Windows xp、Windows 7等)、Mac OS X系统(苹果电脑的操作系统)等操作系统。移动端的电子设备,例如智能手机等,其操作系统可以包括但不限于安卓系统、IOS(苹果手机的操作系统)、Window系统等操作系统。
电子设备可以安装并运行应用程序,服务器可以是电子设备所安装的应用程序对应的服务器,为应用程序提供应用服务。其中,应用程序可以是单独集成的应用软件,或其它应用中嵌入的小程序,或者网页上的系统等,在此不做限定。
本申请实施例提出一种基于图像识别的业务异常检测方法,该方法可以由基于图像识别的业务异常检测装置执行。该装置可由软件和/或硬件实现,一般可集成在电子设备或服务器中,能够基于目标设备获取目标业务的页面截图进行业务异常检测,提高了异常业务识别的效率,有利于提高业务的稳定性。
请参照图1,图1是本申请提供的一种基于图像识别的业务异常检测方法的流程示意图。以该方法应用在服务器为例进行举例说明,包括如下步骤S101~S105,其中:
S101、基于爬虫技术获取目标应用中目标业务的链接地址。
本申请对于目标应用不做限定,可以为任一待检测业务是否异常的应用。该目标应用包括至少一个业务,以下以目标应用中的目标业务为例进行举例说明。本申请对于目标业务和目标业务的数量不做限定,可以为任一物品的交易业务。目标业务的数量可以为1个或多个。目标业务的链接地址用于访问目标业务对应的展示页面。也就是说,任一联网的电子设备可以基于该链接地址打开目标业务对应的展示页面。
本申请对于目标业务对应的展示页面的内容不做限定,若目标业务为交易业务,则展示页面可以为交易业务对应的产品的详情页面。若目标业务为游戏业务,则展示页面可以为游戏场景对应的页面。若目标业务为通信业务,则展示页面可以为通信双方的聊天页面。
爬虫技术又称网络爬虫、网页蜘蛛、网络机器人,或者网页追逐者等,是一种按照一定规则自动地抓取网络信息的程序或脚本。可以理解,通过爬虫技术对目标应用中各网页的内容进行爬取,得到目标应用所支持的所有业务的链接地址。然后可以对各个业务的链接地址进行编号,再进行存储。目标设备可基于目标业务的链接地址打开目标业务对应的展示页面。然后可获取展示页面的页面截图,并以目标业务的链接地址对应的文件夹进行存储。若满足目标业务的执行条件,则可以从目标业务的链接地址对应的文件夹中获取目标业务的展示页面的页面截图,从而可基于该页面截图是否发生异常来确定目标业务是否为异常业务。
在一种可能的示例中,可以对链接地址进行加密,得到链接地址的编号。然后以加密的编号进行存储。如此,目标设备可以先对加密的链接地址进行解密,得到链接地址。再基于链接地址打开目标业务的展示页面,从而可以避免目标业务被非法设备打开,提高了应用程序的安全性。
本申请对于链接地址的加密方法和解密方法不做限定,加密方法中采用的加密算法可以包括安全散列算法(Secure Hash Algorithm,SHA),例如:SHA-1、SHA-224、SHA-256、SHA-384和SHA-512等。或者可以包括消息摘要算法(Message-Digest Algorithm,MD5)、基于哈希消息认证码(Hash-based Message Authentication Code,HMAC)的算法、基于美国信息交换标准代码(American Standard Code for Information Interchange,ASCII)、ISO-8859-1、GB2312、GBK、UTF(Unicode Transformation Format)-8、UTF-16、base64等。
S102、若满足目标业务的业务异常检测条件,则从目标业务的链接地址对应的文件夹中获取目标业务的至少两张页面图像。
本申请对于目标业务的业务异常检测条件不做限定,可以基于各业务的检测顺序来确定到达目标业务的检测顺序,来确定是否满足目标业务的业务异常检测条件。也就是说,若到达目标业务的检测顺序,则确定满足目标业务的业务异常检测条件。或者可以基于目标业务的执行时间来确定是否满足目标业务的业务异常检测条件。也就是说,若当前时间为目标业务的执行时间,则确定满足目标业务的业务异常检测条件。或者可以基于是否接收到用户反馈的异常问题来确定是否满足目标业务的业务异常检测条件。也就是说,若接收到用户反馈的异常问题,则确定满足目标业务的业务异常检测条件。
在本申请实施例中,目标设备的数量可以大于或等于1。若目标设备的数量大于1,目标设备可以选取不同厂商、不同尺寸、不同系统等类型的电子设备。如此,可以基于不同类型的电子设备截屏得到的页面图像是否存在异常,来确定目标业务是否为异常业务,有利于提高检测的全面性。
图像配置信息用于指示图像获取的方式,可以包括图像缩放比例的数值、图像滑动速度的大小、图像获取的间隔时长等设置参数。可以理解,不同目标设备采用不同的图像配置信息获取页面图像,可提高获取图像的有效性。需要说明的是,目标设备可以基于目标业务的链接地址打开目标业务的展示页面,再基于图像配置信息获取展示页面的页面截图,即目标业务的页面图像。如此,模拟用户打开目标业务,并模拟用户对展业页面进行操作,以获取不同的页面图像,从而可提高页面异常识别的效率和准确率。
在一种可能的示例中,在步骤S101之后,在步骤S102之前,还可包括以下步骤:统计使用目标业务的设备类型的使用数量,以及空闲设备的设备类型和数量;基于各设备类型的使用数量,和空闲设备的设备类型和数量从空闲设备中选取目标设备;获取目标设备对应的历史反馈;基于历史反馈确定目标设备的图像配置信息。
其中,空闲设备是指当前没有任务或可以执行检测任务的电子设备。历史反馈可以为目标设备的设备类型对应的电子设备在使用目标业务时所提交的反馈,或者可以包括目标设备的设备类型对应的电子设备在使用其他业务时所提交的反馈等。历史反馈可以包括针对事项提出的问题或建议等。
可以理解,通过统计各类设备类型的使用数量以及空闲设备的设备类型和数量,从空闲设备中选取目标设备。如此,可以给不同设备类型对应的目标设备设置不同的数量,以模拟实际生产过程中的场景,可提高选取目标设备的有效性。再基于历史反馈确定目标设备类型对应的目标设备的图像配置信息,有利于提高获取图像的有效性。
在本申请实施例中,页面图像的数量可以大于或等于2。页面图像可以为目标设备基于该目标设备的图像配置信息获取的页面截图。若目标设备的数量为1,则目标设备可获取至少两张页面图像。这两张页面图像的截屏时间不同,或者截屏位置不同,或者截屏的缩放大小不同等,在此不做限定。示例性地,每隔20秒获取一个截图作为页面图像,每隔20秒滑动页面获取一个截图作为页面图像,对目标业务的页面进行缩放得到不同尺寸的页面图像等。若目标设备的数量大于1,则各目标设备可获取至少一张页面图像。如此,可以通过每一页面图像进行异常识别,还可通过所有的页面图像进行异常识别,以提高异常识别的准确率。
S103、基于目标设备的图像配置信息对至少两张页面图像进行特征聚类,得到至少两张页面图像对应的聚类特征集合。
在本申请实施例中,至少两张页面图像对应的聚类特征集合包含各页面图像的特征中相似的特征。该聚类特征集合可通过聚类算法进行获取得到。本申请对于特征聚类的算法不做限定,可以包括但不限于k均值聚类算法(k-means)或模糊C均值聚类算法(fuzzyc-means,FCM)、具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)、均值漂移聚类算法等。
在一种可能的示例中,步骤S103可以包括以下步骤A1~A3,其中:
A1、基于目标设备的图像配置信息对至少两个页面图像进行分类,得到至少两类页面图像集合。
本申请对于页面图像的分类方法不做限定,可以基于时间、位置、缩放比例等至少一种类型进行分类。在一种可能的示例中,目标设备的数量大于1,步骤A1可以包括以下步骤:基于目标设备的图像配置信息获取各页面图像的截屏时间;基于截屏时间对至少两个页面图像进行分类,得到至少两类页面图像集合,每一页面图像集合的截屏时间相同。
其中,截屏时间为目标设备获取页面图像的时间。可以理解,以同一时刻的页面图像作为一类页面图像,再提取该类页面图像集合中的页面图像的图像特征,从而可以确定任一时刻的不同目标设备获取的页面图像中是否存在异常的图像,有利于提高数据分析的准确率。
A2、获取各页面图像集合的区域图像特征集合。
在本申请实施例中,页面图像集合的区域图像特征集合可包括灰度特征、颜色特征、纹理特征、形状特征等,或者,形状特征和颜色特征对应的色块特征等,在此不做限定。
A3、对区域图像特征集合进行特征聚类,得到至少两张页面图像对应的聚类特征集合。
可以理解,在步骤A1~A3中,基于分类之后的页面图像集合的区域图像特征集合进行特征聚类,可提高特征集合分类的有效性。
在一种可能的示例中,步骤A3可以包括以下步骤A31~A34:
A31、确定区域图像特征集合的参考聚类中心。
A32、计算区域图像特征集合和参考聚类中心之间的相似度。
A33、若相似度小于最小相似度,则基于参考聚类中心对区域图像特征集合进行特征聚类,得到至少两张页面图像对应的聚类特征集合。
A34、若相似度大于或等于最小相似度,则重新确定区域图像特征集合的参考聚类中心,执行步骤A32。
在本申请实施例中,参考聚类中心可以为区域图像特征集合中重复的区域图像特征集合,或者区域图像特征集合对应的图像的中心点等,在此不做限定。且本申请对于参考聚类中心的数量不做限定,可以为大于1的整数。
区域图像特征集合和参考聚类中心之间的相似度用于描述区域图像特征集合对应的总体图像特征和参考聚类中心对应的区域图像特征之间的相似程度。可以先基于区域图像特征集合中每一区域图像特征进行分类统计,得到区域图像特征集合对应的总体图像特征,再与参考聚类中心对应的区域图像特征进行对比,得到区域图像特征集合和参考聚类中心之间的相似度。
本申请对于最小相似度不做限定,可以为预先设置的固定值,例如,0.6。或者可以基于参考聚类中心的数量进行确定,例如,若参考聚类中心的数量为3,则最小相似度可以为0.8。若参考聚类中心的数量为2,则最小相似度可以为0.6。
可以理解,在步骤A31~A34中,先随机确定区域图像特征集合的参考聚类中心,再计算区域图像特征集合和参考聚类中心之间的相似度。若相似度小于最小相似度,则表示参考聚类中心可以为部分区域图像特征的中心,从而可基于该参考聚类中心对区域图像特征集合进行特征聚类。若相似度大于或等于最小相似度,则表示区域图像特征集合中的聚类特征的中心不是参考聚类中心,需确定另外的参考聚类中心。如此,通过多次尝试确定最为相似的聚类中心,可提高获取聚类特征的准确率。
S104、基于聚类特征集合中的异常特征获取目标业务的异常值。
在本申请实施例中,目标业务的异常值用于描述目标业务的异常情况。本申请对于聚类特征集合中的异常特征获取目标业务的异常值的方法不做限定,目标业务的异常值可以预设图像的预设特征集合和聚类特征集合之间的不匹配的特征进行确定,不匹配的特征越多,异常值越大。该预设图像可以为预设的显示图像或备选图像。其中,预设的显示图像是指预设位置原本设置的图像。备选图像是指业务异常时显示的图像,例如,缓冲图像或默认图像等。
异常值或者可以基于聚类特征集合中的异常色块的色块区域大小进行确定。可以理解,同一颜色的色块对应的色块区域占比越大,表示该色块区域为异常色块的概率越大。例如,某一区域出现95%以上白色色块,则认为该区域的色块为异常色块。若异常色块对应的图像的占比越大,则异常值越大。
异常值或者可以基于人工智能分析,例如,通过预设的显示图像和异常图像进行机器学习得到的网络模型对至少两个特征集合进行识别,得到图像的异常值。
在一种可能的示例中,聚类特征集合的数量大于1,步骤S104可以包括以下步骤B1和步骤B2,其中:
B1、基于各聚类特征集合中的异常特征确定目标业务的异常子值。
在本申请实施例中,目标业务的异常子值用于描述单个聚类特征集合所体现的目标业务的异常程度。在一种可能的示例中,聚类特征集合中的异常特征包括异常色块,步骤B1可以包括以下步骤:基于聚类特征集合生成参考图像;对参考图像进行色块划分,得到各色块的区域占比;基于区域占比从参考图像中选取异常色块;获取异常色块和预设图像之间的匹配值;基于匹配值确定目标业务的异常子值。
其中,参考图像是基于特征集合生成的图像,则满足特征集合中重叠的特征,以及具有差异的特征。异常色块的选取可以基于区域占比和一个阈值的大小关系,即大于该阈值时,确定为异常色块。预设图像如前所述可包括预设的显示图像或备选图像。需要说明的是,该预设图像和异常色块对应的图像待显示的内容应相同。
可以理解,在该示例中,先基于聚类得到的特征集合所生成的参考图像中不同色块的区域占比选取异常色块。再基于异常色块和预设图像之间的匹配值确定目标业务的异常子值,有利于提高确定异常值的准确率。
B2、基于各聚类特征集合对应的预设权值对异常子值进行加权计算,得到目标业务的异常值。
本申请对于预设权值的大小不做限定,可以基于分类的类型进行确定,例如,若基于位置进行分类,则可以基于位置对应的页面元素的类型进行确定。又例如,若基于时间进行分类,则可以基于服务器中该时间对应的性能压力进行确定等。
可以理解,在步骤B1和步骤B2中,通过各聚类特征集合对应的预设权值对该聚类特征集合所确定的目标业务的异常子值进行加权计算,可提高获取目标业务的异常值的准确率。
S105、若异常值大于或等于预设阈值,则确定目标业务为异常业务。
本申请对于预设阈值不做限定,可以基于页面图像的数量进行确定,或聚类特征集合的数量进行确定等。可以理解,若目标业务的异常值大于或预设阈值,则确定目标业务为异常业务。否则,可以直接确定为正常业务,或者继续检测等,在此不做限定。
在图1所示的方法中,先基于爬虫技术获取目标应用中各业务的链接地址。若满足目标应用中目标业务的业务异常检测条件,则从目标业务的链接地址对应的文件夹中获取目标业务的至少两张页面图像。然后基于目标设备的图像配置信息对至少两张页面图像进行特征聚类,得到至少两张页面图像对应的聚类特征集合,再基于聚类特征集合中的异常特征获取目标业务的异常值。若该异常值大于或等于预设阈值,则确定目标业务为异常业务。其中,页面图像是目标设备基于链接地址和目标设备的图像配置信息获取的页面截图。如此,基于目标设备获取目标业务的页面截图确定目标业务的展示页面是否异常,从而判断目标业务是否异常。且目标业务的页面截图多于1个,可综合判断待测业务是否异常,提高了异常识别的效率,有利于提高业务的稳定性。若目标设备的数量为多个,可减少了个别设备的图像误差。
在一种可能的示例中,在步骤S104之后,还可以包括以下步骤:基于所述链接地址获取所述目标业务的业务信息;基于所述业务信息确定所述目标业务对应的通知接口;基于所述通知接口向所述目标业务对应的工作人员发送业务异常提示。
在存储链接地址之前,还可通过爬虫技术获取,并存储目标业务的业务信息,例如,产品、商户、活动编号、个性化信息等。业务信息还可包括通知接口,即用于与目标业务对应的工作人员进行通信。目标业务对应的工作人员可以为目标业务在发生异常情况时呼叫的处理人员,或者可以为目标业务对应的客服人员等。
本申请对于确定通知接口的方法不做限定,若业务信息包括通知接口,则直接从业务信息中选取通知接口。否则,基于目标业务对应的标识信息(例如,商户的标识、产品的标识、活动编号等)查找目标业务对应的通知接口,或者基于预设的接口规则确定各项业务信息对应的通知接口等。
可以理解,在确定目标业务发生异常时,可以基于该业务信息确定目标业务对应的通知接口。再通过该通知接口向目标业务对应的工作人员发送业务异常提示,从而不需考虑目标业务对应的工作人员是否发生变化,就可以通知目标业务对应的工作人员进行异常处理,可提高异常处理的效率和有效性。
需要说明的是,若目标业务的链接地址对应的文件夹中目标业务的页面图像的数量为1,则可以基于该页面图像与预设图像进行匹配,或者识别页面图像中各色块的区域占比等。若页面图像与预设图像之间的匹配值小于一个阈值,或区域占比大于一个阈值,确定目标业务为异常业务。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
与图1所示的实施例一致,请参照图2,图2是本申请提出的一种基于图像识别的业务异常检测装置的结构示意图。如图2所示,上述基于图像识别的业务异常检测装置200包括:
链接获取单元201用于基于爬虫技术获取目标应用中目标业务的链接地址
图像获取单元202用于若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
特征获取单元203用于基于所述目标设备的图像配置信息对所述页面图像进行特征聚类,得到获取所述至少两张页面图像对应的聚类特征集合;
异常获取单元204用于基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
异常确定单元205用于若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
在一种可能的示例中,所述特征获取单元203具体用于基于所述目标设备的图像配置信息对所述至少两个页面图像进行分类,得到至少两类页面图像集合;获取各所述页面图像集合的区域图像特征集合;对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合。
在一种可能的示例中,所述目标设备的数量大于1,所述特征获取单元203具体用于基于所述目标设备的图像配置信息获取各所述页面图像的截屏时间;基于所述截屏时间对所述至少两个页面图像进行分类,得到至少两类页面图像集合,每一所述页面图像集合的截屏时间相同。
在一种可能的示例中,所述特征获取单元203具体用于确定所述区域图像特征集合的参考聚类中心;计算所述区域图像特征集合和所述参考聚类中心之间的相似度;若所述相似度小于最小相似度,则基于所述参考聚类中心对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;或者若所述相似度大于或等于所述最小相似度,则重新确定所述区域图像特征集合的参考聚类中心,执行所述计算所述区域图像特征集合和所述参考聚类中心之间的相似度的步骤。
在一种可能的示例中,所述聚类特征集合的数量大于1,所述异常获取单元204具体用于基于各所述聚类特征集合中的异常特征确定所述目标业务的异常子值;基于各所述聚类特征集合对应的预设权值对所述异常子值进行加权计算,得到所述目标业务的异常值。
在一种可能的示例中,所述聚类特征集合中的异常特征包括异常色块,所述异常获取单元204具体用于基于所述聚类特征集合生成参考图像;对所述参考图像进行色块划分,得到各色块的区域占比;基于所述区域占比从所述参考图像中选取所述异常色块;获取所述异常色块和预设图像之间的匹配值;基于所述匹配值确定所述目标业务的异常子值。
在一种可能的示例中,所述聚类特征集合中的异常特征包括异常色块,所述基于图像识别的业务异常检测装置200还包括信息获取单元206、接口确定单元207和通知单元207。其中,信息获取单元207用于基于所述链接地址获取所述目标业务的业务信息;接口确定单元207用于基于所述业务信息确定所述目标业务对应的通知接口;通知单元208用于基于所述通知接口向所述目标业务对应的工作人员发送所述目标业务的业务异常提示。
基于图像识别的业务异常检测装置200中各个单元执行详细过程可以参见前述方法实施例中的执行步骤,此处不在赘述。
与图1的实施例一致,请参照图3,图3是本申请实施例提供的一种计算机设备的结构示意图。如图3所示,该计算机设备300包括处理器310、存储器320和通信接口330。处理器310、存储器320和通信接口330之间通过总线350互相连接。图2所示的图像获取单元202、信息获取单元206和通知单元208所实现的相关功能可通过通信接口330来实现,图2所示的链接获取单元201、特征获取单元203、异常获取单元204、异常确定单元205和接口确定单元207所实现的相关功能可通过处理器310来实现。
上述存储器320中存储有计算机程序340,计算机程序340被配置由上述处理器310执行,计算机程序340包括用于执行以下步骤的指令:
基于爬虫技术获取目标应用中目标业务的链接地址
若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
基于所述目标设备的图像配置信息对所述至少两张页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;
基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
在一个可能的示例中,在所述基于所述目标设备的图像配置信息对所述至少两张页面图像进行特征聚类,得到方面,所述计算机程序340具体包括用于执行以下步骤的指令:
基于所述目标设备的图像配置信息对所述至少两个页面图像进行分类,得到至少两类页面图像集合;
获取各所述页面图像集合的区域图像特征集合;
对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合。
在一个可能的示例中,所述目标设备的数量大于1,在所述基于所述目标设备的图像配置信息对所述至少两个页面图像进行分类,得到至少两类页面图像集合方面,所述计算机程序340具体包括用于执行以下步骤的指令:
基于所述目标设备的图像配置信息获取各所述页面图像的截屏时间;
基于所述截屏时间对所述至少两个页面图像进行分类,得到至少两类页面图像集合,每一所述页面图像集合的截屏时间相同。
在一个可能的示例中,在所述对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合方面,所述计算机程序340具体包括用于执行以下步骤的指令:
确定所述区域图像特征集合的参考聚类中心;
计算所述区域图像特征集合和所述参考聚类中心之间的相似度;
若所述相似度小于最小相似度,则基于所述参考聚类中心对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;或者
若所述相似度大于或等于所述最小相似度,则重新确定所述区域图像特征集合的参考聚类中心,执行所述计算所述区域图像特征集合和所述参考聚类中心之间的相似度的步骤。
在一个可能的示例中,所述聚类特征集合的数量大于1,在所述基于所述聚类特征集合中的异常特征获取所述目标业务的异常值方面,所述计算机程序340具体包括用于执行以下步骤的指令:
基于各所述聚类特征集合中的异常特征确定所述目标业务的异常子值;
基于各所述聚类特征集合对应的预设权值对所述异常子值进行加权计算,得到所述目标业务的异常值。
在一个可能的示例中,所述聚类特征集合中的异常特征包括异常色块,在所述基于各所述聚类特征集合中的异常特征确定所述目标业务的异常子值方面,所述计算机程序340具体包括用于执行以下步骤的指令:
基于所述聚类特征集合生成参考图像;
对所述参考图像进行色块划分,得到各色块的区域占比;
基于所述区域占比从所述参考图像中选取所述异常色块;
获取所述异常色块和预设图像之间的匹配值;
基于所述匹配值确定所述目标业务的异常子值。
在一个可能的示例中,在所述确定所述目标业务为异常业务之后,所述计算机程序340还包括用于执行以下步骤的指令:
基于所述链接地址获取所述目标业务的业务信息;
基于所述业务信息确定所述目标业务对应的通知接口;
基于所述通知接口向所述目标业务对应的工作人员发送所述目标业务的业务异常提示。
本申请实施例还提供一种计算机可读存储介质,其中,该计算机可读存储介质存储用于存储计算机程序,该计算机程序使得计算机执行以实现方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备或服务器。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行以实现方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备或服务器。
在上述实施例中,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。例如,区块链中可存储目标业务的链接地址和通知接口等,在此不做限定。
本申请实施例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如至少一个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到至少一个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。
集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random accessmemory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于图像识别的业务异常检测方法,其特征在于,包括:
基于爬虫技术获取目标应用中目标业务的链接地址
若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
基于所述目标设备的图像配置信息对所述至少两张页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;
基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标设备的图像配置信息对所述至少两张页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合,包括:
基于所述目标设备的图像配置信息对所述至少两个页面图像进行分类,得到至少两类页面图像集合;
获取各所述页面图像集合的区域图像特征集合;
对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合。
3.根据权利要求2所述的方法,其特征在于,所述目标设备的数量大于1,所述基于所述目标设备的图像配置信息对所述至少两个页面图像进行分类,得到至少两类页面图像集合,包括:
基于所述目标设备的图像配置信息获取各所述页面图像的截屏时间;
基于所述截屏时间对所述至少两个页面图像进行分类,得到至少两类页面图像集合,每一所述页面图像集合的截屏时间相同。
4.根据权利要求2所述的方法,其特征在于,所述对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合,包括:
确定所述区域图像特征集合的参考聚类中心;
计算所述区域图像特征集合和所述参考聚类中心之间的相似度;
若所述相似度小于最小相似度,则基于所述参考聚类中心对所述区域图像特征集合进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;或者
若所述相似度大于或等于所述最小相似度,则重新确定所述区域图像特征集合的参考聚类中心,执行所述计算所述区域图像特征集合和所述参考聚类中心之间的相似度的步骤。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述聚类特征集合的数量大于1,所述基于所述聚类特征集合中的异常特征获取所述目标业务的异常值,包括:
基于各所述聚类特征集合中的异常特征确定所述目标业务的异常子值;
基于各所述聚类特征集合对应的预设权值对所述异常子值进行加权计算,得到所述目标业务的异常值。
6.根据权利要求5所述的方法,其特征在于,所述聚类特征集合中的异常特征包括异常色块,所述基于各所述聚类特征集合中的异常特征确定所述目标业务的异常子值,包括:
基于所述聚类特征集合生成参考图像;
对所述参考图像进行色块划分,得到各色块的区域占比;
基于所述区域占比从所述参考图像中选取所述异常色块;
获取所述异常色块和预设图像之间的匹配值;
基于所述匹配值确定所述目标业务的异常子值。
7.根据权利要求1-4中任一项所述的方法,其特征在于,在所述确定所述目标业务为异常业务之后,所述方法还包括:
基于所述链接地址获取所述目标业务的业务信息;
基于所述业务信息确定所述目标业务对应的通知接口;
基于所述通知接口向所述目标业务对应的工作人员发送所述目标业务的业务异常提示。
8.一种基于图像识别的业务异常检测装置,其特征在于,包括:
链接获取单元,用于基于爬虫技术获取目标应用中目标业务的链接地址;
图像获取单元,用于若满足所述目标业务的业务异常检测条件,则从所述目标业务的链接地址对应的文件夹中获取所述目标业务的至少两张页面图像,所述页面图像为目标设备基于所述链接地址和所述目标设备的图像配置信息获取的页面截图;
特征获取单元,用于基于所述目标设备的图像配置信息对所述页面图像进行特征聚类,得到所述至少两张页面图像对应的聚类特征集合;
异常获取单元,用于基于所述聚类特征集合中的异常特征获取所述目标业务的异常值;
异常确定单元,用于若所述异常值大于或等于预设阈值,则确定所述目标业务为异常业务。
9.一种计算机设备,其特征在于,包括处理器、存储器和通信接口,其中,所述存储器存储有计算机程序,所述计算机程序被配置由所述处理器执行,所述计算机程序包括用于执行权利要求1-7中任一项方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序使得计算机执行以实现权利要求1-7中任一项所述的方法。
CN202210057714.0A 2022-01-19 2022-01-19 基于图像识别的业务异常检测方法、装置、设备及介质 Pending CN114398994A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210057714.0A CN114398994A (zh) 2022-01-19 2022-01-19 基于图像识别的业务异常检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210057714.0A CN114398994A (zh) 2022-01-19 2022-01-19 基于图像识别的业务异常检测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114398994A true CN114398994A (zh) 2022-04-26

Family

ID=81231162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210057714.0A Pending CN114398994A (zh) 2022-01-19 2022-01-19 基于图像识别的业务异常检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114398994A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221523A (zh) * 2022-09-20 2022-10-21 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221523A (zh) * 2022-09-20 2022-10-21 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备
CN115221523B (zh) * 2022-09-20 2022-12-27 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备

Similar Documents

Publication Publication Date Title
CN109492378B (zh) 一种基于设备识别码的身份验证方法、服务器及介质
CN111414334B (zh) 基于云技术的文件分片上传方法、装置、设备及存储介质
CN109743315B (zh) 针对网站的行为识别方法、装置、设备及可读存储介质
EP3178011B1 (en) Method and system for facilitating terminal identifiers
CN109561085A (zh) 一种基于设备识别码的身份验证方法、服务器及介质
US20130268679A1 (en) Information processing apparatus, information processing method, and program
CN110290522B (zh) 用于移动设备的风险识别方法、装置和计算机系统
CN104067283A (zh) 识别移动环境的木马化应用程序
CN111338608B (zh) 分布式应用开发方法、装置、节点设备及可读存储介质
CN109862003A (zh) 本地威胁情报库的生成方法、装置、系统及存储介质
CN111885050A (zh) 基于区块链网络的数据存储方法、装置、相关设备及介质
CN112150113A (zh) 档案数据的借阅方法、装置和系统、资料数据的借阅方法
US20170017561A1 (en) Software detection method and device
CN111142863B (zh) 一种页面生成的方法及装置
CN112581129A (zh) 区块链交易数据治理方法及装置、计算机设备及存储介质
CN114398994A (zh) 基于图像识别的业务异常检测方法、装置、设备及介质
CN113609479A (zh) 一种文件检测的方法、装置、电子设备及可读存储介质
CN108595957A (zh) 浏览器主页篡改检测方法、装置及存储介质
CN114979109B (zh) 行为轨迹检测方法、装置、计算机设备和存储介质
CN114422586B (zh) 事件通知方法、装置、计算机设备及存储介质
CN111953633A (zh) 基于终端环境的访问控制方法及访问控制装置
CN112650557B (zh) 一种命令执行方法以及装置
JP2009053896A (ja) 不正操作検出装置およびプログラム
KR20220073657A (ko) 이미지 기반 악성코드 탐지 방법 및 장치와 이를 이용하는 인공지능 기반 엔드포인트 위협탐지 및 대응 시스템
CN113434069A (zh) 菜单配置方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination