CN113835591A - 弹窗处理方法及装置 - Google Patents
弹窗处理方法及装置 Download PDFInfo
- Publication number
- CN113835591A CN113835591A CN202111155883.XA CN202111155883A CN113835591A CN 113835591 A CN113835591 A CN 113835591A CN 202111155883 A CN202111155883 A CN 202111155883A CN 113835591 A CN113835591 A CN 113835591A
- Authority
- CN
- China
- Prior art keywords
- popup
- processed
- window
- pop
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 126
- 238000001514 detection method Methods 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 abstract description 19
- 238000012423 maintenance Methods 0.000 abstract description 3
- 239000000463 material Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请提供弹窗处理方法及装置,其中所述弹窗处理方法包括:接收待处理图片;在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;基于所述目标处理规则处理所述待处理弹窗。本申请的弹窗处理方法,提供了一种简单高效的弹窗处理流程,节约了人力物力、时间和硬件资源,提升了测试效率,降低了弹窗识别的调试难度和维护成本。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种弹窗处理方法。本申请同时涉及一种弹窗处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
在基于移动端设备的App自动化测试中,会出现一些系统级(如定位权限)或APP级(如登录)的偶发弹窗,这会导致测试用例的正常执行流程被打断,为了解决该问题,通常对所有类型的弹窗进行预先定义,并将弹窗数据保存为列表,当出现偶发弹窗时通过截图后以图搜图的方式判断本次弹窗页面是否存在预定义好的弹窗列表中,这种方法流程复杂、泛化能力、兼容性、自动化能力都较差,严重影响测试效率。
因此,亟需一种更简单高效的弹窗处理流程。
发明内容
有鉴于此,本申请实施例提供了一种弹窗处理方法。本申请同时涉及一种弹窗处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的弹窗处理流程复杂,泛化能力、兼容性、自动化能力较差,严重影响测试效率的问题。
根据本申请实施例的第一方面,提供了一种弹窗处理方法,包括:
接收待处理图片;
在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;
将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;
基于所述目标处理规则处理所述待处理弹窗。
根据本申请实施例的第二方面,提供了一种弹窗处理装置,包括:
接收模块,被配置为接收待处理图片;
获取模块,被配置为在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;
确定模块,被配置为将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;
处理模块,被配置为基于所述目标处理规则处理所述待处理弹窗。
根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述弹窗处理方法的步骤。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述弹窗处理方法的步骤。
本申请提供的弹窗处理方法,接收待处理图片;在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;基于所述目标处理规则处理所述待处理弹窗。本申请一实施例提供的弹窗处理方法,提供了一种简单高效的弹窗处理流程,节约了人力物力、时间和硬件资源,提升了测试效率,降低了弹窗识别的调试难度和维护成本。
附图说明
图1是本申请一实施例提供的一种弹窗处理方法的流程图;
图2是本申请一实施例提供的弹窗检测模型训练方法的流程图;
图3是本申请一实施例提供的预设弹窗处理配置表的示意图;
图4是本申请一实施例提供的一种应用于UI测试用例的弹窗处理方法的处理流程图;
图5是本申请一实施例提供的一种弹窗处理装置的结构示意图;
图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
UI自动化测试:基于移动端设备的APP自动化测试。
偶发弹窗:在测试用例执行、回放过程中,会出现一些系统级(如定位权限)或App级(如登录)的偶现弹窗,这会导致用例的正常执行流程被打断;偶发是指可能出现也可能不出现,如启动App进入首页后,可能会弹出登录弹窗,也有可能不弹出。
Airtext:UI自动化开源工具,提供图片识别、控件点击、文本输入框字符输入等操作移动设备的能力。
BFS:小文件存储系统。
在现有的弹窗处理过程中,通常首先通过路径(Xpath或poco定位控件Element)或图片定位(截图定位控件Image)方式对所有类型弹窗进行预定义,并将弹窗数据保存为列表。在UI用例执行流程过程中,出现偶发弹窗时,程序抛出Element/Image NOT Found异常,接着通过截图、搜索的方式判断本次弹窗页面是否存在预定义好的弹窗列表中,如果存在则做相应处理。
上述弹窗处理方法存在下述问题:一方面在弹窗预定义方法中,路径定位存在不兼容webview版本差异情况,如某弹窗A,对应一个Xpath路径或pocp路径,但在不同系统、品牌的手机中,Xpath、poco路径并不一样,或者无法定位Element;另一方面,图片定位弹窗的方式使用的是开源工具Airtest以图搜图的能力,识别效率不高,如果预定义弹窗图片比较多,单张图识别耗时较长(2.5秒),这会导致弹窗识别效率低,影响UI用例的执行效率;另外,不同的弹窗识别方式也增大了弹窗识别的调试难度和维护管理成本。
基于此,在本申请中,提供了一种弹窗处理方法,本申请同时涉及一种弹窗处理装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例提供的一种弹窗处理方法的流程图,具体包括以下步骤:
步骤102:接收待处理图片。
待处理图片即需要用来识别是否包括有弹窗的图片,本申请提供的弹窗处理方法主要用于UI自动化测试中,在客户端执行自动化测试的UI用例过程中,当执行流程被打断时,会捕获到Element/Image NOT Found异常,调用Airtest的截图能力对客户端的屏幕进行截图,并将截图上传至服务器的BFS系统,该截图即为待处理图片,服务器接收到客户端上传的待处理图片。
在本申请提供的一具体实施方式中,服务器接收到客户端上传的待处理图片P。
本申请提供了一种弹窗处理方法,因此,在接收到待处理图片后,要检测待处理图片中是否包含有弹窗,基于此,在接收待处理图片之后,所述方法还包括:
检测所述待处理图片中是否包括待处理弹窗。
具体的,检测所述待处理图片中是否包括待处理弹窗,包括:
将所述待处理图片输入至弹窗检测模型,其中,所述弹窗检测模型用于确定所述待处理图片中是否包括待处理弹窗;
获取所述弹窗检测模型输出的检测结果。
目前,深度学习技术由于其强大的特征表示和端到端的学习能力,使目标检测性能有了极大的提升,本申请提供的弹窗检测模型主要用于识别、检测弹窗位置,优选的弹窗检测模型使用YoloV3网络,YoloV3网络是一种端到端的目标检测网络,其将目标检测问题转化为回归问题求解,实现从图像输入到目标位置和类别信息的输出。
将待处理图片输入至弹窗检测模型中后,使用弹窗检测模型判断待处理图片中是否包含有弹窗,若没有弹窗,则给出提示“不存在弹窗”;若有弹窗,则输出弹窗的弹窗区域。
在本申请提供的一具体实施方式中,沿用上例,将待处理图片P输入至YoloV3弹窗检测模型,判断待处理图片P中包括待处理弹窗,并输出待处理弹窗的位置信息I(x1,y1,x2,y2),其中,(x1,y1)为待处理弹窗的左上角顶点坐标,(x2,y2)为待处理弹窗的右下角顶点坐标。
在实际应用中,弹窗检测模型需要预先通过样本数据进行相应的模型训练,其中YoloV3弹窗检测模型使用训练数据集获取弹窗数据,通过使用边缘分割方式得到标注数据,并通过经过标注的训练数据集对弹窗检测模型进行训练,直至获得训练完成的弹窗检测模型。具体的,参见图2,图2示出本申请一实施例提供的弹窗检测模型训练方法的流程图,包括步骤202至步骤208。
步骤202:获取样本图片和所述样本图片对应的样本标签,其中所述样本标签用于标识所述样本图片中是否有弹窗。
样本图片即用于训练弹窗检测模型的训练图片,样本图片对应的样本标签用于标识样本图片中是否有弹窗,若样本图片中有弹窗,则样本标签标识弹窗的位置信息,若样本图片中没有弹窗,则样本标签标识该样本图片没有弹窗。
步骤204:将所述样本图片输入至弹窗检测模型,获得所述弹窗检测模型输出的预测结果。
将样本图片输入至弹窗检测模型,弹窗检测模型经过识别,判断样本图片中是否有弹窗,如果有弹窗,需要输出预测弹窗位置信息,如果没有弹窗,输出没有弹窗。
步骤206:根据所述预测结果和所述样本标签计算损失值。
根据模型输出的预测结果和样本标签计算损失值,计算损失值的损失函数在实际应用中可以为0-1损失函数、绝对值损失函数、平方损失函数、交叉熵损失函数等,在本申请中,对损失函数的选择不做限定,以实际应用为准。
步骤208:根据所述损失值调整所述弹窗检测模型的模型参数,并继续训练所述弹窗检测模型,直至达到训练停止条件。
在计算获得损失值后,根据损失值反向传播调整弹窗检测模型的模型参数,并用下一批次样本图片和样本标签继续训练弹窗检测模型,直至损失值小于预设阈值和/或训练轮次达到预设的训练轮次。在完成模型训练后,获得训练好的弹窗检测模型。
步骤104:在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息。
待处理弹窗即为需要进行后续处理的弹窗,当通过弹窗检测模型确定待处理图片中包含待处理弹窗的情况下,需要获取待处理弹窗的待处理弹窗属性信息,具体的,待处理弹窗属性信息具体是指提取待处理弹窗的弹窗类型,以及弹窗中包含的操作点位置的信息。
具体的,获取所述待处理弹窗的待处理弹窗属性信息,包括:
获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域;
基于所述弹窗区域识别所述待处理弹窗的文本信息,生成待处理弹窗属性信息。
其中,如果在检测到待处理图片中包含待处理弹窗的情况下,弹窗检测模型会输出待处理弹窗的对应的弹窗区域,基于该弹窗区域可以对待处理弹窗进行OCR识别,识别待处理弹窗的文本位置信息(左上角、右下角坐标)识别文本内容信息、置信度等等。
本申请的通过文本识别网络对待处理弹窗进行文本识别,文本识别网络优选使用CRNN网络,由卷积层、循环层、转录层组成,其中,卷积层是简单的CNN网络,用于提取图像特征,循环层是一个深层双向LSTM网络,在卷积提取特征的基础上,进一步提取文字序列特征,转录层主要将循环层获取的序列特征信息通过去重、整合等操作,转化为最终的识别结果。
在本申请提供的一种具体实施方式中,获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域,包括:
获取所述弹窗检测模型输出的所述待处理弹窗位置信息。
相应的,基于所述弹窗区域识别所述待处理弹窗的文本信息,包括:
基于所述待处理弹窗位置信息在所述待处理图片中确定待识别区域;
对所述待识别区域进行文本识别,获取所述待处理弹窗的文本信息。
弹窗检测模型在识别到待处理图片中的待处理弹窗后,会输出待处理弹窗的待处理弹窗位置信息,具体的,可以为待处理弹窗的对角线坐标,例如左上角和右下角坐标;或者左下角和右上角坐标;也可以是待处理弹窗的某个顶点坐标和待处理弹窗的长和宽,待处理弹窗位置信息的具体表现形式以实际应用为准,在本申请中对此不做限定。
在获得待处理弹窗位置信息之后,即可根据该待处理弹窗位置信息在待处理图片中确定待处理弹窗对应的待识别区域,再通过OCR文本识别网络对待识别区域进行文本识别,获取多条文本信息,例如弹窗类型、待处理位置信息等等,再将多条文本信息进行聚合输出,获得待处理弹窗属性信息。
在本申请提供的另一具体实施方式中,获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域,包括:
获取所述弹窗检测模型输出的所述待处理弹窗图片。
相应的,基于所述弹窗区域识别所述待处理弹窗的文本信息,包括:
对所述待处理弹窗图片进行文本识别,获取所述待处理弹窗的文本信息。
弹窗检测模型在识别到待处理图片中的待处理弹窗后,还可以根据待处理弹窗的待处理弹窗位置信息将待处理弹窗从待识别图片中截取出来,获得待处理弹窗图片,再通过OCR文本识别网络对待处理弹窗图片进行文本识别,获取多条文本信息,例如弹窗类型、待处理位置信息等等,再将多条文本信息进行聚合输出,获得待处理弹窗属性信息。
在本申请提供的一具体实施方式中,沿用上例,在检测到待处理图片P中包含待处理弹窗后,从待处理图片中截取待处理弹窗的待处理弹窗图片,再对待处理弹窗图片进行OCR文本识别,获得待处理弹窗属性信息“信任此电脑_信任_不信任”。
本申请提供的一具体实施方式中,OCR文本识别返回的信息如下所示,其中pop_position为弹窗检测网络检测得到弹窗位置信息(左上角、右下角坐标),desc”为OCR文本识别网络确定弹窗类别信息,"need_handle"中包含文本识别网络输出的操作点内容及位置信息。"handle_steps"为信息整合后最终的操作点位置信息。
步骤106:将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则。
预设弹窗处理配置表为事先维护的一套弹窗类型对应弹窗操作流程信息的配置文件,如图3所示,图3示出了本申请一实施例提供给的预设弹窗处理配置表的示意图。在预设弹窗处理配置表中的格式为“弹窗类型_操作信息”,其中,弹窗类型为待处理弹窗的类型,操作信息为该待处理弹窗对应的处理规则。
具体的,所述预设弹窗处理配置表中预先配置有弹窗类型和对应的处理规则;
将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则,包括:
根据所述待处理弹窗属性信息在所述预设弹窗处理配置表中确定目标弹窗类型;
根据所述目标弹窗类型确定对应的目标处理规则。
在预设弹窗处理配置表中预先配置有弹窗类型和对应的处理规则,如图3所示,以“用户协议与隐私_同意继续使用”为例,其中“用户协议与隐私”为弹窗类型,“同意继续使用”为处理规则,当遇到弹窗类型为“用户协议与隐私”的待处理弹窗时,执行的操作为“同意继续使用”。
在获取待处理弹窗属性信息后,将待处理弹窗属性与预设弹窗处理配置表中进行查询,如果在预设弹窗处理配置表中匹配到与待处理弹窗属性相同的弹窗类型后,确定对应的操作信息作为待处理弹窗的目标处理规则。
在本申请提供的一具体实施方式中,沿用上例,待处理弹窗属性信息“信任此电脑_信任_不信任”,将该待处理弹窗属性信息在预设弹窗处理配置表中进行查询,查询到与之对应的预设弹窗处理配置为“信任此电脑_信任”,即说明对于弹窗类型为“信任此电脑”的待处理弹窗,目标处理规则为“信任”。
在本申请提供的又一具体实施方式中,以待处理弹窗属性信息“获取此设备的位置信息_禁止后不再提示_始终允许_不允许”,将该待处理弹窗属性信息在预设弹窗处理配置表中进行查询,查询到与之对应的预设弹窗处理配置为“获取此设备的位置信息_禁止后不再提示_始终允许”,即说明对于弹窗类型为“获取此设备的位置信息”的待处理弹窗,目标处理规则为“禁止后不再提示,并始终允许”
步骤108:基于所述目标处理规则处理所述待处理弹窗。
在确定目标处理规则后,即可根据该目标处理规则处理该待处理弹窗,以便UI自动化测试可以顺利进行。
在本申请中,通过Airtest工具进行弹窗处理操作,在获取目标处理规则后,即可通过该工具根据目标处理规则对待处理弹窗进行具体的弹窗处理。
本申请提供的弹窗处理方法,包括接收待处理图片;在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;基于所述目标处理规则处理所述待处理弹窗,通过本申请提供的弹窗处理方法,在UI自动化用例执行过程中,出现弹窗时会对屏幕截屏并将图片发送至服务器,在服务器对弹窗进行识别,获得待处理弹窗属性信息,再将待处理弹窗属性信息与预设弹窗处理配置表进行匹配,进而确定待处理弹窗的处理规则,将图片转换为文本进行处理,避免了以图搜图带来的资源消耗,提高了弹窗处理效率,减少了UI自动化测试的等待时间。
其次,通过基于深度学习的弹窗检测模型和文本识别模型避免了弹窗预定义、弹窗管理的复杂流程,直接用图像识别方式进行弹窗处理,将图像转换为文字,再通过文字进行匹配,在保证弹窗识别准确率的同时,提高了弹窗处理效率。
下述结合附图4,以本申请提供的弹窗处理方法在UI测试用例的应用为例,对所述弹窗处理方法进行进一步说明。其中,图4示出了本申请一实施例提供的一种应用于UI测试用例的弹窗处理方法的处理流程图,具体包括以下步骤:
步骤402:接收UI自动化测试用例中由于异常捕获的终端截图。
在本申请提供的实施例中,手机在执行UI自动化测试的过程中,捕获到Element/Image NOT Found异常时,对手机屏幕进行截图,并将截图上传至BFS系统,服务器接收该手机截图。
步骤404:将该终端截图输入至YoloV3弹窗检测网络。
在本申请提供的实施例中,在服务器中将该手机截图输入至YoloV3弹窗检测网络进行检测,并输出检测结果。
步骤406:根据该弹窗检测网络的输出结果判断该终端截图中是否存在弹窗,若是,则执行步骤408,若否,则结束。
在本申请提供的实施例中,根据检测结果判断该手机截图中是否存在有弹窗,若没有,则结束,如有,则执行后续步骤。
步骤408:确定的该弹窗的弹窗区域。
在本申请提供的实施例中,在终端截图中有弹窗的情况下,弹窗检测网络会输出该弹窗在终端截图中的弹窗区域。
步骤410:基于该弹窗区域通过OCR文本检测网络识别该弹窗的文本信息,生成弹窗属性信息。
在本申请提供的实施例中,基于该弹窗区域通过OCR文本检测网络对该弹窗进行文本识别,识别出该弹窗的文本信息,并对文本信息进行拼接,生成弹窗属性信息。
步骤412:根据该弹窗属性信息在所述预设弹窗处理配置表中确定目标弹窗类型和目标处理规则。
在本申请提供的实施例中,在获取到弹窗属性信息后,通过与预设弹窗处理配置表中的预设配置信息进行匹配,获得该弹窗的弹窗类型以及对应的目标处理规则。
步骤414:根据该目标处理规则处理该弹窗。
在本申请提供的实施例中,使用Airtest工具基于该目标处理规则处理该弹窗。
本申请提供的弹窗处理方法,包括接收待处理图片;在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;基于所述目标处理规则处理所述待处理弹窗,通过本申请提供的弹窗处理方法,在UI自动化用例执行过程中,出现弹窗时会对屏幕截屏并将图片发送至服务器,在服务器对弹窗进行识别,获得待处理弹窗属性信息,再将待处理弹窗属性信息与预设弹窗处理配置表进行匹配,进而确定待处理弹窗的处理规则,将图片转换为文本进行处理,避免了以图搜图带来的资源消耗,提高了弹窗处理效率,减少了UI自动化测试的等待时间。
其次,通过基于深度学习的弹窗检测模型和文本识别模型避免了弹窗预定义、弹窗管理的复杂流程,直接用图像识别方式进行弹窗处理,将图像转换为文字,再通过文字进行匹配,在保证弹窗识别准确率的同时,提高了弹窗处理效率。
与上述弹窗处理方法实施例相对应,本申请还提供了弹窗处理装置实施例,图5示出了本申请一实施例提供的一种弹窗处理装置的结构示意图。如图5所示,该装置包括:
接收模块502,被配置为接收待处理图片;
获取模块504,被配置为在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;
确定模块506,被配置为将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;
处理模块508,被配置为基于所述目标处理规则处理所述待处理弹窗。
可选的,所述装置还包括:
检测模块,被配置为检测所述待处理图片中是否包括待处理弹窗。
可选的,所述检测模块,进一步被配置为:
将所述待处理图片输入至弹窗检测模型,其中,所述弹窗检测模型用于确定所述待处理图片中是否包括待处理弹窗;
获取所述弹窗检测模型输出的检测结果。
可选的,所述获取模块504,进一步被配置为:
获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域;
基于所述弹窗区域识别所述待处理弹窗的文本信息,生成待处理弹窗属性信息。
可选的,所述获取模块504,进一步被配置为:
获取所述弹窗检测模型输出的所述待处理弹窗位置信息。
可选的,所述获取模块504,进一步被配置为:
基于所述待处理弹窗位置信息在所述待处理图片中确定待识别区域;
对所述待识别区域进行文本识别,获取所述待处理弹窗的文本信息。
可选的,所述获取模块504,进一步被配置为:
获取所述弹窗检测模型输出的所述待处理弹窗图片。
可选的,所述获取模块504,进一步被配置为:
对所述待处理弹窗图片进行文本识别,获取所述待处理弹窗的文本信息。
可选的,所述预设弹窗处理配置表中预先配置有弹窗类型和对应的处理规则;
可选的,所述装置还包括训练模块,所述训练模块,被配置为:
获取样本图片和所述样本图片对应的样本标签,其中所述样本标签用于标识所述样本图片中是否有弹窗;
将所述样本图片输入至弹窗检测模型,获得所述弹窗检测模型输出的预测结果;
根据所述预测结果和所述样本标签计算损失值;
根据所述损失值调整所述弹窗检测模型的模型参数,并继续训练所述弹窗检测模型,直至达到训练停止条件。
所述确定模块506,进一步被配置为:
根据所述待处理弹窗属性信息在所述预设弹窗处理配置表中确定目标弹窗类型;
根据所述目标弹窗类型确定对应的目标处理规则。
本申请提供的弹窗处理装置,包括接收待处理图片;在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;基于所述目标处理规则处理所述待处理弹窗,通过本申请提供的弹窗处理装置,在UI自动化用例执行过程中,出现弹窗时会对屏幕截屏并将图片发送至服务器,在服务器对弹窗进行识别,获得待处理弹窗属性信息,再将待处理弹窗属性信息与预设弹窗处理配置表进行匹配,进而确定待处理弹窗的处理规则,将图片转换为文本进行处理,避免了以图搜图带来的资源消耗,提高了弹窗处理效率,减少了UI自动化测试的等待时间。
其次,通过基于深度学习的弹窗检测模型和文本识别模型避免了弹窗预定义、弹窗管理的复杂流程,直接用图像识别方式进行弹窗处理,将图像转换为文字,再通过文字进行匹配,在保证弹窗识别准确率的同时,提高了弹窗处理效率。
上述为本实施例的一种弹窗处理装置的示意性方案。需要说明的是,该弹窗处理装置的技术方案与上述的弹窗处理方法的技术方案属于同一构思,弹窗处理装置的技术方案未详细描述的细节内容,均可以参见上述弹窗处理方法的技术方案的描述。
图6示出了根据本申请一实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
计算设备600还包括接入设备640,接入设640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
其中,处理器620执行所述计算机指令时实现所述的弹窗处理方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的弹窗处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述弹窗处理方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现如前所述弹窗处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的弹窗处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述弹窗处理方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。
Claims (13)
1.一种弹窗处理方法,其特征在于,包括:
接收待处理图片;
在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;
将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;
基于所述目标处理规则处理所述待处理弹窗。
2.如权利要求1所述的弹窗处理方法,其特征在于,在接收待处理图片之后,所述方法还包括:
检测所述待处理图片中是否包括待处理弹窗。
3.如权利要求2所述的弹窗处理方法,其特征在于,检测所述待处理图片中是否包括待处理弹窗,包括:
将所述待处理图片输入至弹窗检测模型,其中,所述弹窗检测模型用于确定所述待处理图片中是否包括待处理弹窗;
获取所述弹窗检测模型输出的检测结果。
4.如权利要求3所述的弹窗处理方法,其特征在于,获取所述待处理弹窗的待处理弹窗属性信息,包括:
获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域;
基于所述弹窗区域识别所述待处理弹窗的文本信息,生成待处理弹窗属性信息。
5.如权利要求4所述的弹窗处理方法,其特征在于,获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域,包括:
获取所述弹窗检测模型输出的所述待处理弹窗位置信息。
6.如权利要求5所述的弹窗处理方法,其特征在于,基于所述弹窗区域识别所述待处理弹窗的文本信息,包括:
基于所述待处理弹窗位置信息在所述待处理图片中确定待识别区域;
对所述待识别区域进行文本识别,获取所述待处理弹窗的文本信息。
7.如权利要求4所述的弹窗处理方法,其特征在于,获取所述弹窗检测模型确定的所述待处理弹窗的弹窗区域,包括:
获取所述弹窗检测模型输出的所述待处理弹窗图片。
8.如权利要求7所述的弹窗处理方法,其特征在于,基于所述弹窗区域识别所述待处理弹窗的文本信息,包括:
对所述待处理弹窗图片进行文本识别,获取所述待处理弹窗的文本信息。
9.如权利要求3所述的弹窗处理方法,其特征在于,所述弹窗检测模型通过下述步骤训练获得:
获取样本图片和所述样本图片对应的样本标签,其中所述样本标签用于标识所述样本图片中是否有弹窗;
将所述样本图片输入至弹窗检测模型,获得所述弹窗检测模型输出的预测结果;
根据所述预测结果和所述样本标签计算损失值;
根据所述损失值调整所述弹窗检测模型的模型参数,并继续训练所述弹窗检测模型,直至达到训练停止条件。
10.如权利要求1所述的弹窗处理方法,其特征在于,所述预设弹窗处理配置表中预先配置有弹窗类型和对应的处理规则;
将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则,包括:
根据所述待处理弹窗属性信息在所述预设弹窗处理配置表中确定目标弹窗类型;
根据所述目标弹窗类型确定对应的目标处理规则。
11.一种弹窗处理装置,其特征在于,包括:
接收模块,被配置为接收待处理图片;
获取模块,被配置为在检测到所述待处理图片中包含待处理弹窗的情况下,获取所述待处理弹窗的待处理弹窗属性信息;
确定模块,被配置为将所述待处理弹窗属性信息与预设弹窗处理配置表进行匹配,确定所述待处理弹窗的目标处理规则;
处理模块,被配置为基于所述目标处理规则处理所述待处理弹窗。
12.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述计算机指令时实现权利要求1-10任意一项所述方法的步骤。
13.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-10任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111155883.XA CN113835591A (zh) | 2021-09-29 | 2021-09-29 | 弹窗处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111155883.XA CN113835591A (zh) | 2021-09-29 | 2021-09-29 | 弹窗处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113835591A true CN113835591A (zh) | 2021-12-24 |
Family
ID=78967738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111155883.XA Pending CN113835591A (zh) | 2021-09-29 | 2021-09-29 | 弹窗处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113835591A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311209A (zh) * | 2023-03-28 | 2023-06-23 | 北京匠数科技有限公司 | 窗口检测系统方法、系统和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016095554A1 (zh) * | 2014-12-19 | 2016-06-23 | 广州博冠信息科技有限公司 | 应用程序的测试方法、设备及系统 |
CN111258914A (zh) * | 2020-02-26 | 2020-06-09 | 广州虎牙科技有限公司 | 自动化用例测试的弹窗处理方法、装置、设备及存储介质 |
CN112099885A (zh) * | 2020-08-17 | 2020-12-18 | 联想(北京)有限公司 | 弹窗处理方法及装置、设备、存储介质 |
CN112286781A (zh) * | 2019-07-23 | 2021-01-29 | 百度时代网络技术(北京)有限公司 | 自动化测试方法、装置、设备和存储介质 |
CN113377484A (zh) * | 2021-07-06 | 2021-09-10 | 上海哔哩哔哩科技有限公司 | 弹窗处理方法及装置 |
-
2021
- 2021-09-29 CN CN202111155883.XA patent/CN113835591A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016095554A1 (zh) * | 2014-12-19 | 2016-06-23 | 广州博冠信息科技有限公司 | 应用程序的测试方法、设备及系统 |
CN112286781A (zh) * | 2019-07-23 | 2021-01-29 | 百度时代网络技术(北京)有限公司 | 自动化测试方法、装置、设备和存储介质 |
CN111258914A (zh) * | 2020-02-26 | 2020-06-09 | 广州虎牙科技有限公司 | 自动化用例测试的弹窗处理方法、装置、设备及存储介质 |
CN112099885A (zh) * | 2020-08-17 | 2020-12-18 | 联想(北京)有限公司 | 弹窗处理方法及装置、设备、存储介质 |
CN113377484A (zh) * | 2021-07-06 | 2021-09-10 | 上海哔哩哔哩科技有限公司 | 弹窗处理方法及装置 |
Non-Patent Citations (1)
Title |
---|
张文烨等: "基于图像识别的移动端应用控件检测方法", 计算机应用, no. 1 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311209A (zh) * | 2023-03-28 | 2023-06-23 | 北京匠数科技有限公司 | 窗口检测系统方法、系统和电子设备 |
CN116311209B (zh) * | 2023-03-28 | 2024-01-19 | 北京匠数科技有限公司 | 窗口检测方法、系统和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6214738B2 (ja) | デジタル画像の意味タグの取得方法、および装置 | |
US20170004374A1 (en) | Methods and systems for detecting and recognizing text from images | |
CN107688950B (zh) | 家电售后咨询方法、电子设备和计算机可读存储介质 | |
CN113743607B (zh) | 异常检测模型的训练方法、异常检测方法及装置 | |
US20150278248A1 (en) | Personal Information Management Service System | |
US20200050906A1 (en) | Dynamic contextual data capture | |
CN113377484A (zh) | 弹窗处理方法及装置 | |
WO2019214019A1 (zh) | 基于卷积神经网络的网络教学方法以及装置 | |
US12072926B2 (en) | Image search method and computing device | |
CN111783415A (zh) | 模板配置方法以及装置 | |
CN113835591A (zh) | 弹窗处理方法及装置 | |
CN113468066A (zh) | 用户界面测试方法及装置 | |
CN114120342A (zh) | 简历文档识别方法、装置、计算设备及存储介质 | |
CN113869063A (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
KR102502575B1 (ko) | 상품 트렌드 예측 서비스 제공 장치, 방법 및 프로그램 | |
CN115376137A (zh) | 一种光学字符识别处理、文本识别模型训练方法及装置 | |
US11875024B2 (en) | User operation recording device and user operation recording method | |
CN113849415A (zh) | 控件测试方法、装置、存储介质及电子设备 | |
CN114358313A (zh) | 数据处理方法及装置 | |
CN111324820B (zh) | 邀请方法、装置、终端设备及计算机存储介质 | |
CN113342684A (zh) | 一种网页的测试方法、装置及设备 | |
CN113742553B (zh) | 数据处理方法及装置 | |
CN118411734A (zh) | 组件识别方法及装置 | |
CN114998906B (zh) | 文本检测方法、模型的训练方法、装置、电子设备及介质 | |
CN113657230B (zh) | 训练新闻视频识别模型的方法、检测视频的方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |