CN110287125A - 基于图像识别的软件例行化测试方法及装置 - Google Patents
基于图像识别的软件例行化测试方法及装置 Download PDFInfo
- Publication number
- CN110287125A CN110287125A CN201910597742.XA CN201910597742A CN110287125A CN 110287125 A CN110287125 A CN 110287125A CN 201910597742 A CN201910597742 A CN 201910597742A CN 110287125 A CN110287125 A CN 110287125A
- Authority
- CN
- China
- Prior art keywords
- test
- image
- test image
- software
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012360 testing method Methods 0.000 claims abstract description 312
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims description 30
- 238000012937 correction Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 230000003287 optical effect Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000003702 image correction Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 239000000463 material Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000009666 routine test Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004904 shortening Methods 0.000 description 3
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3692—Test management for test results analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Debugging And Monitoring (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种基于图像识别的软件例行化测试方法及装置,方法包括:基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。本申请能够缩短测试时间,有效提升测试效率和测试准确率,并能够降低人力物力成本和缩短投产周期,进而能够有效提高软件投产及应用的可靠性,能够保证用户使用该软件时的信息准确性和可靠性。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及一种基于图像识别的软件例行化测试方法及装置。
背景技术
为了防止其他相关改造对存量内容产生影响,每个版本软件在更新后投产前都需要对已投产的存量内容进行测试,即使这些存量内容并没有任何改变,这个测试过程称之为例行化测试。
目前针对凭证、对账单和报表等内容的例行化测试大多采用人工比对的方式,由于凭证、对账单和报表等内容经常以图像的形式展现,所以需要肉眼核对图像内容中的金额、日期和账户等信息。为了有效提升例行化测试的效率和测试准确度,少数例行化测试采用自动化的形式对凭证、对账单和报表等内容进行测试。
但是,现有的自动化形式的例行化测试是采用逐个字段核对的方式,导致例行化测试的效率低,而且还存在开发成本高和维护成本高的问题。
发明内容
针对现有技术中的问题,本发明提供一种基于图像识别的软件例行化测试方法及装置,能够有效提升例行化测试的效率以及例行化测试的准确度。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种基于图像识别的软件例行化测试方法,包括:
基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
将所述第一测试数据转换为对应的至少一幅第一测试图像;
将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
进一步的,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比之前,还包括:
基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
将所述第二测试数据转换为对应的至少一幅第二测试图像。
进一步的,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比之前,还包括:
对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
相对应的,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,包括:
将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
其中,所述预处理包括:二值化处理和/或中值滤波处理。
其中,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,包括:
采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
进一步的,所述采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行识别生成所述第一测试图像和所述第二测试图像各自对应的文本内容之后,还包括:
根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
相对应的,所述基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比,包括:
基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,所述预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
其中,所述第一测试图像和所述第二测试图像的格式为PNG格式。
第二方面,本发明提供一种基于图像识别的软件例行化测试装置,包括:
第一生成单元,用于基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
第一转换单元,用于将所述第一测试数据转换为对应的至少一幅第一测试图像;
测试单元,用于将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
进一步的,还包括:
第二生成单元,用于基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
第二转换单元,用于将所述第二测试数据转换为对应的至少一幅第二测试图像。
进一步的,还包括:
预处理单元,用于对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
相对应的,所述测试单元,包括:
测试子单元,用于将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
其中,所述预处理包括:二值化处理和/或中值滤波处理。
其中,所述测试单元包括:
识别模块,用于采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
对比模块,用于基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,所述测试单元还包括:
校正模块,用于根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
相对应的,所对比模块包括:
对比子模块,用于基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,所述预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
其中,所述第一测试图像和所述第二测试图像的格式为PNG格式。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于图像识别的测试方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于图像识别的测试方法的步骤。
由上述技术方案可知,本发明提供一种基于图像识别的测试方法及装置,通过基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用,能够缩短测试时间,有效提升测试效率和测试准确率,并能够降低人力物力成本和缩短投产周期,进而能够有效提高软件投产及应用的可靠性,能够保证用户使用该软件时的信息准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的基于图像识别的软件例行化测试方法的流程示意图。
图2为本发明实施例中的基于图像识别的软件例行化测试方法中步骤S103的流程示意图。
图3为本发明实施例中的基于图像识别的软件例行化测试方法中步骤S103的另一流程示意图。
图4为本发明实施例中的基于图像识别的软件例行化测试方法的第二流程示意图。
图5为本发明实施例中的基于图像识别的软件例行化测试方法的第三流程示意图。
图6为本发明实施例中的基于图像识别的软件例行化测试方法中全部流程的流程图。
图7为本发明实施例中的基于图像识别的软件例行化测试装置的结构示意图。
图8为本发明实施例中的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于图像识别的软件例行化测试方法的实施例,参见图1,所述基于图像识别的软件例行化测试方法具体包含有如下内容:
S100:基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
在本步骤中,将存储数据输入至目标软件中,该目标软件的输出结果即为第一测试数据;
在本实施例中,该第一测试数据包括但不限于是:凭证、对账单和报表。
S101:将所述第一测试数据转换为对应的至少一幅第一测试图像;
在本步骤中,对该第一测试数据进行转换为相对应的第一测试图像。其中,第一测试数据是凭证、对账单和报表时,对凭证、对账单和报表中的金额、账户和户名分别转换为相对应的图像。
在具体实施例,获取凭证、对账单和报表上的像素点信息,将金额、账户和户名转换为像素矩阵,像素矩阵中的每个点表示对应位置的像素值,进而根据像素矩阵生成第一测试图像。
进一步的,第一测试图像的格式为PNG格式,PNG格式是一种无损压缩的位图格式,压缩比高,生成文件体积小,便于文件传输。PNG格式经过测试确定可以最大限度保留图片内容信息,进而提升图像质量。
S103:将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
在本步骤中,第二测试图像可以预先根据目标软件的历史版本对应的第二测试数据生成,且用于生成第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同。
进一步的,在多个测试图像对比时,确定多个测试图像的内容对比,比较文本内容,确定没有“垃圾”因素的最大连续匹配序列;其中“垃圾”因素是指标点符号、空格、换行符等无效因素,将识别的内容向量化。
采用余弦定理计算两个向量之间的相似度,相似度大于预设阈值则认定对比文本内容相同。对识别结果进行格式化处理并保存。
第二测试图像的格式PNG格式,PNG格式是一种无损压缩的位图格式,压缩比高,生成文件体积小,便于文件传输。PNG格式经过测试确定可以最大限度保留图片内容信息,进而提升图像质量。
从上述描述可知,本发明实施例提供的基于图像识别的软件例行化测试方法,通过基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用,能够缩短测试时间,有效提升测试效率和测试准确率,并能够降低人力物力成本和缩短投产周期,进而能够有效提高软件投产及应用的可靠性,能够保证用户使用该软件时的信息准确性和可靠性。
在本发明的一实施例中,参见图2,所述基于图像识别的软件例行化测试方法中的步骤S103具体包含有如下内容:
S1031:采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
在本步骤中,使用Tesseract对测试图像进行光学字符识别,Tesseract是一款开源的光学字符识别引擎,通过不断训练使图像转换文本的能力不断增强。经过识别后,将测试图像转换生成可编辑的文本内容,包括:
确定目标图像的连通域,将像素连接的字符规划为一个连通域;根据阈值确定较大的连通域为需要识别的字符;确定字符和文本块;识别文本,根据前期训练的字符形状进行识别。
S1033:基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
在本步骤中,采用字符串比对的方式对第一测试图像和第二测试图像各自对应的文本内容中的内容进行格式对比和内容对比,查找不同字段,并确定对比结果是否相同。
进一步的,将对比结果进行保存,以便返回给调用方使用。
从上述描述可知,通过采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,并基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比,能够适用于票据、对账单、凭证、报表、印鉴、图片、表格、文档等各种图表类内容的核对,即便内容中包含外文、图像、特殊字符等元素也不受影响。测试人员无需掌握外文基础也可以进行外文内容的验证,并且有效保证了验证准确率。避免了人工肉眼核对的缺陷,对于文字、表格等特殊格式准确识别,进而提升核对测试效率
在本发明的一实施例中,参见图3,在步骤S1031之后,还包括:
S1032:根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
在本步骤中,在确定文本内容后,采用自然语言处理算法和模糊匹配算法并结合预设字段库中的文本内容对转换生成可编辑的文本内容进行纠错,提高识别准确率。
相对应的,所述基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比,包括:
基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
采用无监督训练方法中的K均值聚类算法将预设字段库中的文本内容进行聚类划分,提高检索效率,并且有利于自动扩展预设字段库的内容。
从上述描述可知,通过根据预设字段库分别对第一测试图像和第二测试图像各自对应的文本内容校正处理,能够对生成的第一测试图像和第二测试图像各自对应的文本内容进行校正,提高识别准确度,以及提升了识别分析的效率。
在本发明的一实施例中,参见图4,所述基于图像识别的软件例行化测试方法的步骤S103之前还包括步骤S110和步骤S111,具体包含有如下内容:
S110:基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
S111:将所述第二测试数据转换为对应的至少一幅第二测试图像。
第二测试图像可以预先根据目标软件的历史版本对应的第二测试数据生成,且用于生成第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同。
具体请参照上述实施例中的步骤S100和步骤S101,在此不在赘述。
在本发明的一实施例中,参见图5,所述基于图像识别的软件例行化测试方法的步骤S103之前还包括步骤102,具体包含有如下内容:
S102:对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
在本步骤中,通过对第二测试图像进行预处理,有效去除图像中的随机噪声并提高图像对比度,便于识别。
相对应的,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,包括:
将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
其中,所述预处理包括:二值化处理和/或中值滤波处理。
在本实施例中,先进行二值化处理,在二值化处理后进行中值滤波处理,二值化处理根据预设的阈值将图像像素值归一化为0或1,便于图像识别;中值滤波处理使用邻域内所有像素的中位数替换中心像素值,能够有效去除图片的随机噪声。通过二值化处理和中值滤波处理能够提升测试图像的质量。
为进一步地说明本方案,本发明提供一种基于图像识别的软件例行化测试方法的全流程实施例,参见图6,所述基于图像识别的软件例行化测试方法具体包含有如下内容:
1.A101对生成的账单、报表等内容进行截图,转换成图片信息。
2.A102对A101生成的图片进行图像处理,包括图像二值化处理,区分图像前景和后景内容;图像中值滤波处理,去除图像“噪声”,提升图像质量。
3.A103将A102处理后的图片保存为PNG图片,PNG图片是无损图片,占用空间较小。
4.A104将A103的PNG图像进行传输,通过Flask框架将本地图片上传至图像识别服务器,传输快速安全。
5.A105对图像进行整体分析,对A104输出的图片进行布局分析,区分图片中的表格、文本等内容。
6.A106采用光学字符识别相关算法对图片进行字符识别。
7.A107确定图片中的连通域,将像素连接的字符规划为一个连通域。
8.A108根据阈值确定较大的连通域为需要识别的字符。
9.A109确定字符和文本块,对文本块进行切割处理。
10.A110根据前期训练的字符形状对连通域中的字符进行字符识别。
11.A111将A110识别的文本与识别库中的内容进行模糊匹配、相似度分析,纠正识别结果中的错误字符、错误词语等。
12.A112判断当前的测试任务是进行单张图片识别还是多张图片对比分析,如果是多张图片对比分析,则执行A113;否则执行A116.
13.A113对多张图片进行识别,比较识别结果的不同。
14.A114确定所需要对比的多张图片中没有“垃圾”因素的最大连续匹配序列,其中“垃圾”因素是指标点符号、空格、换行符等无效信息。
15.A115将多张图片识别的内容向量化,采用余弦定理计算两个向量之间的相似度,进行相似度分析,输出给A116.
16.A116对识别结果进行格式化处理,保存为Json格式。
17.A117调用Flask框架将识别结果返回给调用方。
本发明实施例提供一种能够实现所述基于图像识别的软件例行化测试方法中全部内容的基于图像识别的软件例行化测试装置的具体实施方式,参见图7,所述基于图像识别的软件例行化测试装置具体包括如下内容:
第一生成单元10,用于基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
第一转换单元20,用于将所述第一测试数据转换为对应的至少一幅第一测试图像;
测试单元30,用于将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
进一步的,还包括:
第二生成单元40,用于基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
第二转换单元50,用于将所述第二测试数据转换为对应的至少一幅第二测试图像。
进一步的,还包括:
预处理单元60,用于对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
相对应的,所述测试单元30,包括:
测试子单元,用于将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
其中,所述预处理包括:二值化处理和/或中值滤波处理。
其中,所述测试单元30包括:
识别模块,用于采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
对比模块,用于基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,所述测试单元还包括:
校正模块,用于根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
相对应的,所对比模块包括:
对比子模块,用于基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
其中,所述预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
其中,所述第一测试图像和所述第二测试图像的格式为PNG格式。
本发明提供的基于图像识别的软件例行化测试装置的实施例具体可以用于执行上述实施例中的基于图像识别的软件例行化测试方法的实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
从上述描述可知,本发明实施例提供的基于图像识别的软件例行化测试装置,通过基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用,能够缩短测试时间,有效提升测试效率和测试准确率,并能够降低人力物力成本和缩短投产周期,进而能够有效提高软件投产及应用的可靠性,能够保证用户使用该软件时的信息准确性和可靠性。
本发明的实施例还提供能够实现上述实施例中的基于图像识别的软件例行化测试方法中全部步骤的一种电子设备的具体实施方式,参见图8,所述电子设备具体包括如下内容:
处理器(processor)601、存储器(memory)602、通信接口(CommunicationsInterface)603和总线604;
其中,所述处理器601、存储器602、通信接口603通过所述总线604完成相互间的通信;所述处理器601用于调用所述存储器602中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的基于图像识别的软件例行化测试方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:通过基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
本发明的实施例还提供能够实现上述实施例中的基于图像识别的软件例行化测试方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的基于图像识别的软件例行化测试方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:通过基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;将所述第一测试数据转换为对应的至少一幅第一测试图像;将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (18)
1.一种基于图像识别的软件例行化测试方法,其特征在于,包括:
基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
将所述第一测试数据转换为对应的至少一幅第一测试图像;
将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
2.根据权利要求1所述的基于图像识别的软件例行化测试方法,其特征在于,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比之前,还包括:
基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
将所述第二测试数据转换为对应的至少一幅第二测试图像。
3.根据权利要求2所述的基于图像识别的软件例行化测试方法,其特征在于,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比之前,还包括:
对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
相对应的,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,包括:
将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
4.根据权利要求3所述的基于图像识别的软件例行化测试方法,其特征在于,所述预处理包括:二值化处理和/或中值滤波处理。
5.根据权利要求1所述的基于图像识别的软件例行化测试方法,其特征在于,所述将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,包括:
采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
6.根据权利要求5所述的基于图像识别的软件例行化测试方法,其特征在于,所述采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行识别生成所述第一测试图像和所述第二测试图像各自对应的文本内容之后,还包括:
根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
相对应的,所述基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比,包括:
基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
7.根据权利要求6所述的基于图像识别的软件例行化测试方法,其特征在于,所述预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
8.根据权利要求1所述的基于图像识别的软件例行化测试方法,其特征在于,所述第一测试图像和所述第二测试图像的格式为PNG格式。
9.一种基于图像识别的软件例行化测试装置,其特征在于,包括:
第一生成单元,用于基于目标软件对应的存量数据,生成该目标软件的当前测试版本对应的第一测试数据;
第一转换单元,用于将所述第一测试数据转换为对应的至少一幅第一测试图像;
测试单元,用于将所述第一测试图像与预获取的所述目标软件的历史版本对应的至少一幅第二测试图像进行图像对比,并根据对应的比较结果确定所述目标软件的当前测试版本是否通过软件例行化测试以判定该当前测试版本是否可投产使用。
10.根据权利要求9所述的基于图像识别的软件例行化测试装置,其特征在于,还包括:
第二生成单元,用于基于目标软件对应的存量数据,生成该目标软件的历史版本对应的第二测试数据;其中,用于生成所述第二测试数据所用的存量数据与用于生成所述第一测试数据所用的存量数据相同;
第二转换单元,用于将所述第二测试数据转换为对应的至少一幅第二测试图像。
11.根据权利要求10所述的基于图像识别的软件例行化测试装置,其特征在于,还包括:
预处理单元,用于对预先获取的所述第二测试图像进行预处理,以及对所述第一测试图像进行预处理;
相对应的,所述测试单元,包括:
测试子单元,用于将经预处理后的至少一幅所述第一测试图像与经预处理后的至少一幅所述第二测试图像进行图像对比。
12.根据权利要求11所述的基于图像识别的软件例行化测试装置,其特征在于,所述预处理包括:二值化处理和/或中值滤波处理。
13.根据权利要求9所述的基于图像识别的软件例行化测试装置,其特征在于,所述测试单元包括:
识别模块,用于采用光学字符识别的方式对所述第一测试图像和所述第二测试图像进行图像识别,生成所述第一测试图像和所述第二测试图像各自对应的文本内容;
对比模块,用于基于字符串比对的方式对所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
14.根据权利要求13所述的基于图像识别的软件例行化测试装置,其特征在于,所述测试单元还包括:
校正模块,用于根据预设字段库分别对所述第一测试图像和所述第二测试图像各自对应的文本内容校正处理;
相对应的,所对比模块包括:
对比子模块,用于基于字符串比对的方式对校正处理后的所述第一测试图像和所述第二测试图像各自对应的文本内容进行对比。
15.根据权利要求14所述的基于图像识别的软件例行化测试装置,其特征在于,所述预设字段库中的文本内容按照K均值聚类算法进行聚类划分。
16.根据权利要求9所述的基于图像识别的软件例行化测试装置,其特征在于,所述第一测试图像和所述第二测试图像的格式为PNG格式。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述的基于图像识别的软件例行化测试方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的基于图像识别的软件例行化测试方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910597742.XA CN110287125B (zh) | 2019-07-04 | 2019-07-04 | 基于图像识别的软件例行化测试方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910597742.XA CN110287125B (zh) | 2019-07-04 | 2019-07-04 | 基于图像识别的软件例行化测试方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287125A true CN110287125A (zh) | 2019-09-27 |
CN110287125B CN110287125B (zh) | 2024-01-09 |
Family
ID=68021860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910597742.XA Active CN110287125B (zh) | 2019-07-04 | 2019-07-04 | 基于图像识别的软件例行化测试方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287125B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955603A (zh) * | 2019-12-03 | 2020-04-03 | 望海康信(北京)科技股份公司 | 自动化测试方法、装置、电子设备及计算机可读存储介质 |
CN111611144A (zh) * | 2020-05-27 | 2020-09-01 | 中国工商银行股份有限公司 | 用于处理性能测试数据的方法、装置、计算设备和介质 |
CN111782514A (zh) * | 2020-06-23 | 2020-10-16 | 京东数字科技控股有限公司 | 一种测试数据的比对方法和装置 |
CN111966847A (zh) * | 2020-08-10 | 2020-11-20 | 上海中通吉网络技术有限公司 | 报表回归测试方法、装置和系统 |
CN112529008A (zh) * | 2020-11-03 | 2021-03-19 | 浙江大华技术股份有限公司 | 图像识别和图像特征处理方法、电子设备及存储介质 |
CN113378819A (zh) * | 2021-06-24 | 2021-09-10 | 成都飞机工业(集团)有限责任公司 | 一种机载软件版本的快速识别方法 |
CN117421254A (zh) * | 2023-12-19 | 2024-01-19 | 杭银消费金融股份有限公司 | 一种用于对账业务的自动化测试方法与系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110093773A1 (en) * | 2009-10-19 | 2011-04-21 | Browsera LLC | Automated application compatibility testing |
US20150082280A1 (en) * | 2013-09-18 | 2015-03-19 | Yahoo! Inc. | Automatic verification by comparing user interface images |
US20150269721A1 (en) * | 2014-03-19 | 2015-09-24 | International Business Machines Corporation | Automated validation of the appearance of graphical user interfaces |
-
2019
- 2019-07-04 CN CN201910597742.XA patent/CN110287125B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110093773A1 (en) * | 2009-10-19 | 2011-04-21 | Browsera LLC | Automated application compatibility testing |
US20150082280A1 (en) * | 2013-09-18 | 2015-03-19 | Yahoo! Inc. | Automatic verification by comparing user interface images |
US20150269721A1 (en) * | 2014-03-19 | 2015-09-24 | International Business Machines Corporation | Automated validation of the appearance of graphical user interfaces |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955603A (zh) * | 2019-12-03 | 2020-04-03 | 望海康信(北京)科技股份公司 | 自动化测试方法、装置、电子设备及计算机可读存储介质 |
CN110955603B (zh) * | 2019-12-03 | 2023-06-06 | 望海康信(北京)科技股份公司 | 自动化测试方法、装置、电子设备及计算机可读存储介质 |
CN111611144A (zh) * | 2020-05-27 | 2020-09-01 | 中国工商银行股份有限公司 | 用于处理性能测试数据的方法、装置、计算设备和介质 |
CN111611144B (zh) * | 2020-05-27 | 2023-09-19 | 中国工商银行股份有限公司 | 用于处理性能测试数据的方法、装置、计算设备和介质 |
CN111782514A (zh) * | 2020-06-23 | 2020-10-16 | 京东数字科技控股有限公司 | 一种测试数据的比对方法和装置 |
CN111966847A (zh) * | 2020-08-10 | 2020-11-20 | 上海中通吉网络技术有限公司 | 报表回归测试方法、装置和系统 |
CN112529008A (zh) * | 2020-11-03 | 2021-03-19 | 浙江大华技术股份有限公司 | 图像识别和图像特征处理方法、电子设备及存储介质 |
CN113378819A (zh) * | 2021-06-24 | 2021-09-10 | 成都飞机工业(集团)有限责任公司 | 一种机载软件版本的快速识别方法 |
CN117421254A (zh) * | 2023-12-19 | 2024-01-19 | 杭银消费金融股份有限公司 | 一种用于对账业务的自动化测试方法与系统 |
CN117421254B (zh) * | 2023-12-19 | 2024-03-22 | 杭银消费金融股份有限公司 | 一种用于对账业务的自动化测试方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110287125B (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287125A (zh) | 基于图像识别的软件例行化测试方法及装置 | |
US11416672B2 (en) | Object recognition and tagging based on fusion deep learning models | |
CN104217202B (zh) | 信息识别方法、设备和系统 | |
US9111183B2 (en) | Performing a comparison between two images which are scaled to a common resolution | |
CN109726195A (zh) | 一种数据增强方法及装置 | |
CN114429637B (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN112052702B (zh) | 一种识别二维码的方法和装置 | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN114359533B (zh) | 一种基于页面文本的页码识别方法和计算机设备 | |
CN110490056A (zh) | 对包含算式的图像进行处理的方法和装置 | |
CN114639102A (zh) | 基于关键点与尺寸回归的细胞分割方法和装置 | |
CN110688998A (zh) | 票据识别方法及装置 | |
CN114240770A (zh) | 一种图像处理方法、装置、服务器及存储介质 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
CN113011246A (zh) | 票据分类方法、装置、设备及存储介质 | |
CN110210314B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN115393868B (zh) | 文本检测方法、装置、电子设备和存储介质 | |
CN116129417A (zh) | 一种基于低质量图像的数字仪表读数检测方法 | |
CN115374517A (zh) | 布线软件的测试方法、装置、电子设备及存储介质 | |
CN111414889B (zh) | 基于文字识别的财务报表识别方法及装置 | |
CN114693554A (zh) | 一种大数据图像处理方法及系统 | |
CN110705633B (zh) | 目标物检测、目标物检测模型的建立方法及装置 | |
CN114897901B (zh) | 基于样本扩充的电池质量检测方法、装置和电子设备 | |
CN117112446B (zh) | 编辑器调试方法、装置、电子设备及介质 | |
CN113139578B (zh) | 一种基于最优训练集的深度学习图像分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |