CN111340038B - 用于mock测试的一次性影像数据获取方法 - Google Patents

用于mock测试的一次性影像数据获取方法 Download PDF

Info

Publication number
CN111340038B
CN111340038B CN202010427888.2A CN202010427888A CN111340038B CN 111340038 B CN111340038 B CN 111340038B CN 202010427888 A CN202010427888 A CN 202010427888A CN 111340038 B CN111340038 B CN 111340038B
Authority
CN
China
Prior art keywords
image file
file
template
text
general keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010427888.2A
Other languages
English (en)
Other versions
CN111340038A (zh
Inventor
黄勇
熊阳
彭川
张妍洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202010427888.2A priority Critical patent/CN111340038B/zh
Publication of CN111340038A publication Critical patent/CN111340038A/zh
Application granted granted Critical
Publication of CN111340038B publication Critical patent/CN111340038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management

Abstract

本发明涉及用于MOCK测试的一次性影像数据获取方法,包括:A.通过文件识别软件识别现有影像文件中的通用关键字;B.根据实际需要的内容定义影像文件的生成模板,并填入包括所述通用关键字在内的字段内容;C.从生成模板中解析出通用关键字,并对各通用关键字随机赋值;D.将赋值后的生成模板转换为影像文件保存;F.在MOCK测试时先接收被测系统传送的影像文件,解析出各通用关键字和对应的值,将值返回给被测系统,实现通过影像数据对被测系统进行MOCK测试。本发明能够大量的、随机的生成各种需要对影像文件进行文字识别的测试数据,极大的降低了一次性影像文件的获取难度,明显提高了测试的效率和测试覆盖率。

Description

用于MOCK测试的一次性影像数据获取方法
技术领域
本发明涉及软件开发和测试中的数据获取方法,具体讲是用于MOCK测试的一次性影像数据获取方法。
背景技术
在软件系统的开发和测试阶段中,当被测系统接受的外部输入为影像文件时,如身份证图片、驾驶证等jpeg/png的图片,被测系统需要通过OCR服务(文字识别软件),获取这些影像文件中视觉所包含的文本信息,用于进一步的业务处理。但由于这些影像文件都是一次性耗费数据,因此造成了数据准备困难的问题。
针对上述问题,当前的解决方案有:
1. 测试人员使用自己的身份证等影像文件或者网上寻找其他的影像文件作为测试数据,然后进行测试。
2. 测试人员使用自己的身份证等影像文件,每次使用后,通过在业务系统删除影像文件的相关信息,从而可以重复使用。
以上2种方式,都受到影像文件数据不容易获取的限制,不能解决测试数据源信息的多样性,且影像文件使用后再删除业务系统数据,容易造成删除数据时的操作风险。
发明内容
本发明提供了一种用于MOCK测试的一次性影像数据获取方法,在需要OCR服务的测试中可以获得大量的影像文件作为测试数据,降低一次性影像文件的获取难度。
本发明用于MOCK测试的一次性影像数据获取方法,包括:
A.通过文件识别软件识别现有的各种影像文件中包含的文本信息,并提取出其中的通用关键字;
B.根据实际需要的内容定义影像文件的生成模板,并对所述生成模板中的模板字段填入包括所述通用关键字在内的字段内容;
C.通过影像文件生成工具从生成模板中解析出通用关键字,并根据各通用关键字的属性和格式对各通用关键字随机赋值;
D.影像文件生成工具将赋值后的生成模板转换为影像文件保存;
F.被测系统获取保存的影像文件,在MOCK测试时先接收被测系统传送的影像文件,并根据影像文件中内容的编码格式解析出各通用关键字和对应的值,然后将解析出的值返回给被测系统,实现通过影像数据对被测系统进行MOCK测试。
本发明通过根据通用关键字的属性和格式,自动生成相应的值,随机的生成各种影像文件所需包含的文本信息,如身份证号码、地址等,可以无限的生成所需的测试数据。并且通过将被测系统需要的视觉文本信息嵌入到影像文件中进行保存,极大的降低了一次性影像文件获取难度。同时,本发明是通过解析影像文件中的存储信息来获取所需数据的,而不是通过文字识别软件(OCR)对影像文件进行视觉获取信息的方式,也极大的降低了获取影像文件文本内容的难度。
进一步的,步骤B包括:根据实际需要的内容定义影像文件的生成模板,在生成模板中设有模板字段,所述模板字段中包括有编码格式字段和图片格式字段,还设有属性关键字列表,所述属性关键字列表的各个值为步骤A所述的通用关键字;然后根据生成模板生成yaml格式文件。其中,yaml格式是一个可读性高,用来表达数据序列化的格式,其数据结构可以用类似大纲的缩排方式呈现,结构通过缩进来表示,连续的项目通过减号“-”来表示,map结构里面的key/value对用冒号“:”来分隔。例如:
house:
family:
name: Doe
parents:
- John
- Jane
children:
- Paul
- Mark
- Simone
address:
number: 34
street: Main Street
city: Nowheretown
zipcode: 12345
在此基础上,步骤C包括:
C1.影像文件生成工具通过yaml loader软件读入所述的yaml格式文件,解析出其中的文本内容,再通过迭代器将文本内容中模板字段的内容逐个读取;
C2.将读取的模板字段的内容逐个与属性关键字列表中的每个值进行对比,如果当前模板字段的内容和属性关键字列表中的某个值相同,则根据该值表示的通用关键字,以及该通用关键字的属性和格式随机生成该通用关键字的对应值,将所述对应值赋给对应的通用关键字;通过迭代器完成对所有通用关键字的赋值;
C3.将所有通用关键字和各自的对应值生成一个HashMap对象,其中键为通用关键字,值为对应值;再将该HashMap对象转换成一个文本文件,文本文件的内容为HashMap对象中每个键-值对的组合。
进一步的,步骤D包括:根据编码格式字段中设置的值对步骤C3的文本文件的内容进行编码,然后根据图片格式字段中设置的值和经过编码的文本文件的内容,按照对应的图片格式生成影像文件保存。
进一步的,步骤F中,根据影像文件中内容的编码格式,对影像文件进行解码,获得所述的由键-值对组合构成的文本内容,再通过迭代方式获取文本内容中所有的键和对应的值,将得到的所述值返回给被测系统。
进一步的,步骤F中,根据文件识别软件的请求返回格式,将解析出的值写入文件识别软件的返回文本模板中,生成返回请求内容,然后将所述的返回请求内容返回给被测系统。
本发明用于MOCK测试的一次性影像数据获取方法,能够大量的、随机的生成各种需要对影像文件进行文字识别的测试数据,极大的降低了一次性影像文件的获取难度,明显提高了测试的效率和测试覆盖率。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
附图说明
图1为本发明用于MOCK测试的一次性影像数据获取方法的流程图。
具体实施方式
如图1所示本发明的用于MOCK测试的一次性影像数据获取方法,包括:
A.通过文件识别软件(OCR)识别现有的各种影像文件中包含的文本信息,并提取出其中的通用关键字,例如:“身份证号码”、“出生日期”、“有效期”、“地址”等字样。此处的通用关键字只是例如上述的字样,而不包括其具体的实际内容。以现有的各种影像文件作为基础来构建测试的影像文件生成模板。
B.根据实际需要的内容定义影像文件的生成模板,在生成模板中设有各种模板字段,所述模板字段中包括有编码格式字段encoding和图片格式字段type,还设有属性关键字列表keyWords,所述属性关键字列表keyWords的各个值为步骤A所述的通用关键字。将各通用关键字对应的填入模板字段中,然后根据生成模板生成yaml格式文件。
C.通过影像文件生成工具从生成模板中解析出通用关键字,并根据各通用关键字的属性和格式对各通用关键字随机赋值。具体包括:
C1.影像文件生成工具通过yaml loader软件读入所述的yaml格式文件,解析出其中的文本内容,再通过迭代器将文本内容中模板字段的内容逐个读取。
C2.将读取的模板字段的内容逐个与属性关键字列表keyWords中的每个值进行对比,如果当前模板字段的内容和属性关键字列表keyWords中的某个值相同,则根据该值表示的通用关键字,以及该通用关键字的属性和格式随机生成该通用关键字的对应值,将所述对应值赋给对应的通用关键字;通过迭代器完成对所有通用关键字的赋值。
C3.将所有通用关键字和各自的对应值生成一个HashMap对象,其中键为通用关键字,值为对应值;再将该HashMap对象转换成一个文本文件,文本文件的内容为HashMap对象中每个键-值对的组合,例如文本文件的内容为:{“身份证号码”:XXXXXXXXXXXX,“性别”:“男”,“年龄”:27}。
D.影像文件生成工具根据编码格式字段encoding中设置的值(例如base64、md5等)对步骤C3的文本文件的内容进行编码,然后根据图片格式字段type中设置的值(例如jpeg、png等)和经过编码的文本文件的内容,按照对应的图片格式生成影像文件保存。
F.由于被测系统并不关注OCR服务的文字识别能力,只需要OCR服务能够识别传入的影像文件,并返回需要的影像文件的视觉文本信息即可。因此本发明用OCR MOCK(模拟文字识别)替换掉替换真实的OCR服务。具体方式为:
被测系统获取保存的影像文件,在MOCK测试时先接收被测系统传送的影像文件,并根据影像文件中内容的编码格式,对影像文件进行解码,获得所述的由键-值对组合构成的文本内容,再通过迭代方式获取文本内容中所有的键和对应的值。然后根据文件识别软件OCR的请求返回格式,将解析出的值写入文件识别软件OCR的返回文本模板中,生成返回请求内容,最后将所述的返回请求内容返回给被测系统,实现通过影像数据对被测系统进行MOCK测试。
本发明通过根据通用关键字的属性和格式,自动生成相应的值,随机的生成各种影像文件所需包含的文本信息,如身份证号码、地址等,可以无限的生成所需的测试数据。并且通过将被测系统需要的视觉文本信息嵌入到影像文件中进行保存,极大的降低了一次性影像文件获取难度。同时,本发明是通过解析影像文件中的存储信息来获取所需数据的,而不是通过文字识别软件(OCR)对影像文件进行视觉获取信息的方式,也极大的降低了获取影像文件文本内容的难度。

Claims (5)

1.用于MOCK测试的一次性影像数据获取方法,其特征包括:
A.通过文件识别软件识别现有的各种影像文件中包含的文本信息,并提取出其中的通用关键字;
B.根据实际需要的内容定义影像文件的生成模板,并对所述生成模板中的模板字段填入包括所述通用关键字在内的字段内容;
C.通过影像文件生成工具从生成模板中解析出通用关键字,并根据各通用关键字的属性和格式对各通用关键字随机赋值;
D.影像文件生成工具将赋值后的生成模板转换为影像文件保存;
F.被测系统获取保存的影像文件,在MOCK测试时先接收被测系统传送的影像文件,并根据影像文件中内容的编码格式解析出各通用关键字和对应的值,然后根据文件识别软件的请求返回格式,将解析出的值写入文件识别软件的返回文本模板中,生成返回请求内容,然后将所述的返回请求内容返回给被测系统,实现通过影像数据对被测系统进行MOCK测试。
2.如权利要求1所述的用于MOCK测试的一次性影像数据获取方法,其特征为:步骤B包括:根据实际需要的内容定义影像文件的生成模板,在生成模板中设有模板字段,所述模板字段中包括有编码格式字段和图片格式字段,还设有属性关键字列表,所述属性关键字列表的各个值为步骤A所述的通用关键字;然后根据生成模板生成yaml格式文件。
3.如权利要求2所述的用于MOCK测试的一次性影像数据获取方法,其特征为:步骤C包括:
C1.影像文件生成工具通过yaml loader软件读入所述的yaml格式文件,解析出其中的文本内容,再通过迭代器将文本内容中模板字段的内容逐个读取;
C2.将读取的模板字段的内容逐个与属性关键字列表中的每个值进行对比,如果当前模板字段的内容和属性关键字列表中的某个值相同,则根据该值表示的通用关键字,以及该通用关键字的属性和格式随机生成该通用关键字的对应值,将所述对应值赋给对应的通用关键字;通过迭代器完成对所有通用关键字的赋值;
C3.将所有通用关键字和各自的对应值生成一个HashMap对象,其中键为通用关键字,值为对应值;再将该HashMap对象转换成一个文本文件,文本文件的内容为HashMap对象中每个键-值对的组合。
4.如权利要求3所述的用于MOCK测试的一次性影像数据获取方法,其特征为:步骤D包括:根据编码格式字段中设置的值对步骤C3的文本文件的内容进行编码,然后根据图片格式字段中设置的值和经过编码的文本文件的内容,按照对应的图片格式生成影像文件保存。
5.如权利要求3所述的用于MOCK测试的一次性影像数据获取方法,其特征为:步骤F中,根据影像文件中内容的编码格式,对影像文件进行解码,获得所述的由键-值对组合构成的文本内容,再通过迭代方式获取文本内容中所有的键和对应的值,将得到的所述值返回给被测系统。
CN202010427888.2A 2020-05-20 2020-05-20 用于mock测试的一次性影像数据获取方法 Active CN111340038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010427888.2A CN111340038B (zh) 2020-05-20 2020-05-20 用于mock测试的一次性影像数据获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010427888.2A CN111340038B (zh) 2020-05-20 2020-05-20 用于mock测试的一次性影像数据获取方法

Publications (2)

Publication Number Publication Date
CN111340038A CN111340038A (zh) 2020-06-26
CN111340038B true CN111340038B (zh) 2020-08-21

Family

ID=71186508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010427888.2A Active CN111340038B (zh) 2020-05-20 2020-05-20 用于mock测试的一次性影像数据获取方法

Country Status (1)

Country Link
CN (1) CN111340038B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112379946A (zh) * 2020-11-27 2021-02-19 平安普惠企业管理有限公司 基于yaml的模板配置方法、装置及计算机设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679453A (zh) * 2013-12-03 2015-06-03 航天信息股份有限公司 一种信息录入、储存及排版打印的通用系统及方法
CN105451202A (zh) * 2015-05-28 2016-03-30 小米科技有限责任公司 短信处理方法及装置
CN105589686A (zh) * 2014-11-14 2016-05-18 航天信息股份有限公司 WinCE平台下基于模板的信息录入、打印方法和装置
CN105608119A (zh) * 2015-12-16 2016-05-25 北京吉威数源信息技术有限公司 一种专题图快速制图技术
CN106469116A (zh) * 2015-08-21 2017-03-01 株式会社日立制作所 测试场景生成辅助装置以及测试场景生成辅助方法
CN106530528A (zh) * 2016-10-11 2017-03-22 上海慧银信息科技有限公司 收银票据信息识别方法及装置
CN109219809A (zh) * 2016-03-13 2019-01-15 瓦特博克有限公司 基于电子文档的自动生成报告数据的方法和系统
CN109308250A (zh) * 2017-07-26 2019-02-05 上海富瀚微电子股份有限公司 一种gui自动化测试方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130179774A1 (en) * 2005-12-05 2013-07-11 Sursen Corp. Method and apparatus for processing document conforming to docbase standard
CN102135938B (zh) * 2011-03-21 2015-04-15 中国工商银行股份有限公司 一种软件产品测试方法及系统
CN104268073A (zh) * 2014-09-05 2015-01-07 北京广利核系统工程有限公司 一种批量生成测试用例的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679453A (zh) * 2013-12-03 2015-06-03 航天信息股份有限公司 一种信息录入、储存及排版打印的通用系统及方法
CN105589686A (zh) * 2014-11-14 2016-05-18 航天信息股份有限公司 WinCE平台下基于模板的信息录入、打印方法和装置
CN105451202A (zh) * 2015-05-28 2016-03-30 小米科技有限责任公司 短信处理方法及装置
CN106469116A (zh) * 2015-08-21 2017-03-01 株式会社日立制作所 测试场景生成辅助装置以及测试场景生成辅助方法
CN105608119A (zh) * 2015-12-16 2016-05-25 北京吉威数源信息技术有限公司 一种专题图快速制图技术
CN109219809A (zh) * 2016-03-13 2019-01-15 瓦特博克有限公司 基于电子文档的自动生成报告数据的方法和系统
CN106530528A (zh) * 2016-10-11 2017-03-22 上海慧银信息科技有限公司 收银票据信息识别方法及装置
CN109308250A (zh) * 2017-07-26 2019-02-05 上海富瀚微电子股份有限公司 一种gui自动化测试方法及系统

Also Published As

Publication number Publication date
CN111340038A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN112084383A (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
US11017221B2 (en) Classifying digital documents in multi-document transactions based on embedded dates
CN110956026A (zh) 法律文书生成方法、生成装置和电子设备
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN111241209B (zh) 用于生成信息的方法和装置
CN113469067A (zh) 一种文档解析方法、装置、计算机设备和存储介质
US11741735B2 (en) Automatically attaching optical character recognition data to images
CN113806548A (zh) 基于深度学习模型的信访要素抽取方法及抽取系统
CN111340038B (zh) 用于mock测试的一次性影像数据获取方法
CN113064995A (zh) 一种基于图深度学习的文本多标签分类方法和系统
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
CN102045268A (zh) 一种电子邮件数据恢复方法及装置
CN116912847A (zh) 一种医学文本识别方法、装置、计算机设备及存储介质
CN109753535A (zh) 案件数据的录入方法、设备及计算机可读存储介质
CN113723063B (zh) 一种rtf转html并在pdf文件实现效果的方法
CN115098440A (zh) 电子档案查询方法、装置、存储介质和设备
CN115099233A (zh) 一种语义解析模型的构建方法、装置、电子设备及存储介质
CN117149140B (zh) 一种用于编码的架构信息生成方法、装置及相关设备
CN117195319A (zh) 保函文件电子件的验真方法、装置、电子设备和介质
CN115017256A (zh) 电力数据处理方法、装置、电子设备及存储介质
CN113472686A (zh) 信息识别方法、装置、设备及存储介质
CN112149391A (zh) 信息处理方法、信息处理装置、终端设备及存储介质
CN112416354A (zh) 一种基于多维度特征和混合神经网络的代码可读性评估方法
CN112597990A (zh) 手写公式的判阅方法、系统、终端设备及存储介质
CN107707328B (zh) 摘要信息传输方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant