CN109408807A - Ocr识别正确率的自动化测试方法及测试设备 - Google Patents

Ocr识别正确率的自动化测试方法及测试设备 Download PDF

Info

Publication number
CN109408807A
CN109408807A CN201811057758.3A CN201811057758A CN109408807A CN 109408807 A CN109408807 A CN 109408807A CN 201811057758 A CN201811057758 A CN 201811057758A CN 109408807 A CN109408807 A CN 109408807A
Authority
CN
China
Prior art keywords
field
identification
template
right value
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811057758.3A
Other languages
English (en)
Inventor
周文贵
黄文英
郭国强
卢敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Shang Ji Network Technology Co Ltd
Original Assignee
Xiamen Shang Ji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Shang Ji Network Technology Co Ltd filed Critical Xiamen Shang Ji Network Technology Co Ltd
Priority to CN201811057758.3A priority Critical patent/CN109408807A/zh
Publication of CN109408807A publication Critical patent/CN109408807A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及OCR识别正确率的自动化测试方法,包括:创建模板组;收集多个用于OCR识别的样本;在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器;调用OCR识别接口,对各样本进行识别,得到OCR识别结果;将各个样本的OCR识别结果分别与对应的正确值文本进行匹配;按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数。本发明有益效果:当有新的样本需要测试时、当OCR版本更新时、当识别内容发生变化时,均可依据新样本创建对应的正确值文本并导入服务器,即可快速地进行新一轮测试,无须修改代码,提高测试效率并出具统计测试结果。

Description

OCR识别正确率的自动化测试方法及测试设备
技术领域
本发明涉及一种OCR识别正确率的自动化测试方法及测试设备,属于OCR识别领域。
背景技术
传统测试OCR识别正确率的方法,是由人工判断OCR识别正确与否,然后进行标记,最后再由人工统计测试结果,不仅耗时长,效率低,而且无法支持OCR版本升级及识别字段不断调整的及时响应测试。
传统的一个样本经过OCR识别后输出结果,需要人工比对输出结果和实际样本值,当样本数量较大时,工作量繁琐。
公开号为CN107992484A的发明专利《一种评测OCR系统的性能的方法、设备及存储介质》公开了一种借助第三方数据库对OCR系统的测试结果进行评测,以获得用于表征OCR系统性能的评测结果,其中所述借助第三方数据库对所述测试结果进行评测,包括:对所述测试结果中的文字进行单字或词组切分处理,得到单字或词组的切分结果;检测字典中是否存在有所述或词组;若存在,则确定所述文字为准确识别的文字。所述第三方数据库包括字典、翻译数据库和/或搜索引擎数据库。首先,该技术方案是将识别出的字或词组在字典或数据库中查找是否存在该字或者词组,而无法判断识别出的字或词组是否为文本上所记载的字或词组,例如车票上为“一等座”,但识别成“二等座”仍然可以从第三方数据库中找出“二等座”这些字,但实际上却已经识别错误,且该技术方案从第三方数据库中查找对应字或词组,其处理过程工作量大,对系统的运算能力要求较高,其次,该技术方案仅能判断OCR系统识别出的文字(包括字和词组)是否正确,而无法进一步判断识别出的文字所在的位置是否与样本是否一致,对于一个文本,识别出的文字正确,但该文字所在的位置不对,对于该文本而言依然是一种错误识别。因此,该技术方案对OCR识别性能的评测仍然存在不足之处。
有鉴于此,本发明提出了一种能够对OCR识别正确率进行自动测试的方法,其创建与样本对应的正确文本,然后将OCR识别值与正确文本进行比对,不仅比对字符本身还比对字符定位是否准确,提升测试效率的同时大大提升测试准确率。
发明内容
为了解决上述技术问题,本发明提供OCR识别正确率的自动化测试方法,其基于OCR识别文本上的字段是明确的(如开票日期、开票单位等),本发明将OCR识别结果与正确值文本进行比对,且其中各字段标识及对应正确值逐一匹配,不仅测试效率高,且提升了测试准确率。
本发明的技术方案一如下:
OCR识别正确率的自动化测试方法,包括如下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;
收集多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器;所述正确值为样本上各字段标识对应的值;
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式;
按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数,计算该次测试的总的正确率。
更优地,所述匹配过程为:先匹配字段标识是否一致,若一致,则认定定位准确,然后匹配该字段标识对应的正确值是否一致,若一致,则认定识别成功;
按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
更优地,通过画框工具生成正确值文本:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,全部字段标识均输入完毕生成该样本的正确值文本。
更优地,所述模板还包括各字段标识对应的字段名称,将模板导入画框工具后,显示该模板所包含的字段名称,每选中一个字段名称,输入该字段名称对应的正确值。
更优地,所述匹配过程中,匹配一致,标记为1,匹配失败,标记为0。
本发明还提供OCR识别正确率的自动化测试设备。
技术方案二
OCR识别正确率的自动化测试设备,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;
收集多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器;所述正确值为样本上各字段标识对应的值;
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式;
按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数,计算该次测试的总的正确率。
更优地,所述匹配过程为:先匹配字段标识是否一致,若一致,则认定定位准确,然后匹配该字段标识对应的正确值是否一致,若一致,则认定识别成功;
按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
更优地,通过画框工具生成正确值文本:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,全部字段标识均输入完毕生成该样本的正确值文本。
更优地,所述模板还包括各字段标识对应的字段名称,将模板导入画框工具后,显示该模板所包含的字段名称,每选中一个字段名称,输入该字段名称对应的正确值。
更优地,所述匹配过程中,匹配一致,标记为1,匹配失败,标记为0。
本发明具有如下有益效果:
1、根据文本类型创建模板组,当有新的样本需要测试时,无需修改代码,仅利用现有模板生成对应正确值文本即可快速进行新一轮测试;
2、当OCR版本更新时以及识别内容发生变化时(如新增识别字段),无需修改代码,仅修改模板和生成对应新样本的正确值文件即可快速进行新一轮测试;
3、先定位字段标识,再进一步判断字段标识对应的正确值,从而得到的识别正确率更真实准确;
4、通过画框工具创建正确值文本,更加直观快速;
5、将样本和正确值文本导入服务器,在服务器上完成自动测试,自动比对,极大提高了测试效率并出具统计测试结果;
6、既可以统计某一票种的OCR识别正确率,又可以统计该票种上任意一标识字段对应的OCR识别正确率,为OCR识别的进一步改进提供可靠且明确的改进目标。
附图说明
图1为本发明OCR识别正确率的自动化测试方法的流程示意图;
图2为本发明以增值税发票为例的一种模板样例;
图3为本发明以画框工具为例生成正确值文本过程的示意图;
图4为本发明画框后生成的正确值文本,以TXT文件为样例;
图5为本发明以增值税发票为例按字段计算定位及识别情况的示意图;
图6为本发明以增值税发票为例统计每个字段的定位准确率及识别正确率的示意图;
图7为本发明以增值税发明为例统计出该票种的定位准确率及识别成功率的示意图。
具体实施方式
下面结合附图和具体实施例来对本发明进行详细的说明。
实施例一
请参阅图1,OCR识别正确率的自动化测试方法,包括如下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;一种类型的文本包括同样类型的票据,比如动车票、飞机票、普通发票、增值税发票、银行回单等,模板中包含该类型票据中通用字段对应的字段标识。由于OCR识别系统的识别结果中包含字段标识,因此,模板中必须包含字段标识,然后字段标识对于操作人员不好辨识,因此,一般地,为了方便操作人员理解,模板中还包括各字段标识对应的字段名称。请参阅图2,以增值税发票为例,其对应的模板包含的字段名称包括开票日期、联次、发票编号、付款单位等等;
收集多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;当需要针对某一票种测试OCR的识别正确率进行测试时,收集的测试样本的种类均为同类型票种,例如,要对增值税发票进行OCR识别正确率进行测试时,收集多张增值税发票作为样本,一般地,各张增值税发票中相同字段标识对应的正确值并不相同;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器,刷新后使服务器识别样本和正确值文本;所述正确值为样本上各字段标识对应的值;一般地,若采用不同的多个样本,一个样本对应一个正确值文本,样本与正确值文本之间建立一一对应关系;若多个样本相同(即多个样本中各字段标识对应的正确值均相同),则采用一个正确值文本对应该些相同样本即可;
请参阅图3,将正确值加入并与字段标识对应可以通过画框工具实现:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,例如图3中,选中开票日期,然后根据样本上开票日期为2017年5月12日,输入开票日期的对应正确值为 20170512,建立字段标识与正确值的一一对应关系,全部字段标识均输入完毕生成该样本的正确值文本。请参阅图4,该正确值文本包含了字段标识以及对应的正确值。若模板中包含字段名称,则在画框工具中仅显示字段名称,每选中一个字段名称,输入该字段名称对应的正确值;
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值(字段标识和识别值一一对应);所述识别值为通过OCR识别出的与该字段标识对应的字段;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式:先匹配字段标识是否一致,若一致,则认定定位准确,然后匹配该字段标识对应的正确值是否一致,若一致,则认定识别成功;对于匹配一致的,将其标记为1,匹配失败的,标记为0,便于统计正确率。请参阅图5,例如,增值税发票样本的OCR识别结果中含有BillTitle的字段标识,该样本对应的正确值文本也含有BillTitle这个字段标识(图5中,BillTitle对应的字段名称为票据抬头),则认定该字段定位成功,标记为1,然后将OCR识别结果中该字段标识对应的正确值“宁波增值税普通发票”,与正确值文本中对应的正确值“宁波增值税普通发票”进行匹配,匹配一致,则认为字段识别成功,标记为1。每个样本的所有字段均会产生对应的定位及识别情况;图5中,显示17个样本的“票据抬头”的定位及识别情况;
按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数,计算该次测试的总的正确率。若9个样本均为相同类型的票种,例如,增值税发票,则得到该票种的正确率。
进一步的,按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
请参阅图6,统计每个字段的定位率及识别率,其优点在于:既可以形成结构化的数据(即返回的数据是有业务属性的,如OCR返回开票日期或开票单位),又可以分析出哪个字段的定位准确率或识别正确率较低,作为OCR识别系统进一步的改进目标。
请参阅图7,将所有字段的字段数量、定位正确数和识别成功数累加后统计出整个票种的识别结果。
通过本发明OCR识别正确率的自动化测试方法,当有新的样本需要测试时、当OCR版本更新时、当识别内容发生变化时(如新增识别字段),均可依据新样本创建对应的正确值文本并导入服务器,即可快速地进行新一轮测试,无须修改代码,极大提高测试效率并出具统计测试结果,为 OCR识别进一步改进提供基础。
实施例二
请参阅图1,OCR识别正确率的自动化测试设备,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;一种类型的文本包括同样类型的票据,比如动车票、飞机票、普通发票、增值税发票、银行回单等,模板中包含该类型票据中通用字段对应的字段标识。由于OCR识别系统的识别结果中包含字段标识,因此,模板中必须包含字段标识,然后字段标识对于操作人员不好辨识,因此,一般地,为了方便操作人员理解,模板中还包括各字段标识对应的字段名称。请参阅图2,以增值税发票为例,其对应的模板包含的字段名称包括开票日期、联次、发票编号、付款单位等等;
集合多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;当需要针对某一票种测试OCR的识别正确率进行测试时,收集的测试样本的种类均为同类型票种,例如,要对增值税发票进行OCR识别正确率进行测试时,收集多张增值税发票作为样本,一般地,各张增值税发票中相同字段标识对应的正确值并不相同;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;所述正确值为样本上各字段标识对应的值;创建完将所述样本和正确值文本导入服务器;一个样本对应一个正确值文本;样本与正确值文本之间建立一一对应关系;
请参阅图3,正确值文本还可以通过画框工具生成:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,例如图3中,选中开票日期,然后根据样本上开票日期为2017年5月12日,输入开票日期的对应正确值为 20170512,全部字段标识均输入完毕生成该样本的正确值文本,请参阅图4;
创建的模板中若还包括各字段标识对应的字段名称,将模板导入画框工具后,显示该模板所包含的字段名称,每选中一个字段名称,输入该字段名称对应的正确值,字段名称便于操作人员理解。
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式,所述匹配过程为,先匹配字段标识是否识别正确,若一致,则认定定位准确,然后匹配该字段标识对应的正确值,若一致,则认定识别成功;所述匹配过程中,将匹配一致,标记为1,将匹配失败,标记为0,便于统计正确率。
请参阅图 5,例如,某一样本的OCR识别结果中含有BillTitle的字段标识,该样本对应的正确值文本也含有BillTitle这个字段标识(图5中,BillTitle对应的字段名称为票据抬头),则认定该字段定位成功,标记为1,然后将OCR识别结果中该字段标识对应的正确值“宁波增值税普通发票”,与正确值文本中对应的正确值“宁波增值税普通发票”进行匹配,匹配一致,则认为字段识别成功,标记为1。每个样本的所有字段均会产生对应的定位及识别情况;图5中,显示9个样本的“票据抬头”的定位及识别情况;
按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数,计算该次测试的总的正确率。
进一步地,按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
请参阅图6,统计每个字段的定位率及识别率,其优点在于:既可以形成结构化的数据(即返回的数据是有业务属性的,如OCR返回开票日期或开票单位),又可以分析出哪个字段的定位准确率或识别正确率较低,作为OCR识别系统进一步的改进目标。
请参阅图7,将所有字段的字段数量、定位正确数和识别成功数累加后统计出整个票种的识别结果。
通过本发明OCR识别正确率的自动化测试方法,当有新的样本需要测试时、当OCR版本更新时、当识别内容发生变化时(如新增识别字段),均可依据新样本创建对应的正确值文本并导入服务器,即可快速地进行新一轮测试,无须修改代码,极大提高测试效率并出具统计测试结果,为 OCR识别进一步改进提供基础。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1. OCR识别正确率的自动化测试方法,其特征在于,包括如下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;
收集多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器;所述正确值为样本上各字段标识对应的值;
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
2.根据权利要求1所述的OCR识别正确率的自动化测试方法,其特征在于:所述匹配过程为:先匹配字段标识是否一致,若一致,则认定定位准确,然后匹配该字段标识对应的正确值是否一致,若一致,则认定识别成功;
按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
3.根据权利要求1所述的OCR识别正确率的自动化测试方法,其特征在于:通过画框工具生成正确值文本:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,全部字段标识均输入完毕生成该样本的正确值文本。
4.根据权利要求3所述的OCR识别正确率的自动化测试方法,其特征在于:所述模板还包括各字段标识对应的字段名称,将模板导入画框工具后,显示该模板所包含的字段名称,每选中一个字段名称,输入该字段名称对应的正确值。
5.根据权利要求2所述的OCR识别正确率的自动化测试方法,其特征在于:所述匹配过程中,匹配一致,标记为1,匹配失败,标记为0。
6.OCR识别正确率的自动化测试设备,其特征在于,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
创建模板组,模板组中的各模板分别对应一种类型的文本,所述模板中包含该文本中的各字段标识;
收集多个用于OCR识别的样本,所述模板组中包含与该样本对应的模板;
在所述模板上一一对应加入各字段标识对应的正确值,生成正确值文本;将所述样本和正确值文本均导入服务器;所述正确值为样本上各字段标识对应的值;
调用OCR识别接口,对各样本进行识别,得到OCR识别结果;所述OCR识别结果包括字段标识和识别值;
将各个样本的OCR识别结果分别与对应的正确值文本进行匹配,采用OCR识别结果中的字段标识及其识别值逐个与正确值文本中对应的字段标识与正确值进行匹配的方式;
按字段标识计算识别正确率和/或按所有样本所包含的字段标识总数,计算该次测试的总的正确率。
7.根据权利要求6所述的OCR识别正确率的自动化测试设备,其特征在于:所述匹配过程为:先匹配字段标识是否一致,若一致,则认定定位准确,然后匹配该字段标识对应的正确值是否一致,若一致,则认定识别成功;
按字段标识计算各字段标识的定位准确率,和/或统计该次测试所有样本的字段标识总数以及定位一致的标识总数,计算出该次测试的定位准确率;
按字段标识计算各字段标识对应的字段的识别正确率,和/或,统计所有样本的字段标识总数和所有样本的字段的识别正确总数,计算该次测试的识别正确率。
8.根据权利要求6所述的OCR识别正确率的自动化测试设备,其特征在于:通过画框工具生成正确值文本:将所述样本导入画框工具,然后加载与导入样本对应的模板,逐一选择该模板上的字段标识,每选中一个字段标识,输入该字段标识对应的正确值,全部字段标识均输入完毕生成该样本的正确值文本。
9.根据权利要求8所述的OCR识别正确率的自动化测试设备,其特征在于:所述模板还包括各字段标识对应的字段名称,将模板导入画框工具后,显示该模板所包含的字段名称,每选中一个字段名称,输入该字段名称对应的正确值。
10.根据权利要求7所述的OCR识别正确率的自动化测试设备,其特征在于:所述匹配过程中,匹配一致,标记为1,匹配失败,标记为0。
CN201811057758.3A 2018-09-11 2018-09-11 Ocr识别正确率的自动化测试方法及测试设备 Pending CN109408807A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811057758.3A CN109408807A (zh) 2018-09-11 2018-09-11 Ocr识别正确率的自动化测试方法及测试设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811057758.3A CN109408807A (zh) 2018-09-11 2018-09-11 Ocr识别正确率的自动化测试方法及测试设备

Publications (1)

Publication Number Publication Date
CN109408807A true CN109408807A (zh) 2019-03-01

Family

ID=65464755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811057758.3A Pending CN109408807A (zh) 2018-09-11 2018-09-11 Ocr识别正确率的自动化测试方法及测试设备

Country Status (1)

Country Link
CN (1) CN109408807A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245576A (zh) * 2019-05-21 2019-09-17 深圳壹账通智能科技有限公司 Ocr识别准确率的检测方法、装置、设备及存储介质
CN111598099A (zh) * 2020-05-18 2020-08-28 腾讯科技(深圳)有限公司 图像文本识别性能的测试方法、装置、测试设备及介质
CN112287936A (zh) * 2020-09-24 2021-01-29 深圳市智影医疗科技有限公司 光学字符识别测试方法、装置、可读存储介质及终端设备
CN112329814A (zh) * 2020-09-29 2021-02-05 山东浪潮通软信息科技有限公司 一种发票数据处理方法及设备
CN113343816A (zh) * 2021-05-31 2021-09-03 的卢技术有限公司 一种针对ocr简历识别算法的自动化测试方法和系统
CN113360451A (zh) * 2021-05-27 2021-09-07 青岛全掌柜科技有限公司 基于自适应进化算法的保单数字化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440507A (zh) * 2013-09-03 2013-12-11 北京中电普华信息技术有限公司 一种票据信息验审设备和一种对票据信息进行验审的方法
CN104077682A (zh) * 2014-06-30 2014-10-01 昆山云景网络科技有限公司 一种基于ocr识别和任务碎片化的单证数据录入方法
US20160292505A1 (en) * 2015-03-31 2016-10-06 International Business Machines Corporation Field verification of documents
CN107516370A (zh) * 2017-08-25 2017-12-26 四川长虹电器股份有限公司 一种票据识别的自动化测试及评价方法
CN107992484A (zh) * 2017-11-23 2018-05-04 网易有道信息技术(北京)有限公司 一种评测ocr系统的性能的方法、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440507A (zh) * 2013-09-03 2013-12-11 北京中电普华信息技术有限公司 一种票据信息验审设备和一种对票据信息进行验审的方法
CN104077682A (zh) * 2014-06-30 2014-10-01 昆山云景网络科技有限公司 一种基于ocr识别和任务碎片化的单证数据录入方法
US20160292505A1 (en) * 2015-03-31 2016-10-06 International Business Machines Corporation Field verification of documents
CN107516370A (zh) * 2017-08-25 2017-12-26 四川长虹电器股份有限公司 一种票据识别的自动化测试及评价方法
CN107992484A (zh) * 2017-11-23 2018-05-04 网易有道信息技术(北京)有限公司 一种评测ocr系统的性能的方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
臧国全: "文本数字化图像OCR识别的准确度测度实验与提高", 《图书情报知识》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245576A (zh) * 2019-05-21 2019-09-17 深圳壹账通智能科技有限公司 Ocr识别准确率的检测方法、装置、设备及存储介质
CN111598099A (zh) * 2020-05-18 2020-08-28 腾讯科技(深圳)有限公司 图像文本识别性能的测试方法、装置、测试设备及介质
CN111598099B (zh) * 2020-05-18 2023-10-24 腾讯科技(深圳)有限公司 图像文本识别性能的测试方法、装置、测试设备及介质
CN112287936A (zh) * 2020-09-24 2021-01-29 深圳市智影医疗科技有限公司 光学字符识别测试方法、装置、可读存储介质及终端设备
CN112329814A (zh) * 2020-09-29 2021-02-05 山东浪潮通软信息科技有限公司 一种发票数据处理方法及设备
CN112329814B (zh) * 2020-09-29 2022-10-11 浪潮通用软件有限公司 一种发票数据处理方法及设备
CN113360451A (zh) * 2021-05-27 2021-09-07 青岛全掌柜科技有限公司 基于自适应进化算法的保单数字化方法
CN113360451B (zh) * 2021-05-27 2022-04-05 青岛全掌柜科技有限公司 基于自适应进化算法的保单数字化方法
CN113343816A (zh) * 2021-05-31 2021-09-03 的卢技术有限公司 一种针对ocr简历识别算法的自动化测试方法和系统

Similar Documents

Publication Publication Date Title
CN109408807A (zh) Ocr识别正确率的自动化测试方法及测试设备
CN109389109B (zh) 一种ocr全文本识别正确率的自动化测试方法及设备
CN100478913C (zh) 用于测试方案的方法和装置
CN111428599B (zh) 票据识别方法、装置和设备
CN106445795A (zh) 一种数据库sql效率检测方法及装置
WO2008092345A1 (fr) Procédé et appareil de génération de scénario de test, procédé, appareil et système pour test de vérification
Fioravanti et al. A study on fault-proneness detection of object-oriented systems
CN110851677A (zh) 报销凭证处理方法、装置、终端和计算机可读存储介质
CN101814052A (zh) 一种自动化测试的方法
CN110119353B (zh) 测试数据生成方法、装置以及控制器和介质
CN107223257A (zh) 测试方法、测试服务器及系统
CN111767350A (zh) 数据仓库测试方法、装置、终端设备及存储介质
CN115357906A (zh) 面向网络安全等级保护2.0的智能辅助测评方法及系统
CN106066881B (zh) 数据处理方法及装置
CN114881814A (zh) 一种自然资源综合调查技术方法
CN110569363A (zh) 一种决策流组件生成方法、装置、电子设备及存储介质
CN108388513B (zh) 一种自动化测试方法及装置
CN114419631A (zh) 一种基于rpa的网管虚拟系统
CN112559369A (zh) 一种自动化测试方法、设备和存储介质
CN110287114B (zh) 一种数据库脚本性能测试的方法及装置
CN106201888A (zh) 智能视频叠加处理器自动测试方法及装置
CN114841663A (zh) Gps设备安装质量的核验方法、装置、设备及存储介质
CN111144429A (zh) 对象分类方法及其系统、计算机系统及计算机可读介质
CN112348454B (zh) 一种电气设备交接试验智能管控系统及方法
CN101425141B (zh) 图像识别装置和图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190301