CN110427886A - 一种手写识别的自动化校验方法及系统 - Google Patents
一种手写识别的自动化校验方法及系统 Download PDFInfo
- Publication number
- CN110427886A CN110427886A CN201910713128.5A CN201910713128A CN110427886A CN 110427886 A CN110427886 A CN 110427886A CN 201910713128 A CN201910713128 A CN 201910713128A CN 110427886 A CN110427886 A CN 110427886A
- Authority
- CN
- China
- Prior art keywords
- hand
- written
- identification
- test
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3664—Environments for testing or debugging software
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种手写识别的自动化校验方法,所述方法包括如下步骤:步骤S1、提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;步骤S2、对测试集进行测试,并生成对应的测试报告;步骤S3、根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。本发明还提供了一种手写识别的自动化校验系统,本发明降低了手写验证的成本。
Description
技术领域
本发明涉及计算机通讯技术领域,特别是一种手写识别的自动化校验方法及系统。
背景技术
目前常见的手写识别准确性验证方案是:通过人工使用电脑或者移动设备在程序上进行手写绘制,再通过人工眼睛来判断是否识别正确。在测试前提前准备想要测试的内容,比如汉字识别、英文单词识别、偏旁部首识别等等。举例测试范围为所有的汉字,那么测试的人员需要依次按照列举的汉字进行绘画,然后再观察识别的结果是否正确。在下一个版本的时候,再执行一样的过程进行验证。这是最常见的一个测试方式,但是也是成本最大的。当然也可以通过线上用户的手写情况,进行数据统计,来计算识别的一个通过情况,但是线上数据的正确性无法保证,可能本身就是用户的手写错误,有些场景是没有期望手写的内容字段,还得人工贴上标签。
缺点一,针对手写识别率,如果采用人工手写的方式来验证并统计,那么假设以中文汉字的识别来论,目前常用国字标准字体就有4808个字。如果每次开发进行识别率优化提升,都以这种方式来重新书写一遍4808字来验证,无疑要浪费的成本是非常高的。以每个字写一遍为基础单位,5人天的时间作为书写时间来判,如果开发连续进行N次的迭代提测,且同学每次都重新进行手写一遍,成本消耗可想而知。与此同时,测试投入时间太久的话,也极易影响到版本迭代的效率。
缺点二,手写识别如果采用人工的方式来书写,不考虑时间的情况下,即使每次都重新书写了相同多的文字,也不能代表可以准确计算出开发优化识别率的具体情况,因为人每次手写的文字轨迹都是不一样。只能说形似,但轨迹不一样,所以在验证版本迭代的提升率上这种方式是不太合理的,无法作为权威的测试数据集。
缺点三,通过人工进行手写识别的话,一般只能观察到识别结果的正确与否,而实际在优化的过程中可能因为增加了判断规则和算法的复杂度,而导致响应速度上的提高。单纯从人工的方式上去观察的话,很难体验出偏差0.5秒以下的差距。
发明内容
为克服上述问题之一,本发明的目的是提供一种手写识别的自动化校验方法,能实现自动校验,降低了手写验证的成本。
本发明的技术问题之一采用以下方案实现:一种手写识别的自动化校验方法,所述方法包括如下步骤:
步骤S1、提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
步骤S2、对测试集进行测试,并生成对应的测试报告;
步骤S3、根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
进一步的,所述步骤S1进一步包括:
步骤11、提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;
步骤12、提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;
步骤13、提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。
进一步的,所述步骤S1中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。
进一步的,所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
进一步的,所述步骤S2进一步包括:
步骤S21、提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
步骤S22、提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
步骤S23、每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
步骤S24、每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。
进一步的,所述步骤S3进一步包括:步骤S31、提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
步骤S32、选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;
步骤S33、通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
步骤S34、当所有数据全部纠正完,报告重新生成,更新最新的识别率。
为克服上述问题之二,本发明的目的是提供一种手写识别的自动化校验系统,实现不同手写识别类型的统一管理。
本发明的技术问题之二采用以下方案实现:一种手写识别的自动化校验系统,所述系统包括手写数据保存模块、手写测试执行模块、以及手写回放纠错模块;
所述手写数据保存模块:用于提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
所述手写测试执行模块:用于对测试集进行测试,并生成对应的测试报告;
所述手写回放纠错模块:用于根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
进一步的,所述手写数据保存模块进一步包括:手写画布单元、识别类型选择的选项单元、以及识别内容的输入框单元;
所述手写画布单元:用于提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;
所述识别类型选择的选项单元:用于提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;
所述识别内容的输入框单元:用于提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。
进一步的,所述手写数据保存模块中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。
进一步的,所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
进一步的,所述手写测试执行模块进一步为:
提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。
进一步的,所述手写回放纠错模块进一步为:提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;
通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
当所有数据全部纠正完,报告重新生成,更新最新的识别率。
本发明的有益效果在于:1、通过本专利提供的方式进行手写批改识别率验证,测试人员可以实现手写数据源的重复利用,减低了手写验证的成本。
2、通过本专利提供的手写回放功能,可以快速定位到识别误差场景下的具体原因,过滤测试数据集合导致的误差。
3、通过本专利提供的加速识别功能,可以在几分钟内快速验证并得到一个识别的结果,并进行反馈。
4、通过本专利提供的报告统计,可以快速分析出每个版本优化的具体效果及可能产生的其他影响和遗留问题列表,可以辅助开发更好的进行问题优化和解决。
5、通过本专利提供的报告,可以快速的判断每个版本优化之后对应性能响应上的一个变化,为项目在性能方面是否需要增加硬件投入或优化算法提供依据。
附图说明
图1是本发明的方法流程示意图。
图2是本发明的手写识别的自动化校验系统的结构示意图。
图3是本发明的手写数据保存模块工作的详细流程示意图。
图4是本发明的手写测试执行模块工作的详细流程示意图。
图5是本发明的手写回放纠错模块工作的详细流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
请参阅图1所示,本发明的一种手写识别的自动化校验方法,所述方法包括如下步骤:
步骤S1、提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
步骤S2、对测试集进行测试,并生成对应的测试报告;
步骤S3、根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
所述步骤S1进一步包括:
步骤11、提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;本发明提供的手写画布为H5的形式,支持适配移动端设备使用手指书写及电脑端的鼠标移动绘制。
步骤12、提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;(其他手写识别对象也可进行扩展,这边只做举例);
步骤13、提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。测试人员可以点击【上一个】或【下一个】来切换期望识别内容;
进一步的,所述步骤S1中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;供开发或者质量保证测试员QA参考;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
举例:测试同学选择识别类型为中文汉字,并在其识别内容框中填入:“一”,然后在手写画布上绘写了对应的“一”字。最后点击保存,则服务器中默认新增了这一个测试集的数据,数据结构主要字段内容如下表1:
表1
表1中手写序列点“291,380,0.0,291,379,0.0,302,379,0.0,317,379,1.0”意思是:由x,y轴坐标和0、1组成的一个序列串。其中x,y指的是绘制过程中轨迹上每个像素点的坐标。而0和1主要是为了区分着笔和起笔。着笔就是指鼠标或手指或笔正在画,起笔就是离开画布的那最后一坐标点。所以详分为(291,380,0.0)(291,379,0.0)(302,379,0.0)(317,379,1.0)。当然0,1可以是其他标志数值或符号,甚至其他组合规则。意在实现每个起落笔的轨迹点串区分,因为一个字可能有很多笔画,比如【二】就有两次起笔。
所述步骤S2进一步包括:
步骤S21、提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
步骤S22、提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
步骤S23、每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
并生成报告(报告的数据结构主要字段如下表2);
表2
步骤S24、每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。(例如上表的识别率就是0.75)
进一步的,所述步骤S3进一步包括:步骤S31、提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
步骤S32、选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;(纠正页默认过滤掉已经标识为1的测试数据);
步骤S33、通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
步骤S34、当所有数据全部纠正完,报告重新生成,更新最新的识别率。
另外,本发明提供了一种手写识别的自动化校验系统,所述系统包括手写数据保存模块、手写测试执行模块、以及手写回放纠错模块;
所述手写数据保存模块:用于提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
所述手写测试执行模块:用于对测试集进行测试,并生成对应的测试报告;
所述手写回放纠错模块:用于根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
所述手写数据保存模块进一步包括:手写画布单元、识别类型选择的选项单元、以及识别内容的输入框单元;
所述手写画布单元:用于提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;
所述识别类型选择的选项单元:用于提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;
所述识别内容的输入框单元:用于提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。
所述手写数据保存模块中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。
所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
所述手写测试执行模块进一步为:
提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。
所述手写回放纠错模块进一步为:提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;
通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
当所有数据全部纠正完,报告重新生成,更新最新的识别率。
下面结合一具体实施例对本发明作进一步说明:
场景一:
同学小A负责一个人工智能手写识别的系统,其中主要工作内容包含了中文汉字等识别准确性的验证。在第一次版本提测的时候,同学小A兴致勃勃的对每个字体进行认真的描写。在用了一周的时间把所有的字体手写了一遍,发现有很多识别不准的地方,于是同学小A将每次手写的字进行截图并存储在excel中,并在全部字体写完的时候进行人工统计。发现了识别率在包含某些特征笔画的时候识别概率异常的低,不管他写的多准确,都会提示字体写错。于是她把报告总结了一下给开发,交付开发进行调优。
三天后,开发反馈已经对其中的一些特征进行了调整,需要小A再测试一下,小A又抽取了1000多个字进行手写识别,发现还是存在不准的情况,此时小A非常烦躁,每次都要进行重复的手写操作。与此同时,开发也嫌弃了小A的反馈速度,在不断的迭代中,小A的耐心被磨没了,测试也变的很烦躁。
通过本专利的方案,小A可以在第一次进行操作的时候进行数据保存,当开发调优识别概率之后,小A可以实现一键式的自动化验证操作。在万级别的测试数据验证下实现分钟级别的快速验证。即小A通过手写数据保存模块中手写画布进行输入要测试的文字,手写数据保存模块将将各类手写类型的手写轨迹作为测试集;然后所述手写测试执行模块对测试集进行测试,并生成对应的测试报告;小A再通过所述手写回放纠错模块根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误;这样提高了工作效率;与此同时保证了与上次测试数据的一致性,得到准确的一个提示数据,并得到开发同学的一致好评。
场景二:
同学小B在负责一个智能化识别项目的测试,由于需要涉及的测试内容较多,其中单纯中文汉字的就有接近4千个。在评测的过程中,由于编写之后呢,有时候由于自己手误不小心点了屏幕,增加了笔画数,有时候由于自己书写本身就不规范,却以为自己写的是正确的。并把这些由于测试数据错误的case都汇总给了开发。开发在排查小B反馈的序列内容时候发现不少内容识别错误理论上不应该会出现,就进行了数据定位,并抓取了日志分析,并将数据还原成生成的文字,发现存在很多的字体数据源本身就是错的,于是对小B很是发火。认为小B做事情很不负责,这么多错误数据导致他花费了很多不该浪费的时间在无用的排查上。
通过本专利的方案,同学小B可以根据书写回放的功能及提示来直观的判断出是否是数据源的错误情况,进行过滤,保证自己测试的数据全部是符合该类型的,并将其运用在之后的回归测试中。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (12)
1.一种手写识别的自动化校验方法,其特征在于:所述方法包括如下步骤:
步骤S1、提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
步骤S2、对测试集进行测试,并生成对应的测试报告;
步骤S3、根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
2.根据权利要求1所述的一种手写识别的自动化校验方法,其特征在于:所述步骤S1进一步包括:
步骤11、提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;
步骤12、提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;
步骤13、提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。
3.根据权利要求1所述的一种手写识别的自动化校验方法,其特征在于:所述步骤S1中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。
4.根据权利要求3所述的一种手写识别的自动化校验方法,其特征在于:所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
5.根据权利要求2所述的一种手写识别的自动化校验方法,其特征在于:所述步骤S2进一步包括:
步骤S21、提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
步骤S22、提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
步骤S23、每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
步骤S24、每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。
6.根据权利要求5所述的一种手写识别的自动化校验方法,其特征在于:所述步骤S3进一步包括:步骤S31、提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
步骤S32、选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;
步骤S33、通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
步骤S34、当所有数据全部纠正完,报告重新生成,更新最新的识别率。
7.一种手写识别的自动化校验系统,其特征在于:所述系统包括手写数据保存模块、手写测试执行模块、以及手写回放纠错模块;
所述手写数据保存模块:用于提供一手写画布、一识别类型选择的选项、以及一识别内容的输入框,测试人员在手写画布上书写文字后,将各类手写类型的手写轨迹作为测试集;
所述手写测试执行模块:用于对测试集进行测试,并生成对应的测试报告;
所述手写回放纠错模块:用于根据生成的报告,查看错误数据的回放结果,纠正存在的人为错误。
8.根据权利要求7所述的一种手写识别的自动化校验系统,其特征在于:所述手写数据保存模块进一步包括:手写画布单元、识别类型选择的选项单元、以及识别内容的输入框单元;
所述手写画布单元:用于提供一手写画布,便于测试人员使用鼠标在手写画布上移动描画期望书写的文字;
所述识别类型选择的选项单元:用于提供一识别类型选择的选项,包括中文汉字、中文笔画、英文单词、以及偏旁部首识别;
所述识别内容的输入框单元:用于提供一识别内容的输入框,用户自行输入期望识别的内容,为了便于收集测试集,每个识别类型提供一个默认的识别内容列表进行展示。
9.根据权利要求7所述的一种手写识别的自动化校验系统,其特征在于:所述手写数据保存模块中将各类手写类型的手写轨迹作为测试集,具体为:测试人员每完成一笔操作进行起笔的时候,触发请求对应识别类型服务的响应,把当前服务返回内容显示在前端;当手写文字没有人为错误的时候,点击保存序列点能自动将当前识别的类型,内容及序列点以对应的数据结构存储在服务端。
10.根据权利要求9所述的一种手写识别的自动化校验系统,其特征在于:所述序列点为:手写过程在手写画布上绘制的轨迹,由x,y轴坐标和0、1组成的一个序列串;是否标准序列是一个标志位,0为未确认序列点,1则是已确认的序列点;所述数据结构为:手写类型、手写内容、手写序列点、是否标准序列。
11.根据权利要求8所述的一种手写识别的自动化校验系统,其特征在于:所述手写测试执行模块进一步为:
提供请求url地址配置模块,用于配置每个识别类型对应服务的URL,根据开发提测的环境来选择自动化测试所请求的对应服务的URL地址;
提供加速引擎模块,配置最大执行并发数count,程序会自动计算当前计算机仍可分配支持的线程数topThread,提供当前可支持线程数一半的线程num=topThread/2,如果num大于最大count,则以count为并发线程数,否则以num为并发线程数;
每个线程根据偏移量分别发起对应的测试,所述偏移量为:测试集数量/并发线程数;并将结果合并到一个公用的数据缓存组中,当全部线程执行完毕之后,对所有的数据进行一个存储,并生成报告;
每次完成一次测试,统计生成当前环境最新的识别率的统计图表,并给出当前的识别率和报告下载。
12.根据权利要求11所述的一种手写识别的自动化校验系统,其特征在于:所述手写回放纠错模块进一步为:提供一个根据测试类型和环境筛选测试记录的选项,用户查询所有测试过的记录;
选择任意一个测试记录,查看识别错误的列表,点击进入纠正状态;
通过列表下的错误回放,观看是否人为错误,如果是人为错误则点击删除,如果是程序识别错误,则点击标识为1;
当所有数据全部纠正完,报告重新生成,更新最新的识别率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713128.5A CN110427886B (zh) | 2019-08-02 | 2019-08-02 | 一种手写识别的自动化校验方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713128.5A CN110427886B (zh) | 2019-08-02 | 2019-08-02 | 一种手写识别的自动化校验方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110427886A true CN110427886A (zh) | 2019-11-08 |
CN110427886B CN110427886B (zh) | 2022-02-08 |
Family
ID=68414006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910713128.5A Active CN110427886B (zh) | 2019-08-02 | 2019-08-02 | 一种手写识别的自动化校验方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110427886B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114911544A (zh) * | 2021-02-09 | 2022-08-16 | 北京同邦卓益科技有限公司 | 数据分析报告的生成方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5101437A (en) * | 1991-02-11 | 1992-03-31 | Ecole Polytechnique | Method and apparatus for comparing a test handwritten signature with a reference signature by using information relative to curvilinear and angular velocities of the signature |
CN1190205A (zh) * | 1996-11-15 | 1998-08-12 | 辛纳普蒂克斯有限公司 | 表意字符的递增输入方法 |
CN103824094A (zh) * | 2012-11-16 | 2014-05-28 | 方正国际软件(武汉)有限公司 | 笔迹校验装置和笔迹校验方法 |
CN104050453A (zh) * | 2014-06-24 | 2014-09-17 | 南京师范大学 | 一种手写汉字笔势评价方法 |
CN104346390A (zh) * | 2013-08-01 | 2015-02-11 | 北大方正集团有限公司 | 一种形成字库的方法及装置 |
CN104572595A (zh) * | 2013-10-11 | 2015-04-29 | 北大方正集团有限公司 | 字库校验装置和字库校验方法 |
CN106296501A (zh) * | 2015-05-26 | 2017-01-04 | 刘佳豪 | 一种测验卷批改方法及其系统 |
CN107688803A (zh) * | 2016-08-05 | 2018-02-13 | 腾讯科技(深圳)有限公司 | 字符识别中识别结果的校验方法和装置 |
CN108700996A (zh) * | 2016-02-23 | 2018-10-23 | 迈思慧公司 | 用于多输入管理的系统和方法 |
-
2019
- 2019-08-02 CN CN201910713128.5A patent/CN110427886B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5101437A (en) * | 1991-02-11 | 1992-03-31 | Ecole Polytechnique | Method and apparatus for comparing a test handwritten signature with a reference signature by using information relative to curvilinear and angular velocities of the signature |
CN1190205A (zh) * | 1996-11-15 | 1998-08-12 | 辛纳普蒂克斯有限公司 | 表意字符的递增输入方法 |
CN103824094A (zh) * | 2012-11-16 | 2014-05-28 | 方正国际软件(武汉)有限公司 | 笔迹校验装置和笔迹校验方法 |
CN104346390A (zh) * | 2013-08-01 | 2015-02-11 | 北大方正集团有限公司 | 一种形成字库的方法及装置 |
CN104572595A (zh) * | 2013-10-11 | 2015-04-29 | 北大方正集团有限公司 | 字库校验装置和字库校验方法 |
CN104050453A (zh) * | 2014-06-24 | 2014-09-17 | 南京师范大学 | 一种手写汉字笔势评价方法 |
CN106296501A (zh) * | 2015-05-26 | 2017-01-04 | 刘佳豪 | 一种测验卷批改方法及其系统 |
CN108700996A (zh) * | 2016-02-23 | 2018-10-23 | 迈思慧公司 | 用于多输入管理的系统和方法 |
CN107688803A (zh) * | 2016-08-05 | 2018-02-13 | 腾讯科技(深圳)有限公司 | 字符识别中识别结果的校验方法和装置 |
Non-Patent Citations (3)
Title |
---|
LIQUAN QIU 等: "An open source testing tool for evaluating handwriting input methods", 《ICDAR》 * |
樊庆林: "基于笔画的联机手写汉字识别系统的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈胤子: "手写识别算法研究及在移动平台上的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114911544A (zh) * | 2021-02-09 | 2022-08-16 | 北京同邦卓益科技有限公司 | 数据分析报告的生成方法、装置、电子设备及存储介质 |
CN114911544B (zh) * | 2021-02-09 | 2024-04-05 | 北京同邦卓益科技有限公司 | 数据分析报告的生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110427886B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104486461B (zh) | 域名分类方法和装置、域名识别方法和系统 | |
US8725717B2 (en) | System and method for identifying topics for short text communications | |
CN111611458B (zh) | 大数据治理中基于元数据和数据分析技术实现系统数据架构梳理的方法 | |
KR20210100600A (ko) | 소프트웨어 테스팅 | |
CN106650780A (zh) | 数据处理方法及装置、分类器训练方法及系统 | |
CN107526846B (zh) | 频道排序模型的生成、排序方法、装置、服务器和介质 | |
CN103098051A (zh) | 搜索引擎优化助理 | |
CN102804147A (zh) | 执行abap源代码的代码检查的代码检查执行系统 | |
CN104036004B (zh) | 搜索纠错方法和搜索纠错装置 | |
US20180174288A1 (en) | SCORE WEIGHTS FOR USER INTERFACE (ui) ELEMENTS | |
CN107391383B (zh) | 一种应用程序界面的测试方法和测试系统 | |
CN109947635A (zh) | 一种数据上报方法、装置、存储介质及终端设备 | |
CN111125068A (zh) | 一种元数据治理方法和系统 | |
CN105893390A (zh) | 一种应用程序的处理方法及电子设备 | |
CN110348020A (zh) | 一种英文单词拼写纠错方法、装置、设备及可读存储介质 | |
CN108090568A (zh) | 认知机器人学分析器 | |
CN110211581B (zh) | 一种实验室自动语音识别记录标识系统及方法 | |
CN104794485B (zh) | 一种识别书写字的方法及装置 | |
CN106294128B (zh) | 一种导出报表数据的自动化测试方法及装置 | |
CN102737030A (zh) | 专利文档的数据输出方法、终端及系统 | |
CN110427886A (zh) | 一种手写识别的自动化校验方法及系统 | |
CN114580368A (zh) | 一种智能化报表采集减负方法、装置、终端及存储介质 | |
CN111125145A (zh) | 一种通过自然语言获取数据库信息的自动化系统 | |
CN103064967B (zh) | 一种用于建立用户二元关系库的方法与设备 | |
CN111444099A (zh) | 数据不一致的分析方法、系统、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |