CN111428446B - 问卷识别方法及问卷识别系统 - Google Patents

问卷识别方法及问卷识别系统 Download PDF

Info

Publication number
CN111428446B
CN111428446B CN202010120801.7A CN202010120801A CN111428446B CN 111428446 B CN111428446 B CN 111428446B CN 202010120801 A CN202010120801 A CN 202010120801A CN 111428446 B CN111428446 B CN 111428446B
Authority
CN
China
Prior art keywords
questionnaire
option
question
scale
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010120801.7A
Other languages
English (en)
Other versions
CN111428446A (zh
Inventor
郑骏明
项露赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Tetrahedron Technology Co ltd
Original Assignee
Foshan Tetrahedron Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Tetrahedron Technology Co ltd filed Critical Foshan Tetrahedron Technology Co ltd
Priority to CN202010120801.7A priority Critical patent/CN111428446B/zh
Publication of CN111428446A publication Critical patent/CN111428446A/zh
Application granted granted Critical
Publication of CN111428446B publication Critical patent/CN111428446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于问卷识别技术领域,公开了一种问卷生成方法、问卷识别方法及问卷识别系统,问卷生成方法包括获取问卷题目信息,将所述问卷题目信息组织形成得到问卷;问卷识别方法包括,逐份扫描问卷获取问卷图像,识别页面右上角的页面信息条形码,获取辅助定位框的位置,定义出选项区的位置,截取选项区图像,与横向标尺或纵向标尺对比,得出填涂选项的序号;问卷识别系统包括,问卷输入端、问卷识别端和问卷输出端;本发明提供的问卷生成方法、问卷识别方法及问卷识别系统,减少了问卷识别过程中干扰元素,简化识别方法,提高识别效率。

Description

问卷识别方法及问卷识别系统
技术领域
本发明涉及问卷识别技术领域,特别涉及一种问卷识别方法及问卷识别系统。
背景技术
问卷在当今社会生活中被广泛地使用。比如开展一个新的项目或者生产一个新的产品,都要通过市场问卷调查来分析项目的可行性或者产品的需求量,纸质的问卷对于调查和统计分析是必不可少的,当这些问卷被填写好后,统计分析只能靠人工来进行,需要大量的人力和物力,因此需要可以快速高效识别问卷内容的方法。
现有的问卷识别方法,大多基于普通的文本问卷,在识别过程中需要排除复杂的问卷背景、问卷旋转或遮挡、获取的问卷图像形变以及问卷题目的本身文本等元素的干扰,需要进行大量复杂运算,识别率和可行性都不高,识别效率差。例如公开号为CN107908612A的中国专利公开了答题卡生成方法、答题卡识别方法和作业系统,其公开了问卷识别方法是获取答题卡图像后,通过锚点定位原点位置,计算出填涂区的坐标参数,获取答题结果,该方法是预先计算好理论上各个涂卡区域的位置,然后再根据这些位置将整个页面分割出涂卡区域,逐个识别。但是这种做法过于理想化,首先基于摄像头识别图像,这个过程不可避免的会有图像的形变,就算根据锚点对图像进行纠偏,始终会有误差,所以理论上生成的分割区域和实际上经过纠偏以后的图像,匹配会出现问题;而且对于跨页的题目,同时要受到两页的纠偏产生的变异的影响,这样就更容易出现问题。
另外,现有的答题卡和问卷基本是分开的,可能只适用于正规考试这种场景,但是对于日常问卷的填涂和识别,不能像正规考试一样,这样会增加问卷填涂者的抗拒心理;同时答题卡和问卷分开也会增加答题卡识别的难度。
发明内容
本发明要解决的技术问题针对现有技术中答题卡和问卷基本分开,不利于填涂和识别的缺陷,提供问卷识别方法及问卷识别系统。
本发明是通过以下的技术方案实现的:
第一方面,本发明提供一种问卷生成方法,包括:
S1. 获取问卷题目信息,所述问卷题目信息包括题目的题序、题型、题干内容和选项内容;
S2. 将S1所述问卷题目信息通过第一计算机程序组织形成得到问卷,所述问卷包括题干区、选项区、辅助定位框、横向标尺、纵向标尺、题目信息条形码。
利用该生成方法获得的问卷便于后续识别,同时可以简化识别过程。
优选地,S1所述获取题目信息,具体包括以下步骤:
(1)获取用户通过问卷编辑端输入的题干内容和选项内容,并自动分配题序;
(2)根据用户通过问卷编辑端选择的题型,生成题目信息条形码;
优选地,S2所述组织形成的规则具体包括以下:
(1)所述题干区录入题目,选项区录入选项内容,其中选项区设置在题目区下方,选项内容左侧对应设置有填涂框,便于调查对象察看,并对应填涂相应的填涂框;
(2)所述辅助定位框设置在选项区的四个边角处,用于定位选项区的位置;
(3)所述横向标尺设置在页面顶端;
(4)所述纵向标尺设置在所述横向标尺以及各选项区的右侧;
(5)所述题目信息条形码设置在对应所述选项区左上角的辅助定位框的右侧。
题目类型信息包括X1、X2和X3组成的信息码,具体编码规则为:当X1=0,题目为单项选择,当X1=1,题目为多项选择;当X2=0,填涂框为纵向排列,当X2=1,则填涂框为横向排列;当X3=0,题目为必选题,当X3=1,则题目为非必选题,计算机程序通过识别题目信息条形码即可快速获取该题目属于的题目类型进行统计;
优选地,S2所述问卷还包括页码及页面信息条形码,所述页码及页面信息条形码均设置在页面的右上角,其中页码(以该页页码/总页码数的格式标注,例如1/5)便于用户及调查对象直观的察看,页面信息条形码为可通过程序识别的两位数字的页码,用于程序校验页码和图像次序。
与现有技术相比,本发明提供的问卷生成方法具备以下优点:
(1)通过问卷编辑端内的计算机指令,可自定义问卷的题目选项以及排列方式,节省了大量的排版时间。
(2)通过辅助定位框直接定位选项区的位置,避免问卷背景及题目文本对识别的干扰;同时区别与现有答题卡,填涂框内无标注文字,避免了标注文字对填涂框的误识别。
(3)将问卷与答题卡相结合,通过问卷输入端直接扫描输入问卷,避免了问卷旋转、遮挡以及摄取图像时发生形变的干扰,无需进行大量坐标校正运算,大大加快的识别效率。
第二方面,本发明提供了一种问卷识别方法,包括:
S1.逐份扫描问卷获取问卷图像,并按次序存储,所述问卷为上述问卷生成方法得到的问卷;
S2.识别页面右上角的页面信息条形码,将页码信息与图像次序进行校验,保证页码和图像次序的一致性;
S3.获取辅助定位框的位置,定义出选项区的位置,避免问卷背景以及问卷除选项区以外其他文本对选项区识别的干扰;
S4. 根据获取得到的辅助定位框的位置截取选项区图像,通过识别流程得到被填涂的选项框;
S5.与横向标尺或纵向标尺对比,得出填涂选项的序号,其中横向排列的填涂框与横向标尺对比,纵向排列的填涂框与纵向标尺对比,通过对应的标尺块得出填涂选项的序号。
优选地,S3所述获取辅助定位框位置的具体方法为:通过识别流程找到纵向标尺,生成方形边框后由上至下排序,截取前三个方形边框Y轴范围内的图像,通过识别流程找到横向标尺,截取横向标尺的末端以及页面90%右边界之间的图像,通过识别流程获取图像内辅助定位框的位置。
优选地,S3所述定义所述选项区位置的具体方法为:将辅助定位框从上到下顺序排序,两两一组,各组辅助定位框分别定义对应所述选项区的上下界限;所述横向标尺的第一个框和最后一个框分别定义对应所述选项区的左右界限,在识别时可快速获取选项区的坐标信息,提高识别的效率。
优选地,所述识别流程包括:
(1)将图像区域转换成灰度图像;
(2)对图像施加轻度模糊(直径为5像素);
(3)进行阀值运算,使用反向二分类结合大津算法;
(4)从阀值运算结果提取轮廓,并对轮廓进行计算对比,获取符合标准的轮廓。
优选地,上述识别流程中所述轮廓具体计算过程包括以下步骤:
(1)为各个轮廓生成方形边框,获取方形边框左上角xy坐标以及方形边框的宽和高;
(2)将方形边框的宽和高与待识别对象的像素尺度进行对比,明显低于尺度下限的予以排除;
(3)根据方形边框左上角xy值以及方形边框的宽高值获取方形边框所对应的图像区域,对图像区域中阀值运算结果进行非零计数,获取其中高于阀值的像素比例,比例低于50%的,予以排除,通过尺度下限以及阀值像素比例下限两次排除最大限度避免填涂框误识别,保证识别的准确性。
本发明提供的问卷识别方法,基于上述问卷生成方法,相比现有技术更加简单,识别率更高,识别速度更快。
第三方面,基于第一方面和第二方面,本发明还提供了一种问卷识别系统(本问卷识别系统针对的是客观题问卷的填涂数据读取),包括:问卷输入端、问卷识别端和问卷输出端;
其中,问卷输入端为高速扫描仪,用于扫描输入填涂后的问卷;
问卷识别端存储第二计算机程序,所述第二计算机程序被处理器执行时实现第二方面中任一所述的方法;
问卷输出端为打印机,用于打印输出编辑生成的问卷。
上述问卷识别系统的工作过程为:通过问卷生成方法获得的问卷完成填涂后,通过问卷输入端扫描获取问卷图像,并由问卷识别端通过第二计算程序执行第二方面所述的方法,识别问卷选项。
附图说明
图1为本发明实施例1生成问卷的排版示意图;
图2为本发明实施例2问卷识别的流程图;
附图标记:1-题目;11-题干区;12-选项区;121-填涂框;122-选项内容;2-页码;3-页面信息条形码;4-横向标尺;5-纵向标尺;6-辅助定位框;7-题目信息条形码;8-选项区纵向排列题目;9-选项区横向排列题目;10-题目选项并排题目。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1
如图1所示,本实施例提供一种问卷生成方法,包括:
步骤S1.获取问卷题目信息,所述问卷题目信息包括题目的题序、题型、题干内容和选项内容;
其中本实施例针对的题目1为客观题,题型有:单项选择、多项选择、必选和非必选,在录入时,用户通过问卷编辑端逐一录入题干内容以及对应的选项内容122,并选择对应的题型以及选项的排列方式,之后由问卷编辑端执行以下步骤。
S2.将S1所述问卷题目信息通过第一计算机程序组织形成得到问卷,所述问卷包括题干区11、选项区12、辅助定位框121、横向标尺4、纵向标尺5、题目信息条形码7;
本实施例将各种题型的题目设计成统一的结构,包括题干区11和选项区12,按照上述的步骤得到如图1所示的问卷,固定统一结构的优势在于统一了题目的分析结构,便于内容的组织形成显示,适应样式上的各种调整,以及后续坐标的计算。为了使得问卷更加美观,相邻两个题目之间预先设定了留空区域,优化显示效果。
进一步地,S1所述获取题目信息,具体包括以下步骤:
(1)获取用户通过问卷编辑端输入的题干内容和选项内容122,并自动分配题序;
(2)根据用户通过问卷编辑端选择的题型,生成题目信息条形码7;
进一步地,S2所述组织形成的规则具体包括以下:
(1)所述题干区11录入题目,选项区12录入选项内容122,其中选项区12设置在题目区12下方,选项内容122左侧对应设置有填涂框121(5mm*10mm的封闭无文本方框)用于填涂题目答案(可使用2B铅笔或更深色铅笔填涂),便于调查对象察看,并对应填涂相应的填涂框121;
其中同一选项区12的填涂框121可纵向排列,纵向间隔为2.5mm(如图1选项区纵向排列题目8所示);当选项文本122较短时,可选择横向排列(如图1选项区横向排列题目9所示);当题干和选项均内容较少(如性别:男/女),可将题干区11与选项区12排列在同一行,在选项区12周边放置4个辅助定位框6以及题目信息条形码7(如图1题目选项并排题目10所示),节省题目1占用的空间。
(2)所述辅助定位框6设置在选项区12的四个边角处,所述辅助定位框6(5mm*5mm的黑色框),各选项区12左上角的辅助定位框6右边缘与横向标尺4的最左侧标尺块的左边缘对齐,各选项区12右上角的辅助定位框6的左边缘与最右侧标尺块的右边缘对齐 ,本实施例通过辅助定位框6来定位选项区的位置,具体方法见实施例2,在此不再赘述;
(3)所述横向标尺4设置在页面顶端(横向标尺4包括均匀分布的二十个标尺块);
(4)所述纵向标尺5设置在所述横向标尺4以及各选项区12的右侧;纵向标尺5包括若干个标尺块(宽度为2.5mm,间隔1.25mm),其中纵向标尺5的设置原则为,首先在横向标尺4的最右端标尺块的右侧设置有3个纵向标尺5的标尺块;其次在选项区12,当填涂框121纵向排列(宽度为5mm,间隔2.5mm)时,每个选项区12纵向标尺5标尺块的数量等于填涂框121数量*2+1,第一个纵向标尺5标尺块上边缘与第一个填涂框121上边缘平齐,而最后一个纵向标尺5标尺块的上边缘则与最后一个填涂框121的下边缘距离2.5mm;
当填涂框121横向排列时,一行填涂框121对应设置三个纵向标尺5的标尺块,因为仅有一行,所以纵向标尺的数量为1*2+1=3,第一个纵向标尺5标尺块上边缘平齐第一个填涂框121上边缘,而最后一个纵向标尺5标尺块的上边缘则与最后一个填涂框121的下边缘距离2.5mm。
(5)所述题目信息条形码7(10mm*5mm)设置在对应所述选项区12左上角的辅助定位框6的右侧(10mm*5mm)(以左上角辅助定位框6的右边缘开始计算0-26mm 的区域),其中题目信息条形码7使用EAN8编码规则将数字转化为条码。EAN8可接受7位数字进行编码。对于题目信息条形码7,第1位为0,第2到四4为题目序号数字,前序补零(如第1题则2到4位是001,第11题则第2到4位是011),第5到7位是根据有以下算法算出的信息码,同样前序补零。
具体编码规则为:当X1=0,题目为单项选择,当X1=1,题目为多项选择;当X2=0,填涂框为纵向排列,当X2=1,则填涂框为横向排列;当X3=0,题目为必选题,当X3=1,则题目为非必选题;
具体算法为:信息码=X1*2^0+X2*2^1+X3*2^2。
进一步地,S2所述问卷还包括页码2及页面信息条形码3,所述页码2及页面信息条形码3均设置在页面的右上角,所述页码2及页面信息条形码3均设置在页面的右上角,页码2(以该页页码/总页码数的格式标注,例如1/5)便于用户及调查对象直观的察看,其中页面信息条形码3同样使用EAN8编码规则编码,包括7位数值,第1至3位为0,第4至5位为当前页面页码数值,前序补零,第6至7位为问卷总共页数数值,前序补零。
与现有技术相比,本实施例提供的问卷生成方法具备以下优点:
(1)通过问卷编辑端内的计算机指令,可自定义问卷的题目选项以及排列方式,节省了大量的排版时间。
(2)通过辅助定位框6直接定位选项区12的位置,避免问卷背景及题目文本对识别的干扰;同时区别于现有答题卡,填涂框121内无标注文字,避免了标注文字对填涂框121的误识别。
(3)将问卷与答题卡相结合,通过问卷输入端直接扫描输入问卷,避免了问卷旋转、遮挡以及摄取图像时发生形变的干扰,无需进行大量坐标校正运算,大大加快的识别效率。
实施例2
如图2所示,本实施例提供了一种问卷识别方法,包括:
步骤S21,逐份扫描问卷获取问卷图像(形成PDF文件),并读取问卷图像按次序存储,所述问卷为通过实施例1所述问卷生成方法得到的问卷;
步骤S22,识别页面右上角的页面信息条形码3,将页码信息与图像次序进行校验,保证页码和图像次序的一致性;
步骤S23,获取辅助定位框6的位置,定义出选项区12的位置,避免问卷背景以及问卷除选项区12以外其他文本对选项区12识别的干扰;
步骤S24,根据获取得到的辅助定位框的位置截取选项区12图像,通过识别流程得到被填涂的选项框121;
步骤S25,与横向标尺4或纵向标尺5对比,得出填涂选项的序号,其中横向排列的填涂框121与横向标尺4对比,纵向排列的填涂框121与纵向标尺5对比,通过对应的标尺块得出填涂选项的序号。
进一步地,步骤S23获取辅助定位框6的位置具体方法以下步骤:
(1)截取页面右侧10%区域,从中利用识别流程找到纵向标尺5,依据方形边框从上到下的顺序进行排序,选取其中的前三个纵向标尺5的标尺块,获取横向标尺4所在图像区域的y轴范围;
(2)根据步骤S231获得的y轴范围,截取图像,利用识别流程找出所有横向标尺4的标尺块,按照从左到右的顺序进行排序;
(3)根据最后一个横向标尺4标尺块的位置为界限,截取到图像90%的右边界之间的图像,从中使用识别流程找到所有的辅助定位框6。
进一步地,定义所述选项区12位置的具体方法为,将辅助定位框6从上到下顺序排序,两两一组,各组辅助定位框6分别定义对应所述选项区12的上下界限;所述横向标尺4的第一个框和最后一个框分别定义对应所述选项区12的左右界限,在识别时可快速获取选项区12的坐标信息,提高识别的效率。
进一步地,所述识别流程包括:
步骤S251,将图像区域转换成灰度图像;
步骤S252,对图像施加轻度模糊(直径为5像素);
步骤S253,进行阀值运算,使用反向二分类结合大津算法;
步骤S254,从阀值运算结果提取轮廓(具体使用opencv算法实现),并对轮廓进行计算对比,获取符合标准的轮廓。
进一步地,上述识别流程中所述轮廓具体计算过程包括以下步骤:
步骤S2541,为各个轮廓生成最小且能包围整个轮廓的方形边框(具体使用opencv算法实现),获取方形边框左上角的坐标(x,y)以及方形边框的宽和高(具体使用opencv算法实现);
步骤S2542,将方形边框的宽和高与待识别对象的像素尺度进行对比,明显低于尺度下限的予以排除;
步骤S2543,根据方形边框左上角的坐标值以及宽高值获取方形边框所对应的图像区域(通过方形边框左上角的坐标定位图像区域的左上角的位置,通过方形边框的宽高值计算图像区域的面积),对图像区域中阀值运算结果进行非零计数,获取其中高于阀值的像素比例,比例低于50%的,予以排除,通过尺度下限以及阀值像素比例下限两次排除最大限度避免填涂框121误识别,保证识别的准确性。
本实施例提供的问卷识别方法,基于上述问卷生成方法,通过扫描仪等问卷输入设备即可实现识别,相比现有技术更加简单,识别率更高,识别速度更快。
实施例3
本实施例提供了一种问卷识别系统,包括:问卷输入端、问卷识别端和问卷输出端;
其中,问卷输入端为高速扫描仪,用于扫描输入填涂后的问卷;
问卷识别端存储第二计算机程序,所述第二计算机程序被处理器执行时实现实施例2中所述的问卷识别方法;
问卷输出端为打印机,用于打印输出编辑生成的问卷。
本实施例问卷识别系统的工作过程:通过问卷生成方法获得的问卷完成填涂后,通过问卷输入端扫描获取问卷图像,并由问卷识别端通过第二计算程序执行实施例2所述的问卷识别方法,识别问卷选项。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (4)

1.一种问卷识别方法,其特征在于,包括:
S1. 逐份扫描问卷获取问卷图像,并按次序存储,所述问卷通过以下方法得到:
S11、获取问卷题目信息,所述问卷题目信息包括题目的题序、题型、题干内容和选项内容;
所述获取问卷题目信息,具体包括以下步骤:
S111、获取用户通过问卷编辑端输入的题干内容和选项内容,并自动分配题序;
S112、根据用户通过问卷编辑端选择的题型,生成题目信息条形码;
S12、将S1所述问卷题目信息通过第一计算机程序组织形成得到问卷,所述问卷包括题干区、选项区、辅助定位框、横向标尺、纵向标尺、题目信息条形码;所述组织形成得到问卷的规则具体包括以下:
S121、所述题干区录入题目,选项区录入选项内容,其中选项区设置在题目区下方,选项内容左侧对应设置有填涂框;
S122、所述辅助定位框设置在选项区的四个边角处;
S123、所述横向标尺设置在页面顶端;
S124、所述纵向标尺设置在所述横向标尺以及各选项区的右侧;
S125、所述题目信息条形码设置在对应所述选项区左上角的辅助定位框的右侧;
S2. 识别页面右上角的页面信息条形码,将页码信息与图像次序进行校验;
S3. 获取辅助定位框的位置,定义选项区的位置;
S4. 根据获得辅助定位框的位置截取选项区图像,通过识别流程得到被填涂的选项框;
S5. 与横向标尺或纵向标尺对比,得出填涂选项的序号;
S3所述获取辅助定位框的位置的具体方法为:通过识别流程找到纵向标尺,生成方形边框后由上至下排序,截取前三个方形边框Y轴范围内的图像,通过识别流程找到横向标尺,截取横向标尺的末端以及页面90%右边界之间的图像,通过识别流程获取图像内辅助定位框的位置;
S3所述定义选项区的位置的具体方法为:将辅助定位框从上到下顺序排序,两两一组,各组辅助定位框分别定义对应所述选项区的上下界限;所述横向标尺的第一个框和最后一个框分别定义对应所述选项区的左右界限。
2.根据权利要求1所述的一种问卷识别方法,其特征在于:所述识别流程包括以下步骤:
(1)将图像区域转换成灰度图像;
(2)对图像施加轻度模糊;
(3)进行阀值运算,使用反向二分类结合大津算法;
(4)从阀值运算结果提取轮廓,并对轮廓进行计算对比,获取符合标准的轮廓。
3.根据权利要求2所述的一种问卷识别方法,其特征在于:所述轮廓计算过程包括以下步骤:
(1)为各个轮廓生成方形边框,获取方形边框左上角xy坐标以及方形边框的宽和高;
(2)将方形边框的宽和高与待识别对象的像素尺度进行对比,明显低于尺度下限的予以排除;
(3)根据方形边框左上角xy值以及方形边框的宽高值获取方形边框所对应的图像区域,对图像区域中阀值运算结果进行非零计数,获取其中高于阀值的像素比例,比例低于50%的,予以排除。
4.一种问卷识别系统,其特征在于,包括:问卷输出端、问卷输入端和问卷识别端;
所述问卷输出端用于打印输出编辑生成的问卷;
所述问卷输入端用于扫描输入填涂后的问卷;
所述问卷识别端存储第二计算机程序,所述第二计算机程序被处理器执行时实现权利要求1-3中任一项所述的方法。
CN202010120801.7A 2020-02-26 2020-02-26 问卷识别方法及问卷识别系统 Active CN111428446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010120801.7A CN111428446B (zh) 2020-02-26 2020-02-26 问卷识别方法及问卷识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010120801.7A CN111428446B (zh) 2020-02-26 2020-02-26 问卷识别方法及问卷识别系统

Publications (2)

Publication Number Publication Date
CN111428446A CN111428446A (zh) 2020-07-17
CN111428446B true CN111428446B (zh) 2023-09-01

Family

ID=71551587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010120801.7A Active CN111428446B (zh) 2020-02-26 2020-02-26 问卷识别方法及问卷识别系统

Country Status (1)

Country Link
CN (1) CN111428446B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508759B (zh) * 2020-12-10 2022-03-15 清研灵智信息咨询(北京)有限公司 基于微服务的大数据管理和挖掘系统
CN113590549A (zh) * 2021-07-27 2021-11-02 上海众言网络科技有限公司 问卷内容导入及识别方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334814A (zh) * 2008-04-28 2008-12-31 华北电力大学 一种自动化的扫描阅卷系统及阅卷方法
CN107423652A (zh) * 2010-08-06 2017-12-01 手持产品公司 用于文档处理的系统和方法
CN107622463A (zh) * 2017-09-27 2018-01-23 张鹏 一种出卷及自动阅卷系统及方法
CN107908612A (zh) * 2017-11-14 2018-04-13 杭州汉林文化创意股份有限公司 答题卡生成方法、答题卡识别方法、作业系统
CN109325216A (zh) * 2018-09-03 2019-02-12 中国平安人寿保险股份有限公司 问卷生成方法、装置、计算机设备和存储介质
CN109344381A (zh) * 2018-09-29 2019-02-15 山东九点连线信息技术有限公司 一种题卡合一试卷的生成和识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334814A (zh) * 2008-04-28 2008-12-31 华北电力大学 一种自动化的扫描阅卷系统及阅卷方法
CN107423652A (zh) * 2010-08-06 2017-12-01 手持产品公司 用于文档处理的系统和方法
CN107622463A (zh) * 2017-09-27 2018-01-23 张鹏 一种出卷及自动阅卷系统及方法
CN107908612A (zh) * 2017-11-14 2018-04-13 杭州汉林文化创意股份有限公司 答题卡生成方法、答题卡识别方法、作业系统
CN109325216A (zh) * 2018-09-03 2019-02-12 中国平安人寿保险股份有限公司 问卷生成方法、装置、计算机设备和存储介质
CN109344381A (zh) * 2018-09-29 2019-02-15 山东九点连线信息技术有限公司 一种题卡合一试卷的生成和识别方法

Also Published As

Publication number Publication date
CN111428446A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN109190722B (zh) 基于满文字符图片的字体风格迁移变换方法
CN107194400B (zh) 一种财务报销全票据图片识别处理方法
US6154573A (en) Image processing method and image processing device
CN102567300B (zh) 图片文档的处理方法及装置
CN101226594B (zh) 图案分离提取装置和图案分离提取方法
CN110503100B (zh) 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质
CN111428446B (zh) 问卷识别方法及问卷识别系统
EP0063454A2 (en) Method for recognizing machine encoded characters
CN109919037B (zh) 一种文本定位方法及装置、文本识别方法及装置
CN112115774A (zh) 结合rpa和ai的文字识别方法、装置、电子设备和存储介质
CN105160343A (zh) 应用于胶片按需打印系统的信息识别方法和装置
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN103839028B (zh) 一种纸媒与读者互动的方法及系统
US20060194187A1 (en) Material processing apparatus, material processing method, and program product
US7555145B2 (en) Multi-level optical mark reading that uses an unambiguous symbology of marks to fill into response bubbles
US7873228B2 (en) System and method for creating synthetic ligatures as quality prototypes for sparse multi-character clusters
JP3319203B2 (ja) 文書ファイリング方法及び装置
CN111612045B (zh) 一种获取目标检测数据集的通用方法
Neri et al. A methodology for character recognition and revision of the linear equations solving procedure
CN116311301B (zh) 无线表格识别方法及系统
US20100104196A1 (en) Method and System for Extracting Information from an Analog Graph
CN113723410B (zh) 一种数码管数字识别方法及装置
CN116071754B (zh) 一种带指数字符的散点图识别方法及装置
US20240112483A1 (en) Method and apparatus for form identification and registration
JP2006185065A (ja) 文字行列生成装置、その方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant