CN113723543B - 一种自动裁题展示方法、装置、计算机设备及存储介质 - Google Patents
一种自动裁题展示方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113723543B CN113723543B CN202111028482.8A CN202111028482A CN113723543B CN 113723543 B CN113723543 B CN 113723543B CN 202111028482 A CN202111028482 A CN 202111028482A CN 113723543 B CN113723543 B CN 113723543B
- Authority
- CN
- China
- Prior art keywords
- answer
- test question
- test
- question
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012360 testing method Methods 0.000 claims abstract description 567
- 238000004891 communication Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 8
- 102100032202 Cornulin Human genes 0.000 claims description 5
- 101000920981 Homo sapiens Cornulin Proteins 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 claims 1
- 230000007787 long-term memory Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 description 19
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008520 organization Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Educational Technology (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及智能教育技术领域,公开了一种自动裁题展示方法、装置、计算机设备及存储介质。通过本发明创造,可在获取试卷页图片和与所述试卷页图片对应的答案页图片后,自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,进而可节约对照所需时间,杜绝出现错认对应关系及错误评估测试结果的情况,利于考生快速直观地理解错题的正确解答思路,便于实际应用和推广。
Description
技术领域
本发明属于智能教育技术领域,具体地涉及一种自动裁题展示方法、装置、计算机设备及存储介质。
背景技术
试卷是纸张答题工具,即在纸张上印有考试组织者为检测考试者学习情况而设定在规定时间内完成的试题,也可以是资格考试中用以检验考生有关知识能力而进行人才筛选的工具。在试卷作答并上交后,需要考试组织者对照试题答复与标准答案的匹配结果,来检测考试者的学习情况或有关知识能力,以及考生在复习过程中,通常会先自律地在自测试卷或往年真题试卷上作答,然后通过对照标准答案来评估复习情况以及理解错题的正确解答思路。但是试卷上的试题与对应的答案分别位于不同的页面上,需要考试组织者或考生人工地去进行一一对应,不但需要较多的对照时间,还极易出现错认对应关系的纰漏,导致错误评估测试结果,以及不利于考生快速直观地理解错题的正确解答思路。因此如何自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,是本领域技术人员当前亟需解决的技术问题。
发明内容
为了解决当前在对照试题答复与标准答案的过程中,所存在需要较多的对照时间、易错认对应关系及错误评估测试结果和不利于考生快速直观地理解错题正确解答思路的问题,本发明目的在于提供一种自动裁题展示方法、装置、计算机设备及存储介质,可自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,进而可节约对照所需时间,杜绝出现错认对应关系及错误评估测试结果的情况,利于考生快速直观地理解错题的正确解答思路,便于实际应用和推广。
第一方面,本发明提供了一种自动裁题展示方法,包括:
获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复;
将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串;
按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串;
从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号;
针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像;
针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像;
针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像;
按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像。
基于上述发明内容,提供了一种基于不定长文字识别模型实现自动裁题展示的方案,即在获取试卷页图片和与所述试卷页图片对应的答案页图片后,先通过不定长文字识别模型分别对两图片进行文字识别处理,得到输出的对应字符串,然后从两字符串中分别识别出试题序号和答题序号,再然后根据试题序号在所述试卷页图片中的位置确定出对应试题的试题区域,并裁剪得到对应的试题图像,以及根据答题序号在所述答案页图片中的位置确定出对应答案的答案区域,并裁剪得到对应的答案图像,最后根据试题序号与答题序号的匹配关系,绑定试题图像和答案图像,并进行输出展示,从而可自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,进而可节约对照所需时间,杜绝出现错认对应关系及错误评估测试结果的情况,利于考生快速直观地理解错题的正确解答思路,便于实际应用和推广。
在一个可能的设计中,针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,包括:
判断试题序号是否为所述总试题字符串中的最后一个试题序号;
若是,则将在所述试卷页图片中由第一试题起点位置和第一试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第一试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第一试题终点位置为最末试题字符在所述试卷页图片中的位置,所述最末试题字符是指在所述总试题字符串中的最后一个字符;
若否,则将在所述试卷页图片中由第二试题起点位置和第二试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第二试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第二试题终点位置为下一试题序号在所述试卷页图片中的位置,所述下一试题序号是指在所述总试题字符串中位于所述试题序号之后的下一个试题序号。
在一个可能的设计中,针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,包括:
判断答题序号是否为所述总答案字符串中的最后一个答题序号;
若是,则将在所述答案页图片中由第一答案起点位置和第一答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第一答案起点位置为所述答题序号在所述答案页图片中的位置,所述第一答案终点位置为最末答案字符在所述答案页图片中的位置,所述最末答案字符是指在所述总答案字符串中的最后一个字符;
若否,则将在所述答案页图片中由第二答案起点位置和第二答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第二答案起点位置为所述答题序号在所述答案页图片中的位置,所述第二答案终点位置为下一答题序号在所述答案页图片中的位置,所述下一答题序号是指在所述总答案字符串中位于所述答题序号之后的下一个答题序号。
在一个可能的设计中,在从所述总试题字符串中识别出至少一个试题序号之后,所述方法还包括:
针对所述至少一个试题序号中的各个试题序号,判断是否为所述总试题字符串中的最后一个试题序号;
当判定某个试题序号为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中位于所述某个试题序号之后是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题;
当判定某个试题序号不为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中介于所述某个试题序号与在后试题序号之间的字符串区域是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题,其中,所述在后试题序号是指在所述总试题字符串中位于所述某个试题序号之后的下一个试题序号。
在一个可能的设计中,在确定与所述某个试题序号对应的试题为客观题之后,所述方法还包括:
根据在所述总试题字符串中位于所述某个试题序号之后的首个客观题备选项序号在所述试卷页图片中的位置,将与所述某个试题序号对应的试题图像拆分成题干图像和备选项图像;
将在所述至少一个答题序号中与所述某个试题序号匹配的答题序号作为绑定答题序号,然后根据在所述总答案字符串中位于所述绑定答题序号之后的首个考点信息起始字符和首个考点信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出考点信息图像,以及根据在所述总答案字符串中位于所述绑定答题序号之后的首个解答信息起始字符和首个解答信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出解答信息图像;
按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像。
在一个可能的设计中,按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像,包括:
根据在所述总答案字符串中位于所述绑定答题序号之后的首个点评信息起始字符和首个点评信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出点评信息图像;
按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像、所述解答信息图像和所述点评信息图像。
在一个可能的设计中,所述不定长文字识别模型采用基于长短期记忆网络及联接时间分类器LSTM+CTC、卷积循环神经网络CRNN或文字识别项目chineseocr的识别模型。
第二方面,本发明提供了一种自动裁题展示装置,包括有图片获取模块、字符识别模块、字符拼接模块、序号识别模块、试题图像裁剪模块、答案图像裁剪模块、图像绑定模块和输出展示模块;
所述图片获取模块,用于获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复;
所述字符识别模块,通信连接所述图片获取模块,用于将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串;
所述字符拼接模块,通信连接所述字符识别模块,用于按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串;
所述序号识别模块,通信连接所述字符拼接模块,用于从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号;
所述试题图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像;
所述答案图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像;
所述图像绑定模块,分别通信连接所述试题图像裁剪模块和所述答案图像裁剪模块,用于针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像;
所述输出展示模块,通信连接所述图像绑定模块,用于按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像。
第三方面,本发明提供了一种计算机设备,包括有通信相连的存储器和处理器,其中,所述存储器用于存储计算机程序,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意可能设计所述的自动裁题展示方法。
第四方面,本发明提供了一种存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如上第一方面或第一方面中任意可能设计所述的自动裁题展示方法。
第五方面,本发明提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如上第一方面或第一方面中任意可能设计所述的自动裁题展示方法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的自动裁题展示方法的流程示意图。
图2是本发明提供的在自动裁题展示方法中试题字符串的识别结果示例图。
图3是本发明提供的在自动裁题展示方法中主观题的裁剪展示示例图。
图4是本发明提供的在自动裁题展示方法中客观题的裁剪展示示例图。
图5是本发明提供的自动裁题展示装置的结构示意图。
图6是本发明提供的计算机设备的结构示意图。
具体实施方式
下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明虽然是用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明示例的实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。
应当理解,尽管本文可能使用术语第一和第二等等来描述各种对象,但是这些对象不应当受到这些术语的限制。这些术语仅用于区分一个对象和另一个对象。例如可以将第一对象称作第二对象,并且类似地可以将第二对象称作第一对象,同时不脱离本发明的示例实施例的范围。
应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A、单独存在B或者同时存在A和B等三种情况;对于本文中可能出现的术语“/和”,其是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A或者同时存在A和B等两种情况;另外,对于本文中可能出现的字符“/”,一般表示前后关联对象是一种“或”关系。
如图1所示,本实施例第一方面提供的所述自动裁题展示方法,可以但不限于由具有一定计算资源的计算机设备执行,例如由个人计算机(Personal Computer,PC,指一种大小、价格和性能适用于个人使用的多用途计算机;台式机、笔记本电脑到小型笔记本电脑和平板电脑以及超级本等都属于个人计算机)、智能手机、个人数字助理(Personal digitalassistant,PAD)或可穿戴设备等电子设备执行,以便在获取试卷页图片和与所述试卷页图片对应的答案页图片后,可自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,进而可节约对照所需时间,杜绝出现错认对应关系及错误评估测试结果的情况,利于考生快速直观地理解错题的正确解答思路,便于实际应用和推广。如图1所示,所述自动裁题展示方法,可以但不限于包括有如下步骤S1~S8。
S1.获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复。
在所述步骤S1中,所述试卷页图片可以但不限于为考试用试卷页或自测用试卷页的照片或扫描图片;试卷页可以是未作答试卷页,也可以是已作答试卷页;试卷页可以有多张,但需提前按照试题序号从先到后的顺序,依次拼接多张试卷页的图片,得到一张所述试卷页图片,以便确保隔页试题的裁剪完整性。所述答案页图片即为与所述考试用试卷页或所述自测用试卷页对应的参考答案页的照片或扫描图片;答案页也可以有多张,但也需提前按照答题序号从先到后的顺序,依次拼接多张答案页的图片,得到一张所述答案页图片,以便确保隔页答案的裁剪完整性。所述试题序号用于在试卷页上唯一标记对应的试题,如图2所示,各个试题前面的编号即为试题序号;同理所述答题序号用于在答案页上唯一标记对应的答案;针对完整的试卷页和答案页,试题序号与答题序号具有一一对应关系,以便使试题与答案具有一一对应关系。此外,由于所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复,可以保证最后裁剪展示的试题图像与答案图像具有一一对应关系,杜绝出现错认对应关系。
S2.将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串。
在所述步骤S2中,所述不定长文字识别模型是一种专用于不定长文字识别的现有模型;不定长文字识别在现实中大量应用,例如对印刷文字和广告牌文字等进行文字识别,虽然其具有字符数量不固定、不可预知以及识别难度较大等特点,但也是目前研究文字识别的主要方向,使得目前常用的不定长文字识别方法有:长短期记忆网络及联接时间分类器LSTM+CTC(Long Short Term Memory+Connectionist Temporal Classifier,前者是一种特殊结构的循环神经网络Recurrent Neural Networks,用于解决循环神经网络RNN的长期依赖问题,而后者用于解决输入特征与输出标签的对齐问题)、卷积循环神经网络CRNN(Convolutional Recurrent Neural Network,其是目前比较流行的文字识别模型,不需要对样本数据进行字符分割,可识别任意长度的文本序列,具有速度快和性能好的特点)和文字识别项目chinsesocr(其是基于YOLO3和CRNN的自然场景文字识别项目,该项目支持darknet/opencvdnn/keras的文字检测,支持0、90、180和270度的方向检测,支持不定长的英文和中英文识别,同时支持通用光学字符识别OCR、身份证识别和火车票识别等多种场景),等等。因此所述不定长文字识别模型可以但不限于采用基于长短期记忆网络及联接时间分类器LSTM+CTC、卷积循环神经网络CRNN或文字识别项目chineseocr等的识别模型。此外,前述现有识别模型的训练方法也为现有常规方法,使得所述已完成训练的不定长文字识别模型对所述试卷页图片和所述答案页图片具有不定长文字识别能力,可以得到如图2所示的试题字符串。
S3.按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串。
在所述步骤S3中,如图2所示,由于所述不定长文字识别模型是对试题文字和答案文字进行逐行识别的,因此需按照对应的文字行排列顺序进行拼接,得到所述总试题字符串和所述总答案字符串。
S4.从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号。
在所述步骤S4中,如图2所示,由于所述试题序号在所述总试题字符串中为数字且一般会带有诸如“.”等特殊的前/后缀字符,因此可通过常规方式从所述总试题字符串中识别出所述试题序号;同理,可通过常规方式从所述总答案字符串中识别出所述答题序号。
S5.针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像。
在所述步骤S5中,具体的,针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,包括但不限于有如下步骤S51~S53:S51.判断试题序号是否为所述总试题字符串中的最后一个试题序号;S52.若是,则将在所述试卷页图片中由第一试题起点位置和第一试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第一试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第一试题终点位置为最末试题字符在所述试卷页图片中的位置,所述最末试题字符是指在所述总试题字符串中的最后一个字符;S53.若否,则将在所述试卷页图片中由第二试题起点位置和第二试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第二试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第二试题终点位置为下一试题序号在所述试卷页图片中的位置,所述下一试题序号是指在所述总试题字符串中位于所述试题序号之后的下一个试题序号。如图2所示,所述第一试题起点位置即为试题序号“34”的最左侧位置,所述第一试题终点位置即为最末试题字符“2”的最右侧位置,在所述试卷页图片中由所述第一试题起点位置和所述第一试题终点位置限定的页面区域即为介于所述试题序号“34”的最左侧位置与所述最末试题字符“2”的最右侧位置之间的文字行区间(如图2中的虚线所示,包括从左至右和从上至下方向);所述第二试题起点位置即为试题序号“1”的最左侧位置,所述第二试题终点位置即为试题序号“34”的最左侧位置,在所述试卷页图片中由所述第二试题起点位置和所述第二试题终点位置限定的页面区域即为介于所述试题序号“1”的最左侧位置与所述试题序号“34”的最左侧位置之间的文字行区间(如图2中的虚线所示,包括从左至右和从上至下方向)。由此通过前述步骤S51~S53,可以精准确定试题区域,便于后续裁剪得到无其他试题内容的所述试题图像。
S6.针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像。
在所述步骤S6中,具体的,针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,包括但不限于有如下步骤S61~S63:S61.判断答题序号是否为所述总答案字符串中的最后一个答题序号;S62.若是,则将在所述答案页图片中由第一答案起点位置和第一答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第一答案起点位置为所述答题序号在所述答案页图片中的位置,所述第一答案终点位置为最末答案字符在所述答案页图片中的位置,所述最末答案字符是指在所述总答案字符串中的最后一个字符;S63.若否,则将在所述答案页图片中由第二答案起点位置和第二答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第二答案起点位置为所述答题序号在所述答案页图片中的位置,所述第二答案终点位置为下一答题序号在所述答案页图片中的位置,所述下一答题序号是指在所述总答案字符串中位于所述答题序号之后的下一个答题序号。前述第一答案起点位置、第一答案终点位置、第二答案起点位置和第二答案终点位置的细节描述可参见前述步骤S51~S53推导得到,于此不再赘述,使得通过前述步骤S61~S63,也可以精准确定答案区域,便于后续裁剪得到无其他答案内容的所述答案图像。
S7.针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像。
S8.按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像。
在所述步骤S8中,所述上方试题且下方答案的形式可如图3所示,具体答案内容包括但不限于有考点信息(其为可选内容)、分析信息(其为可选内容)、解答信息(其为必选内容)和/或点评信息(其为可选内容,图3未示出)等,不但可以给出正确答案,帮助考试组织者或考生核对测试结果,还把试题及解析思路完整地呈现出来了(相当于将整个试题结构给勾画出来了),可利于考生快速直观地理解错题的正确解答思路。此外,所述具有绑定关系的试题图像和答案图像优选在一个独立的画面中进行展示,以便排除其它试题内容或答案内容的干扰,进一步利于考生快速直观地理解错题的正确解答思路。
由此基于前述步骤S1~S8所描述的自动裁题展示方法,提供了一种基于不定长文字识别模型实现自动裁题展示的方案,即在获取试卷页图片和与所述试卷页图片对应的答案页图片后,先通过不定长文字识别模型分别对两图片进行文字识别处理,得到输出的对应字符串,然后从两字符串中分别识别出试题序号和答题序号,再然后根据试题序号在所述试卷页图片中的位置确定出对应试题的试题区域,并裁剪得到对应的试题图像,以及根据答题序号在所述答案页图片中的位置确定出对应答案的答案区域,并裁剪得到对应的答案图像,最后根据试题序号与答题序号的匹配关系,绑定试题图像和答案图像,并进行输出展示,从而可自动地将试题及对应的答案从各自的页面上裁剪下来,然后组合展示给考试组织者或考生,进而可节约对照所需时间,杜绝出现错认对应关系及错误评估测试结果的情况,利于考生快速直观地理解错题的正确解答思路,便于实际应用和推广。
本实施例在前述第一方面的技术方案基础上,还提供了一种如何识别客观题的可能设计一,即在从所述总试题字符串中识别出至少一个试题序号之后,所述方法还包括但不限于有如下步骤S411~S413。
S411.针对所述至少一个试题序号中的各个试题序号,判断是否为所述总试题字符串中的最后一个试题序号。
S412.当判定某个试题序号为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中位于所述某个试题序号之后是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题。
在所述步骤S412中,所述客观题备选项序号在所述总试题字符串中为诸如“A”、“B”、“C”或“D”等的大写字母且一般会带有诸如“.”等特殊的前/后缀字符,因此也可通过常规方式从所述总试题字符串中识别出所述客观题备选项序号。如图2所示,当所述某个试题序号为试题序号“34”时,由于在所述总试题字符串中位于所述试题序号“34”之后不存在任何客观题备选项序号,因此不可确定对应的试题为客观题,而应确定为主观题,与实际情况相符。
S413.当判定某个试题序号不为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中介于所述某个试题序号与在后试题序号之间的字符串区域是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题,其中,所述在后试题序号是指在所述总试题字符串中位于所述某个试题序号之后的下一个试题序号。
在所述步骤S413中,如图2所示,当所述某个试题序号为试题序号“1”时,所述在后试题序号为试题序号“34”,由于在所述总试题字符串中介于所述试题序号“1”与所述试题序号“34”之间的字符串区域存在四个客观题备选项序号(即“A”、“B”、“C”和“D”等),因此可确定对应的试题为客观题,与实际情况相符。
由此基于前述步骤S411~S413所描述的可能设计一,可以准确识别与各个试题序号对应的试题是否为客观题,以便在展示时进行标记,丰富裁题展示内容,或者进行其它应用。
本实施例在前述可能设计一的技术方案基础上,还提供了一种如何优化裁题展示效果的可能设计二,即在确定与所述某个试题序号对应的试题为客观题之后,所述方法还包括但不限于有如下步骤S414~S416。
S414.根据在所述总试题字符串中位于所述某个试题序号之后的首个客观题备选项序号在所述试卷页图片中的位置,将与所述某个试题序号对应的试题图像拆分成题干图像和备选项图像。
在所述步骤S414中,如图2所示,当所述某个试题序号为试题序号“1”时,可以将所述首个客观题备选项序号(即“A”)在所述试卷页图片中的最左侧位置作为中间拆分点,将与所述试题序号“1”对应的试题图像拆分成题干图像和备选项图像。
S415.将在所述至少一个答题序号中与所述某个试题序号匹配的答题序号作为绑定答题序号,然后根据在所述总答案字符串中位于所述绑定答题序号之后的首个考点信息起始字符和首个考点信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出考点信息图像,以及根据在所述总答案字符串中位于所述绑定答题序号之后的首个解答信息起始字符和首个解答信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出解答信息图像。
在所述步骤S415中,所述考点信息起始字符、所述考点信息末尾字符、所述解答信息起始字符和所述解答信息末尾字符等可类似于所述答题序号,均为特定字符,例如所述考点信息起始字符为“考点”且带有诸如“:”等特殊的前/后缀字符;所述解答信息起始字符为“解答”且带有诸如“:”等特殊的前/后缀字符,等等。同样地,与前述答案图像的区域确定及裁剪方式类似,可以基于起始字符和末尾字符分别在所述答案页图片中的位置,确定出考点信息区域和解答信息区域,并从答案图像中裁剪出所述考点信息图像和所述解答信息图像。
S416.按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像。
在所述步骤S416中,如图4所示,由于考生的阅读习惯是从左至右且从上至下,因此通过前述方式布置图像,可以使考生先阅读题干,然后回顾考点,再判断各备选项是否可选,最后验证选择结果是否正确,如此可优化裁题展示效果,进一步利于考生快速直观地理解错题的正确解答思路。
进一步优化的,按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像,包括但不限于有:先根据在所述总答案字符串中位于所述绑定答题序号之后的首个点评信息起始字符和首个点评信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出点评信息图像;按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像、所述解答信息图像和所述点评信息图像。前述点评信息起始字符、点评信息末尾字符及点评信息图像的详细描述可参见前述步骤S415,于此不再赘述,例如所述点评信息起始字符为“点评”且带有诸如“:”等特殊的前/后缀字符。如图4所示,通过前述方式布置图像,可进一步优化裁题展示效果,并进一步利于考生快速直观地理解错题的正确解答思路。
由此基于前述步骤S414~S416所描述的可能设计二,可针对客观题,先分别裁剪得到对应的题干图像、备选项图像、考点信息图像和解答信息图像,然后按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像,使考生可先阅读题干,然后回顾考点,再判断各备选项是否可选,最后验证选择结果是否正确,进而可优化裁题展示效果,进一步利于考生快速直观地理解错题的正确解答思路。
如图5所示,本实施例第二方面提供了一种实现第一方面或第一方面中任一可能设计所述的自动裁题展示方法的虚拟装置,包括有图片获取模块、字符识别模块、字符拼接模块、序号识别模块、试题图像裁剪模块、答案图像裁剪模块、图像绑定模块和输出展示模块;
所述图片获取模块,用于获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复;
所述字符识别模块,通信连接所述图片获取模块,用于将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串;
所述字符拼接模块,通信连接所述字符识别模块,用于按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串;
所述序号识别模块,通信连接所述字符拼接模块,用于从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号;
所述试题图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像;
所述答案图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像;
所述图像绑定模块,分别通信连接所述试题图像裁剪模块和所述答案图像裁剪模块,用于针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像;
所述输出展示模块,通信连接所述图像绑定模块,用于按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像。
本实施例第二方面提供的前述装置的工作过程、工作细节和技术效果,可以参见第一方面或第一方面中任一可能设计所述的自动裁题展示方法,于此不再赘述。
如图6所示,本实施例第三方面提供了一种执行第一方面所述自动裁题展示方法的计算机设备,包括有通信相连的存储器和处理器,其中,所述存储器用于存储计算机程序,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任一可能设计所述的自动裁题展示方法。具体举例的,所述存储器可以但不限于包括随机存取存储器(Random-Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、闪存(FlashMemory)、先进先出存储器(First Input First Output,FIFO)和/或先进后出存储器(First Input Last Output,FILO)等等;所述处理器可以但不限于采用型号为STM32F105系列的微处理器。此外,所述计算机设备还可以但不限于包括有电源模块、显示屏和其它必要的部件。
本实施例第三方面提供的前述计算机设备的工作过程、工作细节和技术效果,可以参见第一方面或第一方面中任一可能设计所述的自动裁题展示方法,于此不再赘述。
本实施例第四方面提供了一种存储包含第一方面所述自动裁题展示方法的指令的存储介质,即所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任一可能设计所述的自动裁题展示方法。其中,所述存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等计算机可读存储介质,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
本实施例第四方面提供的前述存储介质的工作过程、工作细节和技术效果,可以参见第一方面或第一方面中任一可能设计所述的自动裁题展示方法,于此不再赘述。
本实施例第五方面提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如第一方面或第一方面中任一可能设计所述的自动裁题展示方法。其中,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
最后应说明的是,本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。
Claims (10)
1.一种自动裁题展示方法,其特征在于,包括:
获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复,所述试卷页图片为已作答试卷页的照片或扫描图片,所述答案页图片为参考答案页的照片或扫描图片;
将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串;
按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串;
从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号;
针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像,其中,针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,具体包括:判断试题序号是否为所述总试题字符串中的最后一个试题序号;若是,则将在所述试卷页图片中由第一试题起点位置和第一试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第一试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第一试题终点位置为最末试题字符在所述试卷页图片中的位置,所述最末试题字符是指在所述总试题字符串中的最后一个字符;
针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像,其中,针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,具体包括:判断答题序号是否为所述总答案字符串中的最后一个答题序号;若是,则将在所述答案页图片中由第一答案起点位置和第一答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第一答案起点位置为所述答题序号在所述答案页图片中的位置,所述第一答案终点位置为最末答案字符在所述答案页图片中的位置,所述最末答案字符是指在所述总答案字符串中的最后一个字符;
针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像;
按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像,其中,所述具有绑定关系的试题图像和答案图像在一个独立的画面中进行展示。
2.如权利要求1所述的自动裁题展示方法,其特征在于,针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,还包括:
若判定试题序号不为所述总试题字符串中的最后一个试题序号,则将在所述试卷页图片中由第二试题起点位置和第二试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第二试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第二试题终点位置为下一试题序号在所述试卷页图片中的位置,所述下一试题序号是指在所述总试题字符串中位于所述试题序号之后的下一个试题序号。
3.如权利要求1所述的自动裁题展示方法,其特征在于,针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,还包括:
若判定答题序号不为所述总答案字符串中的最后一个答题序号,则将在所述答案页图片中由第二答案起点位置和第二答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第二答案起点位置为所述答题序号在所述答案页图片中的位置,所述第二答案终点位置为下一答题序号在所述答案页图片中的位置,所述下一答题序号是指在所述总答案字符串中位于所述答题序号之后的下一个答题序号。
4.如权利要求1所述的自动裁题展示方法,其特征在于,在从所述总试题字符串中识别出至少一个试题序号之后,所述方法还包括:
针对所述至少一个试题序号中的各个试题序号,判断是否为所述总试题字符串中的最后一个试题序号;
当判定某个试题序号为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中位于所述某个试题序号之后是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题;
当判定某个试题序号不为所述总试题字符串中的最后一个试题序号时,判断在所述总试题字符串中介于所述某个试题序号与在后试题序号之间的字符串区域是否存在至少一个客观题备选项序号,若是,则确定与所述某个试题序号对应的试题为客观题,其中,所述在后试题序号是指在所述总试题字符串中位于所述某个试题序号之后的下一个试题序号。
5.如权利要求4所述的自动裁题展示方法,其特征在于,在确定与所述某个试题序号对应的试题为客观题之后,所述方法还包括:
根据在所述总试题字符串中位于所述某个试题序号之后的首个客观题备选项序号在所述试卷页图片中的位置,将与所述某个试题序号对应的试题图像拆分成题干图像和备选项图像;
将在所述至少一个答题序号中与所述某个试题序号匹配的答题序号作为绑定答题序号,然后根据在所述总答案字符串中位于所述绑定答题序号之后的首个考点信息起始字符和首个考点信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出考点信息图像,以及根据在所述总答案字符串中位于所述绑定答题序号之后的首个解答信息起始字符和首个解答信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出解答信息图像;
按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像。
6.如权利要求5所述的自动裁题展示方法,其特征在于,按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像和所述解答信息图像,包括:
根据在所述总答案字符串中位于所述绑定答题序号之后的首个点评信息起始字符和首个点评信息末尾字符分别在所述答案页图片中的位置,从与所述绑定答题序号对应的答案图像中裁剪出点评信息图像;
按照从上至下的顺序,依次展示所述题干图像、所述考点信息图像、所述备选项图像、所述解答信息图像和所述点评信息图像。
7.如权利要求1所述的方法,其特征在于,所述不定长文字识别模型采用基于长短期记忆网络及联接时间分类器LSTM+CTC、卷积循环神经网络CRNN或文字识别项目chineseocr的识别模型。
8.一种自动裁题展示装置,其特征在于,包括有图片获取模块、字符识别模块、字符拼接模块、序号识别模块、试题图像裁剪模块、答案图像裁剪模块、图像绑定模块和输出展示模块;
所述图片获取模块,用于获取试卷页图片和与所述试卷页图片对应的答案页图片,其中,所述试卷页图片中的任意两试题序号和所述答案页图片中的任意两答题序号分别不重复,所述试卷页图片为已作答试卷页的照片或扫描图片,所述答案页图片为参考答案页的照片或扫描图片;
所述字符识别模块,通信连接所述图片获取模块,用于将所述试卷页图片和所述答案页图片分别导入已完成训练的不定长文字识别模型中,得到输出的且与所述试卷页图片中至少一行试题文字一一对应的至少一条试题字符串和与所述答案页图片中至少一行答案文字一一对应的至少一条答案字符串;
所述字符拼接模块,通信连接所述字符识别模块,用于按照所述至少一行试题文字在所述试卷页图片中的从上至下排列顺序,对所述至少一条试题字符串进行依次拼接,得到总试题字符串,以及按照所述至少一行答案文字在所述答案页图片中的从上至下排列顺序,对所述至少一条答案字符串进行依次拼接,得到总答案字符串;
所述序号识别模块,通信连接所述字符拼接模块,用于从所述总试题字符串中识别出至少一个试题序号,以及从所述总答案字符串中识别出至少一个答题序号;
所述试题图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,并根据所述试题区域对所述试卷页图片进行裁剪处理,得到对应的试题图像,其中,针对所述至少一个试题序号中的各个试题序号,根据在所述试卷页图片中的对应位置确定对应试题在所述试卷页图片中的试题区域,具体包括:判断试题序号是否为所述总试题字符串中的最后一个试题序号;若是,则将在所述试卷页图片中由第一试题起点位置和第一试题终点位置限定的页面区域作为与所述试题序号对应的试题区域,其中,所述第一试题起点位置为所述试题序号在所述试卷页图片中的位置,所述第一试题终点位置为最末试题字符在所述试卷页图片中的位置,所述最末试题字符是指在所述总试题字符串中的最后一个字符;
所述答案图像裁剪模块,分别通信连接所述图片获取模块和所述序号识别模块,用于针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,并根据所述答案区域对所述答案页图片进行裁剪处理,得到对应的答案图像,其中,针对所述至少一个答题序号中的各个答题序号,根据在所述答案页图片中的对应位置确定对应答案在所述答案页图片中的答案区域,具体包括:判断答题序号是否为所述总答案字符串中的最后一个答题序号;若是,则将在所述答案页图片中由第一答案起点位置和第一答案终点位置限定的页面区域作为与所述答题序号对应的答案区域,其中,所述第一答案起点位置为所述答题序号在所述答案页图片中的位置,所述第一答案终点位置为最末答案字符在所述答案页图片中的位置,所述最末答案字符是指在所述总答案字符串中的最后一个字符;
所述图像绑定模块,分别通信连接所述试题图像裁剪模块和所述答案图像裁剪模块,用于针对具有匹配关系的试题序号和答题序号,绑定与所述试题序号对应的试题图像和与所述答题序号对应的答案图像;
所述输出展示模块,通信连接所述图像绑定模块,用于按照上方试题且下方答案的形式,输出展示具有绑定关系的试题图像和答案图像,其中,所述具有绑定关系的试题图像和答案图像在一个独立的画面中进行展示。
9.一种计算机设备,其特征在于,包括有通信相连的存储器和处理器,其中,所述存储器用于存储计算机程序,所述处理器用于读取所述计算机程序,执行如权利要求1~7中任意一项所述的自动裁题展示方法。
10.一种存储介质,其特征在于,所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~7中任意一项所述的自动裁题展示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028482.8A CN113723543B (zh) | 2021-09-02 | 2021-09-02 | 一种自动裁题展示方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028482.8A CN113723543B (zh) | 2021-09-02 | 2021-09-02 | 一种自动裁题展示方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113723543A CN113723543A (zh) | 2021-11-30 |
CN113723543B true CN113723543B (zh) | 2024-01-09 |
Family
ID=78681211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111028482.8A Active CN113723543B (zh) | 2021-09-02 | 2021-09-02 | 一种自动裁题展示方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723543B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08186672A (ja) * | 1994-12-30 | 1996-07-16 | Ricoh Co Ltd | 採点及び問題用紙登録機能を有するデジタル複写機 |
JP2010152480A (ja) * | 2008-12-24 | 2010-07-08 | Int:Kk | デジタル採点システム |
CN102436547A (zh) * | 2011-10-24 | 2012-05-02 | 北京商纳科技有限公司 | 一种教学用错题统计方法及系统 |
CN103886302A (zh) * | 2014-03-28 | 2014-06-25 | 上海携培信息科技有限公司 | 试卷识别分析实现方法及装置 |
CN106294717A (zh) * | 2016-08-08 | 2017-01-04 | 广东小天才科技有限公司 | 基于智能终端的搜题方法及装置 |
CN107463681A (zh) * | 2017-08-08 | 2017-12-12 | 广东小天才科技有限公司 | 一种待搜题目的识别方法及装置 |
CN108416352A (zh) * | 2018-03-23 | 2018-08-17 | 李文 | 一种计算机网络阅卷系统及阅卷方法 |
WO2019075820A1 (zh) * | 2017-10-20 | 2019-04-25 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
KR20190052410A (ko) * | 2017-11-08 | 2019-05-16 | 강성욱 | 답안 일체형 시험지 및 답안 일체형 교재를 이용하는 자동 채점 시스템 및 그 방법 |
CN109817046A (zh) * | 2019-01-23 | 2019-05-28 | 广东小天才科技有限公司 | 一种基于家教设备的学习辅助方法及家教设备 |
CN110210309A (zh) * | 2019-04-30 | 2019-09-06 | 宜春宜联科技有限公司 | 错题识别方法、系统、可读存储介质及设备 |
CN111950557A (zh) * | 2020-08-21 | 2020-11-17 | 珠海奔图电子有限公司 | 错题处理方法、图像形成装置及电子设备 |
CN113076872A (zh) * | 2021-04-01 | 2021-07-06 | 杭州云梯科技有限公司 | 一种智能试卷批改方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348400B (zh) * | 2019-07-15 | 2022-04-19 | 京东方科技集团股份有限公司 | 一种评分获取方法、装置及电子设备 |
-
2021
- 2021-09-02 CN CN202111028482.8A patent/CN113723543B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08186672A (ja) * | 1994-12-30 | 1996-07-16 | Ricoh Co Ltd | 採点及び問題用紙登録機能を有するデジタル複写機 |
JP2010152480A (ja) * | 2008-12-24 | 2010-07-08 | Int:Kk | デジタル採点システム |
CN102436547A (zh) * | 2011-10-24 | 2012-05-02 | 北京商纳科技有限公司 | 一种教学用错题统计方法及系统 |
CN103886302A (zh) * | 2014-03-28 | 2014-06-25 | 上海携培信息科技有限公司 | 试卷识别分析实现方法及装置 |
CN106294717A (zh) * | 2016-08-08 | 2017-01-04 | 广东小天才科技有限公司 | 基于智能终端的搜题方法及装置 |
CN107463681A (zh) * | 2017-08-08 | 2017-12-12 | 广东小天才科技有限公司 | 一种待搜题目的识别方法及装置 |
WO2019075820A1 (zh) * | 2017-10-20 | 2019-04-25 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
KR20190052410A (ko) * | 2017-11-08 | 2019-05-16 | 강성욱 | 답안 일체형 시험지 및 답안 일체형 교재를 이용하는 자동 채점 시스템 및 그 방법 |
CN108416352A (zh) * | 2018-03-23 | 2018-08-17 | 李文 | 一种计算机网络阅卷系统及阅卷方法 |
CN109817046A (zh) * | 2019-01-23 | 2019-05-28 | 广东小天才科技有限公司 | 一种基于家教设备的学习辅助方法及家教设备 |
CN110210309A (zh) * | 2019-04-30 | 2019-09-06 | 宜春宜联科技有限公司 | 错题识别方法、系统、可读存储介质及设备 |
CN111950557A (zh) * | 2020-08-21 | 2020-11-17 | 珠海奔图电子有限公司 | 错题处理方法、图像形成装置及电子设备 |
CN113076872A (zh) * | 2021-04-01 | 2021-07-06 | 杭州云梯科技有限公司 | 一种智能试卷批改方法 |
Non-Patent Citations (1)
Title |
---|
考试系统中WORD文档的图片类对象自动阅卷的实现;邢薇;王鑫;王艳;王立志;;信息技术(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113723543A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348400B (zh) | 一种评分获取方法、装置及电子设备 | |
US20200286402A1 (en) | Method and system for assisting with math problem | |
WO2016104965A1 (ko) | 학습 평가 서비스 시스템 | |
CN110781648A (zh) | 一种基于深度学习的试卷自动转录系统及方法 | |
CN110909035A (zh) | 个性化复习题集生成方法、装置、电子设备及存储介质 | |
CN109710750A (zh) | 一种搜题方法及学习设备 | |
CN110750624A (zh) | 信息输出方法及装置 | |
KR20190052410A (ko) | 답안 일체형 시험지 및 답안 일체형 교재를 이용하는 자동 채점 시스템 및 그 방법 | |
CN110879965A (zh) | 试卷客观题的自动批阅方法、电子装置、设备及存储介质 | |
US20170124039A1 (en) | Digital note creation | |
CN112002164A (zh) | 作业辅导方法及装置、智能台灯、计算机可读存储介质 | |
CN111027537A (zh) | 一种搜题方法及电子设备 | |
CN111126486A (zh) | 一种测验统计方法、装置、设备及存储介质 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN110609833A (zh) | 一种书本页码的识别方法、装置、家教机及存储介质 | |
TWM546586U (zh) | 試卷的命題及閱卷系統 | |
CN112396897A (zh) | 一种教学系统 | |
CN113723543B (zh) | 一种自动裁题展示方法、装置、计算机设备及存储介质 | |
CN111090791B (zh) | 一种基于双屏的内容查询方法及电子设备 | |
CN112164262A (zh) | 一种智能阅卷辅导系统 | |
CN210348859U (zh) | 一种试卷批改一体机 | |
CN114663891A (zh) | 基于配置答题卡的日常作业错题本生成方法和系统 | |
CN110443732A (zh) | 作业统分方法、装置、设备和介质 | |
CN110851349A (zh) | 页面异常显示的检测方法、终端设备及存储介质 | |
CN111046863B (zh) | 数据处理方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |