CN104268603B - 用于文字性客观题的智能阅卷方法及系统 - Google Patents

用于文字性客观题的智能阅卷方法及系统 Download PDF

Info

Publication number
CN104268603B
CN104268603B CN201410472818.3A CN201410472818A CN104268603B CN 104268603 B CN104268603 B CN 104268603B CN 201410472818 A CN201410472818 A CN 201410472818A CN 104268603 B CN104268603 B CN 104268603B
Authority
CN
China
Prior art keywords
answer
words
character
result
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410472818.3A
Other languages
English (en)
Other versions
CN104268603A (zh
Inventor
胡雨隆
张银田
竺博
魏思
胡国平
胡郁
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201410472818.3A priority Critical patent/CN104268603B/zh
Publication of CN104268603A publication Critical patent/CN104268603A/zh
Priority to US15/511,541 priority patent/US10339428B2/en
Priority to AU2015318386A priority patent/AU2015318386B2/en
Priority to PCT/CN2015/086585 priority patent/WO2016041423A1/zh
Priority to JP2017515834A priority patent/JP6484333B2/ja
Priority to SG11201701719QA priority patent/SG11201701719QA/en
Priority to KR1020177006871A priority patent/KR101877693B1/ko
Application granted granted Critical
Publication of CN104268603B publication Critical patent/CN104268603B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Abstract

本发明公开了一种用于文字性客观题的智能阅卷方法及系统,该方法包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。利用本发明,可以实现文字性客观题的自动阅卷,减少人力资源消耗,提高阅卷效率及准确性。

Description

用于文字性客观题的智能阅卷方法及系统
技术领域
本发明涉及信息处理技术领域,具体涉及一种用于文字性客观题的智能阅卷方法及系统。
背景技术
随着计算机技术和教育信息化的不断推进,计算机和人工智能技术已经逐步应用于日常的教育教学各项活动中,在教学辅助、教学评测等实际应用场景下都得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试,在此状况下,教师背负着很大的批改作业和试卷的工作压力。针对这种现象,在大中型或重要性高的考试或测试中已经逐渐推广和采用了各类自动阅卷系统,这类系统能够一定程度上减轻教师阅卷的工作量。
然而,在现有的自动阅卷系统中,完全由计算机完成阅卷的部分多是对填涂性客观题(如选择题)的阅卷,而对于像填空题等文字性客观试题的阅卷,现今仍需要大量的教师集中进行,且在大型考试阅卷前还需要对阅卷老师进行集中培训、考试。因此,传统的自动阅卷系统人力资源消耗仍然较大,且在阅卷时因不同教师风格、情绪、心理状态等主观性因素可能造成判卷结果出现不公平不公正的现象。
发明内容
本发明实施例提供一种用于文字性客观题的智能阅卷方法及系统,以实现文字性客观题的自动阅卷,减少人力资源消耗,提高阅卷效率及准确性。
为此,本发明实施例提供如下技术方案:
一种用于文字性客观题的智能阅卷方法,包括:
获取文字性客观题答案图像;
对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;
判断是否有字数与标准答案字数相同的切分结果;
如果没有,则确定答案错误;
否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;
根据计算得到的识别置信度确定答案是否正确。
优选地,所述获取文字性客观题答案图像包括:
获取答题卡图像;
根据答题卡布局信息,分割并提取目标答题区域;
从所述目标答题区域提取文字性客观题答案图像。
优选地,所述获取答题卡图像包括:
利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。
优选地,所述对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果包括:
对所述答案图像进行细切分,得到多个细切分子块;
对所述细切分子块进行合并,并计算合并可信度;
根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。
优选地,所述计算合并可信度包括:
提取合并得到的字符的字符特征;
利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
优选地,所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
选取识别结果中解码路径与标准答案一致的路径的似然得分;
计算所述路径的后验得分,并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度;
相应地,所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值,则确定答案正确;否则确定答案错误。
优选地,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;
选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;
计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;
相应地,所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。
优选地,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;
相应地,所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值,则确定答案正确;否则确定答案错误。
一种用于文字性客观题的智能阅卷系统,包括:
图像获取模块,用于获取文字性客观题答案图像;
切分模块,用于对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;
第一判断模块,用于判断是否有字数与标准答案字数相同的切分结果,并在判断结果为没有与标准答案字数相同的切分结果时,触发输出模块输出答案错误的指示信息;否则,触发计算模块进行识别置信度计算;;
所述计算模块包括:第一计算模块、和/或第二计算模块;所述第一计算模块用于计算所述字数与标准答案字数相同的切分结果的识别置信度,所述第二计算模块用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;
第二判断模块,用于根据所述计算模块计算得到的识别置信度确定答案是否正确,并在判断答案正确时,触发所述输出模块输出答案正确的指示信息;在判断答案错误时,触发所述输出模块输出答案错误的指示信息。
优选地,所述图像获取模块包括:
图像获取单元,用于获取答题卡图像;
答题区域提取单元,用于根据答题卡布局信息,分割并提取目标答题区域;
答案内容提取单元,从所述目标答题区域提取文字性客观题答案图像。
优选地,所述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。
优选地,所述切分模块包括:
切分单元,用于对所述答案图像进行细切分,得到多个细切分子块;
可信度计算单元,用于对所述细切分子块进行合并,并计算合并可信度;
合并结果确定单元,用于根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。
优选地,所述可信度计算单元包括:
合并子单元,用于对所述细切分子块进行合并;
提取子单元,用于提取合并得到的字符的字符特征;
计算子单元,用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
优选地,所述第一计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
第一选择单元,用于选取识别结果中解码路径与标准答案一致的路径的似然得分;
第一计算单元,用于计算所述路径的后验得分,并将所述后验得分作为所述切分结果的识别置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时,判断答案正确;否则判断答案错误。
优选地,所述第二计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第二识别单元,用于基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;
第二选择单元,用于选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;
第二计算单元,用于计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值时,判断答案正确;否则判断答案错误。
优选地,所述第二计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
第三计算单元,用于计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述字数与标准答案字数相同的切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值时,判断答案正确;否则判断答案错误。
本发明实施例提供的用于文字性客观题的智能阅卷方法及系统,对已知标准答案的文字性客观题,利用答案的先验信息辅助进行手写字符串的识别,从而完成文字性客观题的自动阅卷,解决了传统自动阅卷系统因不能应用计算机完全自动进行文字性客观题阅卷,而采用人工阅卷带来的人力资源消耗大、教师工作压力大、因教师主观因素导致的判卷结果不准确等问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例用于文字性客观题的智能阅卷方法的流程图;
图2是本发明实施例中答案图像切分示例;
图3是本发明实施例中对答案图像进行切分的流程图;
图4是本发明实施例中计算识别置信度的一种流程图;
图5是本发明实施例中计算识别置信度的另一种流程图;;
图6是本发明实施例中计算识别置信度的另一种流程图;;
图7是本发明实施例用于文字性客观题的智能阅卷系统的结构示意图;
图8是本发明实施例中第一计算模块的结构框图;
图9是本发明实施例中第二计算模块的一种结构框图;
图10是本发明实施例中第二计算模块的另一种结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例用于文字性客观题的智能阅卷方法及系统,,针对具有标准答案的文字性试题(比如填空题)的考卷,利用标准答案的先验信息辅助进行手写字符串的识别,从而完成文字性客观题的自动阅卷。
如图1所示,是本发明实施例用于文字性客观题的智能阅卷方法的流程图,包括以下步骤:
步骤101,获取文字性客观题答案图像。
所述文字性客观题答案图像即为答案字符串图像,在本发明实施例中,所述答案字符串可以是中文字串、英文字串等。
获取答案图像的具体过程如下:
(1)获取答题卡图像。
答题卡图像的获取可以采用光标阅读设备进行扫描,或者采用高拍仪、移动终端等设备进行拍照获取。
(2)根据答题卡布局信息,分割并提取目标答题区域。
在实际应用中,在分割提取目标答题区域之前,可以先对答题卡图像进行预处理,以提取到准确的目标答题区域。所述预处理可以包括:对答题卡图像进行定位、校准、降噪、对比度增强、灰度化等操作,具体处理方法与现有的自动阅卷系统中答题卡图像预处理方法相同,在此不再赘述。
答题卡布局信息是已知的先验信息,如果需要对答题卡图像进行定位,则还可获得答题卡图像的定位信息,根据这些信息,再通过边缘检测即可准确地分割并提取目标答题区域。
(3)从所述目标答题区域提取文字性客观题答案图像。
在得到目标答题区域后,根据答题卡布局信息,再通过边缘点检测即可得到答案图像,该答案图像是答案字符串的图像。
步骤102,对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果。
具体切分过程将在后面详细说明。
另外,需要说明的是,在实际应用中,在对所述答案图像进行切分之前,还可以对答案图像进行预处理,以得到更准确的切分结果。所述预处理可以包括:对答案图像进行二值化处理、矫正手写笔迹倾斜、笔迹细化等。
步骤103,判断是否有字数与标准答案字数相同的切分结果。如果有,则执行步骤104;否则,执行步骤106。
由于会有多种不同的合并结果,因此在步骤102得到的多个切分结果的字数也会有所不同,而与标准答案字数相同的切分结果是最有可能正确的答案。由于本发明方案所针对的是具有标准答案的文字性客观试题,,因此,如果字数不同,即可确定答案是错误的。如果切分结果的字数与标准答案的字数相同,则需要进一步来判断该答案是否正确。
步骤104,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度。
步骤105,根据计算得到的识别置信度确定答案是否正确。
识别置信度的计算方式可以有多种,相应地,根据不同计算方式得到的识别置信度来确定答案是否正确也有相应的判断,具体将在后面详细说明。
步骤106,确定答案错误。
本发明实施例提供的用于文字性客观题的智能阅卷方法,,对已知标准答案的文字性客观题,利用答案的先验信息辅助进行手写字符串的识别,从而完成文字性客观题的自动阅卷,解决了传统自动阅卷系统因不能应用计算机完全自动进行文字性客观题阅卷,而采用人工阅卷带来的人力资源消耗大、教师工作压力大、因教师主观因素导致的判卷结果不准确等问题。
如图3所示,是本发明实施例中对答案图像进行切分的流程图,包括以下步骤:
步骤301,对答案图像进行细切分,得到多个细切分子块。
比如,从答案图像的最左上端的黑像素点开始进行8邻域黑色扩展,从而将整幅图像划分成几个由黑色像素组成的连通子区域,如图3所示是一个切分示例,可以看到通过将黑色笔迹部分进行连通域的分割后,原来的一个字符串图像被切分成了几个片段,这些片段都是组成单字的部件,依书写方式不同可能是偏旁部首也可能是单一笔迹部分,这些片段进行组合后就会组成不同的字符。
步骤302,对所述细切分子块进行合并,并计算合并可信度。
比如,可以对细切分子块进行穷举性合并,即将所有可能的合并都一一进行,比如有5个细切分子块,有以下几种合并:
(1)假设为一个字符,则将细切分子块1、2、3、4、5进行合并;
(2)假设为二个字符,则将细切分子块1、2、3、4进行合并;将细切分子块1、2、3合并、并将细切分子块4、5合并;将细切分子块1、2合并、并将细切分子块3、4、5合并;将细切分子块2、3、4、5合并;
依此类推,一直假设到为五个字符。
所述合并可信度代表了合并后得到的字符的准确度,具体地,可以提取出合并后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征,根据系统预先训练的规则统计模型得到似然得分,将该得分作为当前合并结果的可信度。
所述规则统计模型是根据提取出的训练数据切分后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征,训练出的统计模型,该模型可以是GMM(Gaussian MixtureModel,高斯混合模型)或SVM(Support Vector Machine,支持向量机)等。
合并可信度的计算,即计算合并结果所提取的特征通过规则统计模型计算出的似然得分(即合并得分),并根据该得分确定合并可信度,也可以直接将该得分作为对应的合并可信度。
步骤303,根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。
具体地,如果可信度大于设定的阈值,则认为该合并是可信的,否则认为该合并是不可信的。进而根据可信的合并结果得到一个或多个待识别答案字符串。
需要说明的是,在实际应用中,在合并前或在判断合并可信度时,还可以根据经验或实验设定一些判断规则,比如一个汉字的笔迹不超过3个细切分子块等,以进一步辅助或指导完成字符串切分结果是否正确的判断,提高判断的准确性。
在本发明实施例中,需要计算字数与标准答案字数相同的各切分结果的识别置信度,和/或计算字数与标准答案字数相同的各切分结果中每个字符的识别置信度,并根据计算得到的识别置信度确定答案是否正确。在实际应用中,可以有多种计算及判断方法,下面将分别加以说明。
如图4所示,是本发明实施例中计算识别置信度的一种流程图。在该实施例中,需要计算各切分结果的识别似然得分,然后根据该识别似然得分计算该切分结果的识别置信度。
针对每个字数与标准答案字数相同的切分结果,计算其识别置信度的具体过程包括以下步骤:
步骤401,将切分结果与标准答案的文本字串对齐。
也就是说,将切分结果中的各切分片段(每个切分片段代表了一个字符)顺序与标准答案的文本字串中的各字符一一对齐。
步骤402,基于全字符集的声学模型及通用的语言模型,对所述切分结果进行手写解码识别,得到各识别结果的似然得分。
所述语言模型可以是N-Gram模型,具体计算公式为:
其中,p(X,Wk)表示切分结果整句X的第k个识别结果的似然得分;M为切分结果中切分片段总数;K为整句识别结果数;p(xi|wki)表示第i个切分片段xi被识别为路径Wk中第i个字符wki的似然得分;表示给定1至i-1识别结果后识别为wki的先验。
步骤403,选取识别结果中解码路径与标准答案一致的路径的似然得分。
步骤404,计算所述路径的后验得分,并将所述后验得分作为所述切分结果的识别置信度。
具体地,首先选取识别解码路径与标准答案一致的路径似然得分,再计算切分结果整句识别置信度,计算公式如下:
其中,Wy表示与标准答案一致的识别解码路径,p(xi|wyi)表示第i个切分片段xi被识别为与标准答案一致路径Wy中第i个字符wyi的似然得分;表示给定1至i-1识别结果后识别为与标准答案一致的wyi的先验;K的取值可以是所有识别结果数。进一步地,为了减少计算量,K也可以适当选取一个较小的值,如50,该值的选取可以根据经验或实验结果来确定。
相应地,依据上述方法得到各切分结果的识别置信度后,确定答案是否正确的判断如下:如果有任一切分结果的识别置信度大于第一置信度阈值,则确定答案正确;否则确定答案错误。
比如,标准答案文本是“黄河入海流”,对于待识别字符串的切分结果,经过声学与语言模型,假设有3个识别结果,分别为“黄河入海流”、“黄河人海流”、“黄河入洋流”,其对应的似然得分分别为90、54、36,则其相应的识别结果后验得分分别为0.5、0.3、0.2。在识别置信度判断时,即判断识别结果为与标准答案一致的“黄河入海流”的后验得分(即0.5)是否大于第一置信度阈值。
如图5所示,是本发明实施例中计算识别置信度的一种流程图。在该实施例中,需要分别计算各切分结果中每个字符的识别置信度。
针对每个字数与标准答案字数相同的切分结果,计算其中各字符识别置信度的具体过程包括以下步骤:
步骤501,将切分结果与标准答案的文本字串对齐。
也就是说,将切分结果中的各切分片段(每个切分片段代表了一个字符)顺序与标准答案的文本字串中的各字符一一对齐。如标准答案为“上海”,则将切分结果中的第一个切分片段对应到“上”,将切分结果中的第二个切分片段对应到“海”。
步骤502,基于全字符集的声学模型,计算所述切分结果中各字符的识别结果的似然得分p(xi|wj)。
其中,xi表示第i(i=1,2,...,M)个切分片段,M为切分结果中切分片段总数;wj表示第i个切分片段经过声学模型被识别为Wj(j=1,2,...,N)的字符,N为识别结果个数。
需要说明的是,在实际计算中,为了减少计算量,N的取值可以适当减小,比如取为50。
步骤503,选取所述识别结果中与标准答案一致的字符的识别结果的似然得分。
步骤504,计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度。
具体地,选取切分片段识别结果中与标准答案一致的字符的识别结果似然得分,再计算选取的该识别结果的后验概率,作为该切分片段(即字符)的识别置信度,其计算公式如下:
其中,p(wyi|xi)表示第i个切分片段xi被识别为与标准答案一致路径Wy中第i个字符wyi的后验得分。
相应地,依据上述得到的各切分结果中各字符的识别置信度,确定答案是否正确的判断如下:
如果有任一切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。
如图6所示,是本发明实施例中计算识别置信度的一种流程图。在该实施例中,同样需要分别计算各切分结果中各字符的识别置信度,但计算方法与图5所示实施例有所不同,具体包括以下步骤:
步骤601,将切分结果与标准答案的文本字串对齐。
步骤602,基于全字符集的声学模型及通用的语言模型,对所述切分结果进行手写解码识别,得到各识别结果的似然得分。
具体计算公式参见上述公式(1)。
步骤603,计算各识别结果的后验概率。
具体计算公式如下:
其中,p(Wk|X)表示第k个识别结果的后验概率,其它参数与前面提到的相应参数表示的含义相同。
步骤604,根据各识别结果的后验概率,针对所述切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度。
具体计算公式如下:
其中,p(wyi|X)表示各识别结果中字符i的识别结果与标准答案一致的后验概率;其它参数与前面提到的相应参数表示的含义相同。K的取值可以是所有识别结果数。进一步地,为了减少计算量,K也可以适当选取一个较小的值,如50,该值的选取可以经验或实验结果来确定。
例如,标准答案文本为“黄河入海流”,为了方便说明,假设通过手写识别得到三个识别结果(即K的值选为3),这三个识别结果分别为:似然得分为0.5的第一识别结果“黄河入海流”,似然得分为0.3的第二识别结果“黄河人海流”,似然得分为0.2的第三识别结果“黄河入洋流”。在这种情况下“黄”、“河”、“流”三个字的得分(即后验概率得分)为0.5+0.3+0.2=1.0,“入”的得分为0.5+0.2=0.7,“海”的得分为0.5+0.3=0.8。
相应地,依据上述方法得到的各切分结果中每个字符的识别置信度,确定答案是否正确的判断如下:
如果有任一切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。
需要说明的是,前面提到的第一置信度阈值、第二置信度阈值、以及第三置信度阈值可以相同,也可以不同,对此本发明实施例不做限定。而且,在实际应用中,上述三种方案还可以任意组合。如采用其中两种方案,则答案正误的判断可以根据这两种方案中的判断条件是否都满足来确定,,如果都满足,则判断答案正确,否则判断答案错误。如果采用其中三种方案,则可以是这三种方案中的判断条件都满足,或者是其中任意两个方案中的判断条件满足的情况下,确定答案正确,否则确定答案错误。
相应地,本发明实施例还提供一种用于文字性客观题的智能阅卷系统,如图7所示,是本发明实施例用于文字性客观题的智能阅卷系统的结构示意图。
在该实施例中,所述系统包括:图像获取模块701,切分模块702,第一判断模块703,计算模块704,第二判断模块705,输出模块706。其中,计算模块704包括第一计算模块741和第二计算模块742。
上述图像获取模块701用于获取文字性客观题答案图像;;
上述切分模块702用于对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;
上述第一判断模块703用于判断是否有字数与标准答案字数相同的切分结果,并在判断结果为没有与标准答案字数相同的切分结果时,触发输出模块706输出答案错误的指示信息;否则,触发计算模块704进行识别置信度计算;
上述第一计算模块741用于计算所述字数与标准答案字数相同的切分结果的识别置信度,第二计算模块742用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;
上述第二判断模块705,用于根据所述计算模块704计算得到的识别置信度确定答案是否正确,并在判断答案正确时,触发所述输出模块706输出答案正确的指示信息;在判断答案错误时,触发所述输出模块706输出答案错误的指示信息。
所述文字性客观题答案图像即为答案字符串图像,在本发明实施例中,所述答案字符串可以是中文字串、英文字串等。
上述图像获取模块701的一种实施例包括:
图像获取单元,用于获取答题卡图像;
答题区域提取单元,用于根据答题卡布局信息,分割并提取目标答题区域;
答案内容提取单元,从所述目标答题区域提取文字性客观题答案图像。具体地,在答题区域提取单元得到目标答题区域后,根据答题卡布局信息,再通过边缘点检测即可得到答案图像,该答案图像是答案字符串的图像。
上述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。也就是说,可以采用光标阅读设备进行扫描,或者采用高拍仪、移动终端等设备进行拍照等方式获取答题卡图像。
上述切分模块702包括:
切分单元,用于对所述答案图像进行细切分,得到多个细切分子块;
可信度计算单元,用于对所述细切分子块进行合并,并计算合并可信度;
合并结果确定单元,用于根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。具体地,如果可信度大于设定的阈值,则认为该合并是可信的,否则认为该合并是不可信的。进而根据可信的合并结果得到一个或多个待识别答案字符串。
需要说明的是,上述可信度计算单元包括:合并子单元,提取子单元、以及计算子单元。其中,合并子单元用于对所述细切分子块进行合并,对细切分子块进行合并的方式可以有多种,比如穷举性合并,只要保证不会遗漏各种可能的合并结果即可。提取子单元用于提取合并得到的字符的字符特征。计算子单元用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
所述合并可信度代表了合并后得到的字符的准确度,具体地,可以提取出合并后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征,根据系统预先训练的规则统计模型得到似然得分,将该得分作为当前合并结果的可信度。
所述规则统计模型是根据提取出的训练数据切分后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征,训练出的统计模型,该模型可以是GMM或SVM等。
合并可信度的计算,即计算合并结果所提取的特征通过规则统计模型计算出的似然得分(即合并得分),并根据该得分确定合并可信度,也可以直接将该得分作为对应的合并可信度。
另外,需要说明的是,在实际应用中,所述系统还可进一步包括预处理模块(未图示),用于在所述切分单元对所述答案图像进行切分之前,对答案图像进行预处理,以得到更准确的切分结果。所述预处理可以包括:对答案图像进行二值化处理、矫正手写笔迹倾斜、笔迹细化等。
本发明实施例提供的用于文字性客观题的智能阅卷系统,,对已知标准答案的文字性客观题,利用答案的先验信息辅助进行手写字符串的识别,从而完成文字性客观题的自动阅卷,解决了传统自动阅卷系统因不能应用计算机完全自动进行文字性客观题阅卷,而采用人工阅卷带来的人力资源消耗大、教师工作压力大、因教师主观因素导致的判卷结果不准确等问题。
在图7中,第一计算模块741用于计算各字数与标准答案字数相同的切分结果的识别置信度,第二计算模块742用于计算各字数与标准答案字数相同的切分结果中各字符的识别置信度。在实际应用中,所述系统可以择一选用第一计算模块741或第二计算模块742,也可以同时包括第一计算模块741或第二计算模块742,对此本发明实施例不做限定。相应地,第二判断模块705在判断答案正误时,可以根据其中之一的计算结果进行判断,也可以同时根据这两者的计算结果进行综合判断。
下面对第一计算模块741和第二计算模块742的具体结果进行详细说明。
如图8所示,是本发明实施例中第一计算模块的结构框图。
在该实施例中,所述第一计算模块741包括:
对齐单元801,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元802,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,,得到各识别结果的似然得分;
第一选择单元803,用于选取识别结果中解码路径与标准答案一致的路径的似然得分;
第一计算单元804,用于计算所述路径的后验得分,并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度。
相应地,依据上述第一计算模块741的计算结果,图7中的第二判断模块704在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时,判断答案正确;否则判断答案错误。
如图9所示,是本发明实施例中第二计算模块的一种结构框图。
在该实施例中,所述第二计算模块910包括:
对齐单元801,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第二识别单元912,用于基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;
第二选择单元913,用于选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;
第二计算单元914,用于计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;
相应地,依据上述第二计算模块910的计算结果,图7中的第二判断模块704在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值时,判断答案正确;否则判断答案错误。
如图10所示,是本发明实施例中第二计算模块的另一种结构框图。
在该实施例中,所述第二计算模块920包括:
对齐单元801,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元802,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,,得到各识别结果的似然得分;
第三计算单元923,用于计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述字数与标准答案字数相同的切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;
相应地,依据上述第二计算模块920的计算结果,图7中的第二判断模块704在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值时,判断答案正确;否则判断答案错误。
需要说明的是,前面提到的第一置信度阈值、第二置信度阈值、以及第三置信度阈值可以相同,也可以不同,对此本发明实施例不做限定。而且,在实际应用中,如同时采用第一计算模块和第二计算模块,则第二判断模块704对答案正误的判断可以根据这两种方案中的判断条件是否都满足来确定,如果都满足,则判断答案正确,否则判断答案错误。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。而且,其中的一些模块所提供的功能也可以由软件来实现,一些模块可以与现有的设备(比如个人电脑、平板电脑、手机)中的相同功能模块共用。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种用于文字性客观题的智能阅卷方法,其特征在于,包括:
获取文字性客观题答案图像;
对所述答案图像进行切分,获得待识别答案字符串的一个或多个可信的切分结果;
判断是否有字数与标准答案字数相同的切分结果;
如果没有,则确定答案错误;
否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;
根据计算得到的识别置信度确定答案是否正确。
2.根据权利要求1所述的方法,其特征在于,所述获取文字性客观题答案图像包括:
获取答题卡图像;
根据答题卡布局信息,分割并提取目标答题区域;
从所述目标答题区域提取文字性客观题答案图像。
3.根据权利要求2所述的方法,其特征在于,所述获取答题卡图像包括:
利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果包括:
对所述答案图像进行细切分,得到多个细切分子块;
对所述细切分子块进行合并,并计算合并可信度;
根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。
5.根据权利要求4所述的方法,其特征在于,所述计算合并可信度包括:
提取合并得到的字符的字符特征;
利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
6.根据权利要求1至5任一项所述的方法,其特征在于,
所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
选取识别结果中解码路径与标准答案一致的路径的似然得分;
计算所述路径的后验得分,并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度;
所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值,则确定答案正确;否则确定答案错误。
7.根据权利要求1至5任一项所述的方法,其特征在于,
所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;
选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;
计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;
所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。
8.根据权利要求1至5任一项所述的方法,其特征在于,
所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:
将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;
所述根据计算得到的识别置信度确定答案是否正确包括:
如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值,则确定答案正确;否则确定答案错误。
9.一种用于文字性客观题的智能阅卷系统,其特征在于,包括:
图像获取模块,用于获取文字性客观题答案图像;
切分模块,用于对所述答案图像进行切分,获得待识别答案字符串的一个或多个可信的切分结果;
第一判断模块,用于判断是否有字数与标准答案字数相同的切分结果,并在判断结果为没有与标准答案字数相同的切分结果时,触发输出模块输出答案错误的指示信息;否则,触发计算模块进行识别置信度计算;
所述计算模块包括:第一计算模块、和/或第二计算模块;所述第一计算模块用于计算所述字数与标准答案字数相同的切分结果的识别置信度,所述第二计算模块用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;
第二判断模块,用于根据所述计算模块计算得到的识别置信度确定答案是否正确,并在判断答案正确时,触发所述输出模块输出答案正确的指示信息;在判断答案错误时,触发所述输出模块输出答案错误的指示信息。
10.根据权利要求9所述的系统,其特征在于,所述图像获取模块包括:
图像获取单元,用于获取答题卡图像;
答题区域提取单元,用于根据答题卡布局信息,分割并提取目标答题区域;
答案内容提取单元,从所述目标答题区域提取文字性客观题答案图像。
11.根据权利要求10所述的系统,其特征在于,所述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。
12.根据权利要求9所述的系统,其特征在于,所述切分模块包括:
切分单元,用于对所述答案图像进行细切分,得到多个细切分子块;
可信度计算单元,用于对所述细切分子块进行合并,并计算合并可信度;
合并结果确定单元,用于根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。
13.根据权利要求12所述的系统,其特征在于,所述可信度计算单元包括:
合并子单元,用于对所述细切分子块进行合并;
提取子单元,用于提取合并得到的字符的字符特征;
计算子单元,用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
14.根据权利要求9至13任一项所述的系统,其特征在于,所述第一计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
第一选择单元,用于选取识别结果中解码路径与标准答案一致的路径的似然得分;
第一计算单元,用于计算所述路径的后验得分,并将所述后验得分作为所述切分结果的识别置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时,判断答案正确;否则判断答案错误。
15.根据权利要求9至13任一项所述的系统,其特征在于,所述第二计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第二识别单元,用于基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;
第二选择单元,用于选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;
第二计算单元,用于计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值时,判断答案正确;否则判断答案错误。
16.根据权利要求9至13任一项所述的系统,其特征在于,所述第二计算模块包括:
对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;
第一识别单元,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;
第三计算单元,用于计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述字数与标准答案字数相同的切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;
所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值时,判断答案正确;否则判断答案错误。
CN201410472818.3A 2014-09-16 2014-09-16 用于文字性客观题的智能阅卷方法及系统 Active CN104268603B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201410472818.3A CN104268603B (zh) 2014-09-16 2014-09-16 用于文字性客观题的智能阅卷方法及系统
US15/511,541 US10339428B2 (en) 2014-09-16 2015-08-11 Intelligent scoring method and system for text objective question
AU2015318386A AU2015318386B2 (en) 2014-09-16 2015-08-11 Intelligent scoring method and system for text objective question
PCT/CN2015/086585 WO2016041423A1 (zh) 2014-09-16 2015-08-11 用于文字性客观题的智能阅卷方法及系统
JP2017515834A JP6484333B2 (ja) 2014-09-16 2015-08-11 記述式問題のための知的採点方法およびシステム
SG11201701719QA SG11201701719QA (en) 2014-09-16 2015-08-11 Intelligent scoring method and system for text objective question
KR1020177006871A KR101877693B1 (ko) 2014-09-16 2015-08-11 문자성 객관식 문제에 이용되는 지능적 채점 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410472818.3A CN104268603B (zh) 2014-09-16 2014-09-16 用于文字性客观题的智能阅卷方法及系统

Publications (2)

Publication Number Publication Date
CN104268603A CN104268603A (zh) 2015-01-07
CN104268603B true CN104268603B (zh) 2017-04-12

Family

ID=52160123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410472818.3A Active CN104268603B (zh) 2014-09-16 2014-09-16 用于文字性客观题的智能阅卷方法及系统

Country Status (7)

Country Link
US (1) US10339428B2 (zh)
JP (1) JP6484333B2 (zh)
KR (1) KR101877693B1 (zh)
CN (1) CN104268603B (zh)
AU (1) AU2015318386B2 (zh)
SG (1) SG11201701719QA (zh)
WO (1) WO2016041423A1 (zh)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268603B (zh) * 2014-09-16 2017-04-12 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及系统
CN105427696A (zh) * 2015-11-20 2016-03-23 江苏沁恒股份有限公司 一种对目标题目所作答案进行判别的方法
CN105590101A (zh) * 2015-12-28 2016-05-18 杭州淳敏软件技术有限公司 基于手机拍照的手写答题卡自动处理和阅卷方法及系统
CN105678354A (zh) * 2015-12-31 2016-06-15 田雪松 数据实时处理方法
CN105844226A (zh) * 2016-03-21 2016-08-10 北京华云天科技有限公司 基于主观题的数据处理方法及其装置
CN105912993A (zh) * 2016-03-31 2016-08-31 深圳感官密码科技有限公司 自动阅卷图像识别方法和系统
CN106373447A (zh) * 2016-09-18 2017-02-01 三星电子(中国)研发中心 一种智能阅卷系统及方法
JP6593303B2 (ja) * 2016-10-31 2019-10-23 京セラドキュメントソリューションズ株式会社 問題作成装置、問題作成方法、及び画像形成装置
CN107067228A (zh) * 2017-03-31 2017-08-18 南京钧元网络科技有限公司 一种手持式认证智能审核系统及其审核方法
CN110413551B (zh) 2018-04-28 2021-12-10 上海寒武纪信息科技有限公司 信息处理装置、方法及设备
CN109214616B (zh) 2017-06-29 2023-04-07 上海寒武纪信息科技有限公司 一种信息处理装置、系统和方法
CN109426553A (zh) 2017-08-21 2019-03-05 上海寒武纪信息科技有限公司 任务切分装置及方法、任务处理装置及方法、多核处理器
WO2019001418A1 (zh) 2017-06-26 2019-01-03 上海寒武纪信息科技有限公司 数据共享系统及其数据共享方法
CN109389115B (zh) * 2017-08-11 2023-05-23 腾讯科技(上海)有限公司 文本识别方法、装置、存储介质和计算机设备
CN107729817B (zh) * 2017-09-20 2021-01-08 成都准星云学科技有限公司 一种基于规则的划分识别多候选项可信度的方法
CN107729936B (zh) * 2017-10-12 2020-12-08 科大讯飞股份有限公司 一种改错题自动评阅方法及系统
CN108960235B (zh) * 2018-06-25 2022-07-12 芝麻云信(武汉)科技有限公司 一种用于识别答题卡填涂块的方法
CN108985300A (zh) * 2018-07-01 2018-12-11 甘肃万维信息技术有限责任公司 一种基于Wunsch算法的自动阅卷系统
JP6704016B2 (ja) * 2018-07-12 2020-06-03 スキャネット株式会社 答案採点のシステム、プログラムおよび方法
CN109325401A (zh) * 2018-08-03 2019-02-12 成都准星云学科技有限公司 基于边缘定位对题目区域进行标注、识别的方法及系统
CN108932508B (zh) * 2018-08-13 2022-03-18 杭州大拿科技股份有限公司 一种题目智能识别、批改的方法和系统
CN109241869A (zh) * 2018-08-16 2019-01-18 邯郸职业技术学院 答题卡分数识别方法、装置及终端设备
CN110163211B (zh) * 2018-09-06 2023-02-28 腾讯科技(深圳)有限公司 一种图像识别方法、装置和存储介质
CN109033798B (zh) * 2018-09-14 2020-07-07 北京金堤科技有限公司 一种基于语义的点选验证码识别方法及其装置
CN109472014A (zh) * 2018-10-30 2019-03-15 南京红松信息技术有限公司 一种错题集自动识别生成方法及其装置
CN109635718B (zh) * 2018-12-10 2021-02-02 科大讯飞股份有限公司 一种文本区域划分方法、装置、设备及存储介质
CN109710590B (zh) * 2018-12-26 2021-05-07 杭州大拿科技股份有限公司 一种错题本生成方法及装置
US11749128B2 (en) * 2018-12-28 2023-09-05 Hangzhou Dana Technology Inc. Answer correction method and device
CN110232377A (zh) * 2019-01-07 2019-09-13 广东爱贝佳科技有限公司 一种字帖练习书法的人工智能评分系统及方法
CN109817046B (zh) * 2019-01-23 2021-08-24 广东小天才科技有限公司 一种基于家教设备的学习辅助方法及家教设备
CN109815932B (zh) * 2019-02-02 2021-05-28 杭州大拿科技股份有限公司 一种试卷批改方法、装置、电子设备及存储介质
CN109871525A (zh) * 2019-02-18 2019-06-11 南京红松信息技术有限公司 一种易于ocr识别的印刷排版的批阅系统及实现方法
CN110544400A (zh) * 2019-08-06 2019-12-06 安徽学云教育科技有限公司 一种基于图像识别的填空题自动阅卷方法
CN112700203B (zh) * 2019-10-23 2022-11-01 北京易真学思教育科技有限公司 智能阅卷方法及装置
CN111178269B (zh) * 2019-12-30 2023-04-18 福建天晴数码有限公司 答题卡内容识别方法
CN111144343B (zh) * 2019-12-30 2023-04-18 福建天晴数码有限公司 答题卡内容识别系统
CN110969152B (zh) * 2019-12-30 2023-04-18 福建天晴数码有限公司 练习册内容识别方法
CN111178268B (zh) * 2019-12-30 2023-04-18 福建天晴数码有限公司 练习册内容识别系统
CN111144342B (zh) * 2019-12-30 2023-04-18 福建天晴数码有限公司 页面内容识别系统
JP7382544B2 (ja) * 2020-02-06 2023-11-17 Arithmer株式会社 文字列認識装置及び文字列認識プログラム
KR102654661B1 (ko) * 2020-02-07 2024-04-05 김현수 인공지능 기반의 패션디자인 교육 및 창업지원 서비스 제공방법 및 시스템
CN111931828B (zh) * 2020-07-23 2024-03-01 联想(北京)有限公司 一种信息确定方法、电子设备和计算机可读存储介质
CN112036343B (zh) * 2020-09-04 2022-02-08 北京字节跳动网络技术有限公司 答案提取方法、装置、计算机可读介质及电子设备
CN111931730B (zh) * 2020-09-24 2022-03-29 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN112215236B (zh) * 2020-10-21 2024-04-16 科大讯飞股份有限公司 文本识别方法、装置、电子设备及存储介质
CN112613500A (zh) * 2020-12-21 2021-04-06 安徽科迅教育装备集团有限公司 一种基于深度学习的校园动态阅卷系统
CN112686143B (zh) * 2020-12-29 2023-12-01 科大讯飞股份有限公司 客观题填涂的识别方法、电子设备和存储介质
CN112733644A (zh) * 2020-12-30 2021-04-30 广东德诚大数据科技有限公司 一种基于扫描识别的填涂点识别系统及方法
CN112347998A (zh) * 2021-01-05 2021-02-09 北京易真学思教育科技有限公司 判题方法、装置、设备及存储介质
CN112949616A (zh) * 2021-05-13 2021-06-11 北京世纪好未来教育科技有限公司 一种题目处理方法、装置、电子设备及计算机存储介质
US11967253B2 (en) * 2021-05-27 2024-04-23 International Business Machines Corporation Semi-automated evaluation of long answer exams
CN113326815B (zh) * 2021-07-12 2022-05-06 北京世纪好未来教育科技有限公司 一种文档处理方法、装置、电子设备及可读存储介质
CN113505794B (zh) * 2021-07-13 2023-06-23 树蛙信息科技(南京)有限公司 文本识别方法及装置
CN114299523A (zh) * 2021-11-18 2022-04-08 珠海读书郎软件科技有限公司 一种教辅作业识别批改分析方法和分析系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1822630A (zh) * 2005-01-19 2006-08-23 富士施乐株式会社 自动评分装置、方法及其存储介质
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷系统的答题卡识别装置及方法
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN103559490A (zh) * 2013-10-11 2014-02-05 华南理工大学 基于二值图像连通域统计的答题卡自动评分方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3643069A (en) 1968-09-30 1972-02-15 Nippon Electric Co Recognition apparatus with readout mode selection capability
US4731861A (en) * 1983-08-26 1988-03-15 Texas Instruments Incorporated Method of optical character recognition
JP2940747B2 (ja) * 1992-10-13 1999-08-25 三洋電機株式会社 文字切り出し装置
JPH10302025A (ja) * 1997-04-25 1998-11-13 Casio Comput Co Ltd 手書き文字認識装置およびそのプログラム記録媒体
JP3080066B2 (ja) * 1998-05-18 2000-08-21 日本電気株式会社 文字認識装置、方法及び記憶媒体
JP2001154573A (ja) * 1999-11-24 2001-06-08 Advance A:Kk 自動採点方法及びそのシステム
JP4601835B2 (ja) * 2000-01-28 2010-12-22 株式会社東芝 単語認識方法および単語認識プログラムおよび単語認識装置
US6847734B2 (en) * 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program
US6810232B2 (en) * 2001-03-05 2004-10-26 Ncs Pearson, Inc. Test processing workflow tracking system
US20060252023A1 (en) * 2005-05-03 2006-11-09 Lexmark International, Inc. Methods for automatically identifying user selected answers on a test sheet
JP4894189B2 (ja) * 2005-08-02 2012-03-14 富士ゼロックス株式会社 教材処理装置、教材処理方法、教材処理プログラム及び記録媒体
US20070048718A1 (en) * 2005-08-09 2007-03-01 Exam Grader, Llc System and Method for Test Creation, Verification, and Evaluation
JP5239506B2 (ja) * 2008-05-19 2013-07-17 富士通株式会社 学習支援システム、プログラムおよび学習支援方法
JP5434586B2 (ja) * 2009-12-29 2014-03-05 オムロン株式会社 単語認識方法および単語認識用のプログラムならびに情報処理装置
JP5252596B2 (ja) * 2010-11-02 2013-07-31 国立大学法人東京農工大学 文字認識装置、文字認識方法及びプログラム
CN102890775A (zh) * 2011-07-21 2013-01-23 北京五岳鑫信息技术股份有限公司 一种基于ocr识别的试卷分数自动识别处理方法
US9361515B2 (en) * 2014-04-18 2016-06-07 Xerox Corporation Distance based binary classifier of handwritten words
CN104268603B (zh) 2014-09-16 2017-04-12 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1822630A (zh) * 2005-01-19 2006-08-23 富士施乐株式会社 自动评分装置、方法及其存储介质
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷系统的答题卡识别装置及方法
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN103559490A (zh) * 2013-10-11 2014-02-05 华南理工大学 基于二值图像连通域统计的答题卡自动评分方法

Also Published As

Publication number Publication date
US20170262738A1 (en) 2017-09-14
KR20170042684A (ko) 2017-04-19
CN104268603A (zh) 2015-01-07
AU2015318386A1 (en) 2017-03-23
JP2017531262A (ja) 2017-10-19
KR101877693B1 (ko) 2018-07-12
SG11201701719QA (en) 2017-04-27
AU2015318386B2 (en) 2018-12-13
WO2016041423A1 (zh) 2016-03-24
US10339428B2 (en) 2019-07-02
JP6484333B2 (ja) 2019-03-13

Similar Documents

Publication Publication Date Title
CN104268603B (zh) 用于文字性客观题的智能阅卷方法及系统
CN104463101B (zh) 用于文字性试题的答案识别方法及系统
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN106778757B (zh) 基于文本显著性的场景文本检测方法
CN104463250B (zh) 一种基于达芬奇技术的手语识别翻译方法
CN107633250A (zh) 一种文字识别纠错方法、纠错系统及计算机装置
CN107729865A (zh) 一种手写体数学公式离线识别方法及系统
CN110097094A (zh) 一种面向人物交互的多重语义融合少样本分类方法
CN106980856A (zh) 公式识别方法及系统和符号推理计算方法及系统
CN105608454A (zh) 基于文字结构部件检测神经网络的文字检测方法及系统
CN112231522B (zh) 一种在线课程知识树的生成关联方法
CN110796018A (zh) 一种基于深度图像和彩色图像的手部运动识别方法
CN110465089B (zh) 基于图像识别的地图探索方法、装置、介质及电子设备
CN107665188A (zh) 一种语义理解方法及装置
CN111444905B (zh) 基于人工智能的图像识别方法和相关装置
CN109766918A (zh) 基于多层次上下文信息融合的显著性物体检测方法
CN112528628B (zh) 一种文本处理的方法、装置及电子设备
CN106339726A (zh) 用于手写识别的方法及装置
CN114140806A (zh) 一种端到端的实时习题检测方法
CN113052156A (zh) 光学字符识别方法、装置、电子设备和存储介质
CN113837167A (zh) 一种文本图像识别方法、装置、设备及存储介质
Le et al. An Attention-Based Encoder–Decoder for Recognizing Japanese Historical Documents
CN105096667B (zh) 汉字学习辅助装置以及汉字学习辅助装置的显示方法
CN110956174A (zh) 一种器件编号的识别方法
Li et al. A Survey of Text Detection Algorithms in Images Based on Deep Learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant