CN103927552A - 匹配目标试题答案的方法和装置 - Google Patents

匹配目标试题答案的方法和装置 Download PDF

Info

Publication number
CN103927552A
CN103927552A CN201410166705.0A CN201410166705A CN103927552A CN 103927552 A CN103927552 A CN 103927552A CN 201410166705 A CN201410166705 A CN 201410166705A CN 103927552 A CN103927552 A CN 103927552A
Authority
CN
China
Prior art keywords
image
examination question
target examination
value
comprises target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410166705.0A
Other languages
English (en)
Inventor
王艳丽
吴凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410166705.0A priority Critical patent/CN103927552A/zh
Publication of CN103927552A publication Critical patent/CN103927552A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种匹配目标试题答案的方法和装置,其中,方法包括:获取包含目标试题的图像;根据一个或多个图像指标判断包含目标试题的图像是否符合识别要求;如果包含目标试题的图像满足识别要求,对图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息;根据预处理后的图像查找对应的试题答案并显示。根据该方案,实时地获取符合识别要求的图像,对图像的预处理提高了识别的准确率和效率,能够及时为用户查找到答案,并保证答案的准确性。

Description

匹配目标试题答案的方法和装置
技术领域
本发明涉及终端应用领域,具体涉及一种匹配目标试题答案的方法和装置。
背景技术
在中小学生写作业或者家长辅导学生的时候,常遇到不会做的试题或题目。这时用户常常通过互联网寻求试题的答案。
当前,已有多种服务于学生或家长的中小学生试题解析网站或网络应用,帮助用户获取答案,顺利完成作业,例如,作业帮,问他,作业宝等网站。用户输入试题内容或上传试题图片等待他人解答。
现有的作业解析网站,app等都是通过人工回答,网站的其他用户,或在线教师查看试题后给出参考答案。从用户提问到获取到答案,存在时间成本的问题,用户的即时需求无法得到满足。在用户提问高峰期,或是对于难度较大的问题,有时会出现较长时间,如几个小时或一天内无人作答的情况,效率十分低下。长时间的等待也影响用户体验。并且,不同的作答可能多种不同的答案,令用户难以分辨。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的匹配目标试题答案的方法和装置。
根据本发明的一个方面,提供了一种匹配目标试题答案的方法,包括:获取包含目标试题的图像;根据一个或多个图像指标判断包含目标试题的图像是否符合识别要求;如果包含目标试题的图像满足识别要求,对图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息;根据预处理后的图像查找对应的试题答案并显示。
可选地,所述一个或多个图像指标包括以下指标中的一项或多项:拍摄角度、图像分辨率、亮度、对比度。
可选地,所述根据一个或多个图像指标判断包含目标试题的图像是否符合识别要求具体包括:
对所述包含目标试题的图像进行质量分析,得到该图像的拍摄角度值、图像分辨率值、亮度值、和/或对比度值;
分别将所述拍摄角度值、图像分辨率值、亮度值、和/或对比度值与对应的预设阈值范围进行比对;
根据比对结果判断所述包含目标试题的图像是否符合识别要求。
可选地,所述根据比对结果判断目标试题的图像是否符合识别要求具体为:
如果包含目标试题的图像的拍摄角度值和/或图像分辨率值不在对应的预设阈值范围内,判断所述包含目标试题的图像不符合识别要求。
可选地,所述对所述图像做预处理具体为:如果亮度值和/或对比度值不在对应的预设阈值范围内,调整所述图像的亮度值和/或对比度值至对应的预设阈值范围内。
可选地,所述包含目标试题的图像由用户拍摄获得,所述方法还包括:向用户提供拍摄引导信息,获取用户拍摄的包含目标试题的初始图像;
所述判断包含目标试题的图像是否符合识别要求具体为:判断所述初始图像是否符合OCR识别要求。
可选地,所述预处理还包括:
根据用户选择的聚焦区域,对所述包含目标试题的初始图像进行边缘检测,得到所述目标试题在所述初始图像中的边界;
根据所述目标试题在所述初始图像中的边界,截取所述包含目标试题的图像;
所述对预处理后的图像进行识别具体为:对截取到的所述包含目标试题的图像进行OCR识别。
可选地,所述对包含目标试题的初始图像进行边缘检测,得到所述目标试题在所述初始图像中的边界包括:根据用户选择的聚焦区域,自动检测所述目标试题在所述初始图像中的边界,或
提供用户接口,将用户选定的边界作为述目标试题在所述初始图像中的边界。
可选地,所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向,拍摄角度,光线,提醒用户对目标试题所在区域进行聚焦。
可选地,所述根据预处理后的信息查找对应的答案并显示具体包括:
对预处理后的图像进行识别,获取所述目标试题的文字内容;
利用所述目标试题的文字内容与试题库中的试题进行匹配;
将匹配通过的试题作为候选试题,获取候选试题的答案。
根据本发明的另一方面,提供了一种匹配目标试题答案的装置,包括:获取模块,用于获取包含目标试题的图像;判断模块,用于根据一个或多个图像指标判断所述包含目标试题的图像是否符合识别要求;预处理模块,用于当所述包含目标试题的图像满足所述识别要求时,对所述图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息;查找模块,用于根据预处理后的图像查找对应的试题答案。
可选地,所述一个或多个图像指标包括以下指标中的一项或多项:拍摄角度、图像分辨率、亮度、对比度。
可选地,所述判断模块包括:
分析单元,用于对所述包含目标试题的图像进行质量分析,得到该图像的拍摄角度值、图像分辨率值、亮度值、和/或对比度值;
比对单元,用于分别将所述拍摄角度值、图像分辨率值、亮度值、和/或对比度值与对应的预设阈值范围进行比对;
判断单元,用于根据比对结果判断所述包含目标试题的图像是否符合识别要求。
可选地,所述判断单元具体用于:如果包含目标试题的图像的拍摄角度值和/或图像分辨率值不在对应的预设阈值范围内,判断所述包含目标试题的图像不符合识别要求。
可选地,所述预处理模块进一步包括:调整单元,用于亮度值和/或对比度值不在对应的预设阈值范围内时,调整所述图像的亮度值和/或对比度值至对应的预设阈值范围内。
可选地,所述获取模块进一步包括:
拍照单元,向用户提供拍摄引导信息,获取用户拍摄的包含目标试题的初始图像;
所述判断模块具体用于:判断所述初始图像是否符合OCR识别要求。
可选地,所述预处理模块还包括:
边缘检测单元,用于对所述初始图像进行边缘检测,得到所述目标试题在所述初始图像中的边界;
图像截取单元,用于根据所述目标试题在所述初始图像中的边界,截取所述包含目标试题的图像;
所述识别模块具体用于:对截取到的所述包含目标试题的图像进行OCR识别。
可选地,所述边缘检测单元具体用于:根据用户选择的聚焦区域,自动检测所述目标试题在所述初始图像中的边界,或
提供用户接口,将用户选定的边界作为述目标试题在所述初始图像中的边界。
可选地,所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向,拍摄角度,光线,提醒用户对目标试题所在区域进行聚焦。
可选地,所述查找模块进一步包括:
识别单元,用于对预处理后的图像进行识别,获取所述目标试题的文字内容;
匹配单元,用于利用所述目标试题的文字内容与试题库中的试题进行匹配;
获取单元,用于将匹配通过的试题作为候选试题,获取候选试题的答案。
根据本发明的匹配目标试题答案的方法和装置,获取包含目标试题的图像,判断该图像是否符合识别要求,对符合识别要求的图像做预处理,根据预处理后的图像查找对应的试题答案。根据该方案,实时地获取符合识别要求的图像,对图像的预处理提高了识别的准确率和效率,能够及时为用户查找到答案,并保证答案的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的匹配目标试题答案的方法的流程图;
图2示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图;
图3示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图;
图4示出了根据本发明一个实施例的匹配目标试题答案的装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的匹配目标试题答案的方法的流程图,如图1所示,方法包括如下步骤:
步骤S110,获取包含目标试题的图像。
包含目标试题的图像可来自用户的现场拍摄,或选自本地文件,例如,手机相册,对电子文档的截图等。图像可以为bmp,jpg,jpeg等常见格式,也可以包括其它适于进行图像识别的电子文件格式,例如pdf文件。
步骤S120,根据一个或多个图像指标,判断包含目标试题的图像是否符合识别要求。
一个或多个图像指标可以包括拍摄角度、图像分辨率、亮度、对比度,以及图像等信噪比等。图像指标的具体要求可能与图像类别相关,例如,对于手写题目,则对图像分辨率等参数有更高的要求。另一方面,判断图像是否符合识别要求需要综合评价上述指标中的一个或多个是否在可接受的范围内,各指标在评价中可能占有不同的权重及优先次序,本领域技术人员可根据实际需要进行调整。
步骤S130,如果包含目标试题的图像符合识别要求,对图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息。
预处理包括对部分可调节指标进行调整,包括但不仅限于:调整亮度、对比度至最佳范围,去除噪音,对彩色图像的二值化处理等。图像预处理还可以包括边缘检测等内容,详见后续实施例描述。
如果不满足识别要求,显示提示信息,通知用户重新进行拍摄或重新选取图像。
步骤S140,根据预处理后的图像查找对应的试题答案并显示。
将预处理后的包含目标试题的图像转换成目标试题的文字内容,利用文字内容查找答案,或者进一步地,从文字内容中提取出包含目标试题至少部分有效信息的特征信息,根据特征信息查找试题答案,例如,特征信息可以是从文字内容中截取的一个或多个预设长度的文字片段,或者,以对文字内容进行抛词处理后的剩余文字内容作为特征信息。
具体地,根据文字内容或特征信息查找答案的一种方式是,在试题库中匹配特征信息。试题库中有大量预先收集的试题及相应的答案。试题库可以是一个或多个,例如,试题库可根据学科,年级等进行分类。匹配时提醒用户在相应的类别中查找,或根据的关键词对目标题目进行自动分类,以提高查找效率。
根据本发明上述实施例提供的方法,获取包含目标试题的图像,判断该图像是否符合识别要求,对符合识别要求的图像做预处理,根据预处理后的图像查找对应的试题答案。根据该方案,实时地获取符合识别要求的图像,通过对图像进行预处理提高了识别的准确率和效率,能够及时为用户查找到答案,并保证答案的准确性。
图2示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图,如图2所示,方法包括如下步骤:
步骤S210,向用户提供拍摄引导信息,获取用户拍摄的包含目标试题的初始图像;
拍摄引导信息包括拍摄方向,拍摄角度,光线,距离,以及提醒用户对目标试题所在区域进行聚焦等,通过引导信息对用户做适当的指示,使用户拍摄出的图像符合识别的质量要求。
本发明中的方法可实现为智能手机平台上的app,则该步骤可通过调用智能手机的摄像头或系统提供的摄像程序实现。
具体地,在用户拍照前给出文字说明及示例图片等作为引导信息,例如,提示用户采用垂直角度进行拍摄,选择良好光线,横向拍摄,显示一个用户可调的聚焦框等,以及在题目过长时,只拍摄一部分有效内容等。
步骤S220,对包含目标试题的图像进行质量分析,得到该图像的多个图像指标。
质量分析依照预设的图像指标进行。作为示例,本实施例中选取拍摄角度、图像分辨率、亮度、对比度作为图像指标进行说明,但需要说明的是本发明实施例不仅限于此。上述质量分析具体为:计算图像的拍摄角度、分辨率值、亮度值以及对比度值。
步骤S230,将多个图像指标分别与对应的预设阈值范围进行比对。
不同的图像类别可能对应不同的阈值,例如,字体较小或手写题目可能对分辨率的要求较高。多个图像指标的比对过程可能按照一定的优先次序进行,并且,步骤S220中的质量分析结果也可能影响预设阈值范围的选取,例如,质量分析及比对结果表明,图像具有较高的分辨率并且接近垂直拍摄,则相应地,可以接受较大的亮度、对比度阈值范围。
步骤S240,根据比对结果判断包含目标试题的图像是否符合识别要求,如果符合要求,执行步骤S260,否则,执行步骤S250。
下面示例性地说明判断规则,定义拍摄角度的预设阈值范围为20°以下,分辨率的阈值范围为150-600dpi之间,由于对比度和亮度易于调节,可选择较大的阈值范围,例如,可为亮度和对比度分别设置第一、第二阈值范围,则具体地,判断方法可以包括:
分辨率不在上述范围内(150-600dpi)时,判断图像不符合识别要求;拍摄角度不在20°范围内时,判断图像不符合识别要求;当分辨率和拍摄角度符合要求,对比度和/或亮度在各自的第一阈值范围外,第二阈值范围内时,判断图像符合识别要求,而当对比度或亮度在第二阈值范围外时,判断图像不符合识别要求。上述判断规则仅为示例,可根据实际情况适用其他规则。
步骤S250,发出重新获取包含目标试题的图像的提示信息,转到步骤S210。
通过文字或图片提示用户重新拍摄或重新选取图片,具体地,根据上述比对结果给出相应提示信息,例如,分辨率过低,则可提示用户图片过于模糊。
步骤S260,判断亮度值和/或对比度值是否在对应的预设阈值范围内,如果是,执行步骤S280,否则执行步骤S270。
如同在步骤S240中所述的,分辨率在150-600dpi之间,而拍摄角度在20°以下时,如果亮度和/或对比度中在对应的第一阈值范围外,第二阈值范围内时,或在第一阈值范围内时,都判断该图像符合识别要求,该步骤中的预设阈值范围指第一阈值范围。
步骤S270,调整图像的亮度值和/或对比度值至对应的预设阈值范围内;之后,执行步骤S280。
若图像符合识别要求而亮度值和/或对比度值不在第一阈值范围内,将亮度值和/或对比度值调整至较佳的第一阈值范围内,以利于识别。
步骤S280,根据预处理后的图像查找对应的试题答案并显示。
例如,可以采用OCR等文字识别方法,得到试题文字内容,根据文字内容自动匹配试题答案,详见下一实施例。
根据本发明上述实施例提供的方法,对用户进行拍照引导,并在识别图像之前,通过质量分析和预处理等步骤保证了图像满足识别要求,使用户免于图像质量原因引起的重复操作,也避免了图像质量问题导致的识别准确率低下,获取答案失败等情况,使答案查找获得较高的召回率和准确性。
图3示出了根据本发明一个实施例的匹配目标试题答案的方法的流程图,如图3所示,方法包括如下步骤:
步骤S310,获取包含目标试题的图像。
步骤S320,根据一个或多个图像指标判断包含目标试题的图像是否符合OCR识别要求,如果是,执行步骤S340,否则执行步骤S330。
步骤S330,发出重新获取包含目标试题的图像的提示信息,转到步骤S310。
步骤S310-S330的具体实现方式可参照上一实施例,此处不再重复叙述。
步骤S340,对包含目标试题的初始图像进行边缘检测,得到目标试题在初始图像中的边界。
步骤S340之前也可以进行亮度、对比度调整等预处理行为,具体过程可参见上一实施例。在本实施例中,对图像的预处理还包括边缘检测。
具体地,边缘检测可根据用户选择的聚焦区域自动完成,例如,智能手机的拍照程序通常会给出一个位于手机屏幕中间位置的聚焦框,通过拍照引导信息指示客户调整手机摄像头与实体之间的距离,使聚焦框内只包含目标试题的部分或全部内容,利用边缘检测算法自动检测目标试题在用户拍摄的初始图像中的边界。
或者,提供用户接口,例如,显示一个大小、位置可调的矩形聚焦框,由用户通过手动拖拽等方式调整其大小、位置,以用户选择的聚焦框的边框作为目标试题在初始图像中的边界。
步骤S350,根据目标试题在初始图像中的边界,截取包含目标试题的图像。
截取边界内的图像作为待识别图像。如上所述,如果用户按照引导信息进行了正确操作,则截取的图像中只包含目标试题的文字内容,这有效避免了由于相邻试题的部分文字在后续匹配过程中可能造成的干扰,而导致找不到候选试题的情况。
上述步骤S340和步骤S350为本实施例的可选步骤。
步骤S360,对截取的图像进行OCR识别,获取目标试题的文字内容。
该实施例中,采用OCR(光学字符识别)技术对截取图像进行识别。OCR具有较高的识别速度和准确率。OCR中包括二值化,噪声去除,倾斜校正,字符切割等过程,当然,二值化及噪声去除也可以在预处理步骤中完成。然后,通过特定的OCR算法得到目标试题的文字内容,现有技术中有多种OCR算法,例如基于模板匹配,特征提取或神经网络训练等方法,可根据需要进行选择。另外,OCR技术还包括版面分析及恢复过程,当未进行可选的边缘检测及图片截取步骤时,可通过版面分析仅提取出目标试题的文字内容,防止不相关文字内容的干扰。
可选地,本实施例中的OCR识别还可以包括:在识别后,从识别出的文字内容中提取出包含目标试题至少部分有效信息的特征信息,根据特征信息查找试题答案,例如,特征信息可以是从文字内容中截取的一个或多个预设长度的文字片段,或者,以对文字内容进行抛词处理后的剩余文字内容作为特征信息。当试题过长时,基于特征信息的匹配有助于提高匹配效率和召回率。
步骤S370,判断试题库中是否有至少一个试题包含与目标试题的文字内容或特征信息相匹配的信息,如果是,执行步骤S380,否则执行步骤S390。
题库中可能存在大量相似度较高的试题,这些相似度较高的试题中包含同样的文字片段,因此,与特征信息相匹配的试题的数量可能为多个。
步骤S380,将匹配通过的试题作为候选试题,获取候选试题的答案。
获取全部的候选试题的答案和题目并显示,进一步,还可以找到与目标试题相似度较高的试题及答案,作为相关试题给出,计算相关试题与目标试题之间的相似度,按相似度排序后显示,供用户查看。
步骤S390,返回提示信息,显示相关试题及答案。
如果匹配失败,提示未找到候选试题。进一步查询试题库中是否存在一些试题,其中包含了与目标试题文字内容或特征信息相似度较高的内容。例如,可以对截取的多个片段进行进一步地截取,得到多个子片段,利用这些子片段或子片段的组合进行匹配,如果匹配出的题目与目标试题之间具有较高的相似度,可作为相关试题记录。由于试题的表达形式多变,这些相似度较高的相关试题可能对用户有提示作用。
根据本发明上述实施例提供的方法,对初始图像进行边缘处理,提高了试题的召回率和查找效率,利用OCR识别技术准确的获取目标试题的文字内容或特征信息,在试题库中匹配特征信息获取候选试题,大量减少了作答时间和用户操作,能够及时为用户提供答案,并保证答案的准确性。
图4示出了根据本发明一个实施例的匹配目标试题答案的装置的结构框图,如图4所示,装置包括:
获取模块410,用于获取包含目标试题的图像。
包含目标试题的图像可来自用户的现场拍摄,或选自本地文件,例如,手机相册,对电子文档的截图等。图像可以为bmp,jpg,jpeg等常见格式,也可以包括其它适于进行图像识别的电子文件格式,例如pdf文件。
可选地,图像来自用户拍摄,则图像获取模块410进一步包括:拍照单元4101,用于向用户提供拍摄引导信息,获取用户拍摄的包含目标试题的初始图像;拍摄引导信息包括拍摄方向,拍摄角度,光线,距离,以及提醒用户对目标试题所在区域进行聚焦等,通过引导信息对用户做适当的指示,使用户拍摄出的图像符合识别的质量要求。
判断模块420,用于根据一个或多个图像指标判断包含目标试题的图像是否符合识别要求。
一个或多个图像指标包括以下指标中的一项或多项:拍摄角度、图像分辨率、亮度、对比度。
可选地,判断模块420进一步包括:分析单元4201,用于对包含目标试题的图像进行质量分析,得到该图像的拍摄角度值、图像分辨率值、亮度值、和/或对比度值。
比对单元4202,用于分别将拍摄角度值、图像分辨率值、亮度值、和/或对比度值与对应的预设阈值范围进行比对。
判断单元4203,用于根据比对结果判断包含目标试题的图像是否符合识别要求。
例如,预定义拍摄角度的预设阈值范围为20°以下,分辨率的阈值范围为150-600dpi之间,由于对比度和亮度易于调节,可选择较大的阈值范围,例如,可为亮度和对比度分别设置第一、第二阈值范围,则判断单元4203具体用于:
比对单元4202的比对结果表明分辨率不在上述范围内(150-600dpi)时,判断单元4203判断图像不符合识别要求;拍摄角度不在20°范围内时,判断图像不符合识别要求;当分辨率和拍摄角度符合要求,对比度和/或亮度在各自的第一阈值范围外,第二阈值范围内时,判断图像符合识别要求,而当对比度或亮度在第二阈值外时,判断图像不符合识别要求。上述判断规则仅为示例,可根据实际情况适用其他规则。
预处理模块430,用于当包含目标试题的图像满足识别要求时,对图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息。
预处理模块430可用于调整亮度、对比度至最佳范围,去除噪音,对彩色图像的二值化处理等。
可选地,所述预处理模块430进一步包括:调整单元4301,用于亮度值和/或对比度值不在对应的预设阈值范围内时,调整图像的亮度值和/或对比度值至对应的预设阈值范围内。
例如,分辨率在150-600dpi之间,而拍摄角度在20°以下时,如果亮度和/或对比度中在对应的第一阈值范围外,而在第二阈值范围内时,判断单元4203判断该图像符合识别要求,这时,调整单元4301将亮度和/或对比度调整至较佳的第一阈值范围内,也即这里的预设阈值范围指第一阈值范围。
可选地,预处理模块430还包括:
边缘检测单元4302,用于对初始图像进行边缘检测,得到目标试题在初始图像中的边界;
边缘检测单元4302可根据用户选择的聚焦区域自动完成检测,例如,在智能手机中,拍照程序通常会给出一个位于手机屏幕中间位置的聚焦框,通过拍照引导信息指示客户调整手机摄像头与实体之间的距离,使聚焦框内只包含目标试题的部分或全部内容,边缘检测单元4302利用边缘检测算法自动检测目标试题在用户拍摄的初始图像中的边界。
或者,边缘检测单元4302提供用户接口,将用户选定的边界作为述目标试题在初始图像中的边界。例如,边缘检测单元4302显示一个大小、位置可调的矩形聚焦框,由用户通过手动拖拽等方式调整其大小、位置,以用户选择的聚焦框的边框作为目标试题在初始图像中的边界。
图像截取单元4303,用于根据所述目标试题在初始图像中的边界,截取包含目标试题的图像。
截取边界内的图像作为待识别图像。如上所述,如果用户按照引导信息进行了正确操作,则图像截取单元4303截取的图像中只包含目标试题的文字内容,这有效避免了由于相邻试题的部分文字在后续匹配过程中可能造成的干扰,而导致找不到候选试题的情况。
查找模块440,用于根据预处理后的图像查找对应的试题答案。
可选地,查找模块440进一步包括识别单元4401,用于对预处理后的图像进行识别,获取目标试题的文字内容。
可选地,该实施例中,识别单元4401采用OCR(光学字符识别)技术对截取图像进行识别。OCR具有较高的识别速度和准确率。识别单元4401在OCR中可以执行二值化,噪声去除,倾斜校正,字符切割等过程,当然,二值化及噪声去除也可以由预处理模块430在预处理步骤中完成。然后,识别单元4401通过特定的OCR算法得到目标试题的文字内容,现有技术中有多种OCR算法,例如基于模板匹配,特征提取或神经网络训练等方法,可根据需要进行选择。另外,OCR技术还包括版面分析及恢复过程,当未进行可选的边缘检测及图片截取时,可通过版面分析仅提取出目标试题的文字内容,防止不相关文字内容的干扰。
可选地,本实施例中识别单元4401还可用于:从OCR识别出的文字内容中提取出包含目标试题至少部分有效信息的特征信息,根据特征信息查找试题答案,例如,特征信息可以是从文字内容中截取的一个或多个预设长度的文字片段,或者,以对文字内容进行抛词处理后的剩余文字内容作为特征信息。当试题过长时,基于特征信息的匹配有助于提高匹配效率和召回率。
匹配单元4402,用于利用目标试题的文字内容与试题库中的试题进行匹配。
具体地,匹配单元4402将识别单元4401识别出的目标试题文字内容,或得到的特征信息在试题库中匹配。
试题库中可能存在大量相似度较高的试题,这些相似度较高的试题中包含同样的文字片段,则与特征信息相匹配的试题的数量可能为多个。
如果匹配失败,匹配模块4402进一步查询试题库中是否存在一些试题,其中包含了目标试题文字内容或特征信息相似度较高的内容。例如,可以对截取的多个片段进行进一步地截取,得到多个子片段,利用这些子片段或子片段的组合进行匹配,如果匹配出的题目与目标试题之间具有较高的相似度,可作为相关试题记录。由于试题的表达形式多变,这些相似度较高的相关试题可能对用户有提示作用。
获取单元4403,用于将匹配通过的试题作为候选试题,获取候选试题的答案。
根据本发明上述实施例提供的装置,获取包含目标试题的图像,判断该图像是否符合识别要求,对符合识别要求的图像做预处理,根据预处理后的图像查找对应的试题答案。根据该装置,实时地获取符合识别要求的图像,通过对图像进行预处理提高了识别的准确率和效率。而且,该装置可以对用户进行拍照引导,并在识别图像之前,通过质量分析和预处理等步骤保证了图像满足识别要求,使用户免于图像质量原因引起的重复操作,也避免了图像质量问题导致的识别准确率低下,获取答案失败等情况,使答案查找获得较高的召回率和准确性。该装置还可以对初始图像进行边缘处理,利用OCR识别技术准确的获取目标试题的文字内容或特征信息,在试题库中匹配特征信息获取候选试题,大量减少了作答时间和用户操作,能够及时为用户提供答案,并保证答案的准确性。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的匹配目标试题答案的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种匹配目标试题答案的方法,包括:
获取包含目标试题的图像;
根据一个或多个图像指标判断所述包含目标试题的图像是否符合识别要求;
如果所述包含目标试题的图像符合所述识别要求,对所述图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息;
根据预处理后的图像查找对应的试题答案并显示。
2.根据权利要求1所述的方法,所述一个或多个图像指标包括以下指标中的一项或多项:拍摄角度、图像分辨率、亮度、对比度。
3.根据权利要求1-2任一项所述的方法,所述根据一个或多个图像指标判断包含目标试题的图像是否符合识别要求具体包括:
对所述包含目标试题的图像进行质量分析,得到该图像的拍摄角度值、图像分辨率值、亮度值、和/或对比度值;
分别将所述拍摄角度值、图像分辨率值、亮度值、和/或对比度值与对应的预设阈值范围进行比对;
根据比对结果判断所述包含目标试题的图像是否符合识别要求。
4.根据权利要求1-3任一项所述的方法,所述根据比对结果判断目标试题的图像是否符合识别要求具体为:
如果包含目标试题的图像的拍摄角度值和/或图像分辨率值不在对应的预设阈值范围内,判断所述包含目标试题的图像不符合识别要求。
5.根据权利要求1-4任一项所述的方法,所述对所述图像做预处理具体为:如果亮度值和/或对比度值不在对应的预设阈值范围内,调整所述图像的亮度值和/或对比度值至对应的预设阈值范围内。
6.根据权利要求1-5任一项所述的方法,所述包含目标试题的图像由用户拍摄获得,所述方法还包括:向用户提供拍摄引导信息,获取用户拍摄的包含目标试题的初始图像;
所述判断包含目标试题的图像是否符合识别要求具体为:判断所述初始图像是否符合OCR识别要求。
7.根据权利要求1-6任一项所述的方法,所述预处理还包括:
对所述包含目标试题的初始图像进行边缘检测,得到所述目标试题在所述初始图像中的边界;
根据所述目标试题在所述初始图像中的边界,截取所述包含目标试题的图像;
所述对预处理后的图像进行识别具体为:对截取到的所述包含目标试题的图像进行OCR识别。
8.根据权利要求1-7任一项所述的方法,所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向,拍摄角度,光线,提醒用户对目标试题所在区域进行聚焦。
9.一种匹配目标试题答案的装置,包括:
获取模块,用于获取包含目标试题的图像;
判断模块,用于根据一个或多个图像指标判断所述包含目标试题的图像是否符合识别要求;
预处理模块,用于当所述包含目标试题的图像满足所述识别要求时,对所述图像做预处理,否则,发出重新获取包含目标试题的图像的提示信息;
查找模块,用于根据预处理后的图像查找对应的试题答案。
10.根据权利要求9所述的装置,所述判断模块进一步包括:
分析单元,用于对所述包含目标试题的图像进行质量分析,得到该图像的拍摄角度值、图像分辨率值、亮度值、和/或对比度值;
比对单元,用于分别将所述拍摄角度值、图像分辨率值、亮度值、和/或对比度值与对应的预设阈值范围进行比对;
判断单元,用于根据比对结果判断所述包含目标试题的图像是否符合识别要求。
CN201410166705.0A 2014-04-23 2014-04-23 匹配目标试题答案的方法和装置 Pending CN103927552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410166705.0A CN103927552A (zh) 2014-04-23 2014-04-23 匹配目标试题答案的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410166705.0A CN103927552A (zh) 2014-04-23 2014-04-23 匹配目标试题答案的方法和装置

Publications (1)

Publication Number Publication Date
CN103927552A true CN103927552A (zh) 2014-07-16

Family

ID=51145768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410166705.0A Pending CN103927552A (zh) 2014-04-23 2014-04-23 匹配目标试题答案的方法和装置

Country Status (1)

Country Link
CN (1) CN103927552A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636742A (zh) * 2015-02-16 2015-05-20 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法及设备
CN104715253A (zh) * 2015-04-02 2015-06-17 北京贞观雨科技有限公司 一种获取试题解析信息的方法及服务器
CN104881641A (zh) * 2015-05-18 2015-09-02 上海交通大学 基于移动设备的问卷和表格数字化识别方法及系统
CN105677872A (zh) * 2016-01-08 2016-06-15 广东小天才科技有限公司 一种题目搜索方法、题目搜索装置及学习设备
CN105869464A (zh) * 2016-06-24 2016-08-17 苏州美丽澄电子技术有限公司 摄像式家教机器人
CN105956078A (zh) * 2016-04-29 2016-09-21 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置
CN105975552A (zh) * 2016-04-29 2016-09-28 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置
CN106295514A (zh) * 2016-07-27 2017-01-04 中山市读书郎电子有限公司 一种图像识别题目显示答案的方法及装置
CN107301025A (zh) * 2017-06-13 2017-10-27 南京窝趣买网络科技有限公司 一种基于移动终端拍照的复印方法及系统
CN107463681A (zh) * 2017-08-08 2017-12-12 广东小天才科技有限公司 一种待搜题目的识别方法及装置
CN108122269A (zh) * 2016-11-28 2018-06-05 英业达科技有限公司 基于试卷图像的试题生成系统及其方法
CN108280171A (zh) * 2018-01-19 2018-07-13 广东小天才科技有限公司 一种基于手持拍照设备的搜题方法及系统
CN108551420A (zh) * 2018-04-08 2018-09-18 北京灵犀微光科技有限公司 增强现实设备及其信息处理方法
CN108932508A (zh) * 2018-08-13 2018-12-04 杭州大拿科技股份有限公司 一种题目智能识别、批改的方法和系统
CN109272006A (zh) * 2017-07-18 2019-01-25 北京柯斯元科技有限公司 随机纹理防伪标识图案判定系统及判定方法
CN109670042A (zh) * 2018-12-04 2019-04-23 广东宜教通教育有限公司 一种基于递归神经网络的试题分类及难度分级方法
WO2019100814A1 (zh) * 2017-11-24 2019-05-31 阿里巴巴集团控股有限公司 辅助物品的图像合规的方法、装置和电子设备
CN110084099A (zh) * 2019-03-14 2019-08-02 北京暄暄科技有限公司 基于图像识别技术的信息反馈方法和系统
CN111341161A (zh) * 2020-04-22 2020-06-26 咸阳职业技术学院 一种数学思维训练的数学教具
CN111738198A (zh) * 2020-06-30 2020-10-02 上海松鼠课堂人工智能科技有限公司 智能速算系统及方法
CN112165579A (zh) * 2020-10-10 2021-01-01 北京明略昭辉科技有限公司 一种规范拍摄方法、系统、计算机设备及存储介质
CN114554086A (zh) * 2022-02-10 2022-05-27 支付宝(杭州)信息技术有限公司 一种辅助拍摄方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1804858A (zh) * 2005-01-10 2006-07-19 赵国成 一种用于带摄像装置的移动终端上实现ocr功能的新型辅助定位技术
US20070036469A1 (en) * 2005-06-20 2007-02-15 Samsung Electronics Co., Ltd. Method and system for providing image-related information to user, and mobile terminal therefor
CN101770569A (zh) * 2008-12-31 2010-07-07 汉王科技股份有限公司 基于ocr的菜名识别方法
CN103678637A (zh) * 2013-12-19 2014-03-26 北京快乐学网络科技有限公司 一种获取试题信息的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1804858A (zh) * 2005-01-10 2006-07-19 赵国成 一种用于带摄像装置的移动终端上实现ocr功能的新型辅助定位技术
US20070036469A1 (en) * 2005-06-20 2007-02-15 Samsung Electronics Co., Ltd. Method and system for providing image-related information to user, and mobile terminal therefor
CN101770569A (zh) * 2008-12-31 2010-07-07 汉王科技股份有限公司 基于ocr的菜名识别方法
CN103678637A (zh) * 2013-12-19 2014-03-26 北京快乐学网络科技有限公司 一种获取试题信息的方法及装置

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636742B (zh) * 2015-02-16 2017-12-15 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法
CN104636742A (zh) * 2015-02-16 2015-05-20 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法及设备
CN104715253A (zh) * 2015-04-02 2015-06-17 北京贞观雨科技有限公司 一种获取试题解析信息的方法及服务器
CN104881641A (zh) * 2015-05-18 2015-09-02 上海交通大学 基于移动设备的问卷和表格数字化识别方法及系统
CN104881641B (zh) * 2015-05-18 2019-01-25 上海交通大学 基于移动设备的问卷和表格数字化识别方法及系统
CN105677872A (zh) * 2016-01-08 2016-06-15 广东小天才科技有限公司 一种题目搜索方法、题目搜索装置及学习设备
CN105677872B (zh) * 2016-01-08 2019-04-19 广东小天才科技有限公司 一种题目搜索方法、题目搜索装置及学习设备
CN105956078A (zh) * 2016-04-29 2016-09-21 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置
CN105975552A (zh) * 2016-04-29 2016-09-28 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置
CN105869464A (zh) * 2016-06-24 2016-08-17 苏州美丽澄电子技术有限公司 摄像式家教机器人
CN106295514A (zh) * 2016-07-27 2017-01-04 中山市读书郎电子有限公司 一种图像识别题目显示答案的方法及装置
CN108122269A (zh) * 2016-11-28 2018-06-05 英业达科技有限公司 基于试卷图像的试题生成系统及其方法
CN107301025A (zh) * 2017-06-13 2017-10-27 南京窝趣买网络科技有限公司 一种基于移动终端拍照的复印方法及系统
CN107301025B (zh) * 2017-06-13 2019-12-31 南京窝趣买网络科技有限公司 一种基于移动终端拍照的复印方法及系统
CN109272006A (zh) * 2017-07-18 2019-01-25 北京柯斯元科技有限公司 随机纹理防伪标识图案判定系统及判定方法
CN107463681A (zh) * 2017-08-08 2017-12-12 广东小天才科技有限公司 一种待搜题目的识别方法及装置
WO2019100814A1 (zh) * 2017-11-24 2019-05-31 阿里巴巴集团控股有限公司 辅助物品的图像合规的方法、装置和电子设备
CN108280171A (zh) * 2018-01-19 2018-07-13 广东小天才科技有限公司 一种基于手持拍照设备的搜题方法及系统
CN108551420A (zh) * 2018-04-08 2018-09-18 北京灵犀微光科技有限公司 增强现实设备及其信息处理方法
CN108932508A (zh) * 2018-08-13 2018-12-04 杭州大拿科技股份有限公司 一种题目智能识别、批改的方法和系统
US11508251B2 (en) 2018-08-13 2022-11-22 Hangzhou Dana Technology Inc. Method and system for intelligent identification and correction of questions
CN109670042A (zh) * 2018-12-04 2019-04-23 广东宜教通教育有限公司 一种基于递归神经网络的试题分类及难度分级方法
CN110084099A (zh) * 2019-03-14 2019-08-02 北京暄暄科技有限公司 基于图像识别技术的信息反馈方法和系统
CN111341161A (zh) * 2020-04-22 2020-06-26 咸阳职业技术学院 一种数学思维训练的数学教具
CN111738198A (zh) * 2020-06-30 2020-10-02 上海松鼠课堂人工智能科技有限公司 智能速算系统及方法
CN112165579A (zh) * 2020-10-10 2021-01-01 北京明略昭辉科技有限公司 一种规范拍摄方法、系统、计算机设备及存储介质
CN114554086A (zh) * 2022-02-10 2022-05-27 支付宝(杭州)信息技术有限公司 一种辅助拍摄方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN103927552A (zh) 匹配目标试题答案的方法和装置
CN103914567A (zh) 匹配目标试题答案的方法和装置
KR102056822B1 (ko) 학습 서비스 제공 방법 및 그 장치
US11030477B2 (en) Image quality assessment and improvement for performing optical character recognition
US20180109484A1 (en) Generating a Conversation in a Social Network Based on Mixed Media Object Context
US10867171B1 (en) Systems and methods for machine learning based content extraction from document images
US20200004815A1 (en) Text entity detection and recognition from images
CN112347244B (zh) 基于混合特征分析的涉黄、涉赌网站检测方法
KR102569517B1 (ko) 번역 방법, 장치 및 전자 기기
CN106095918B (zh) 一种基于ocr技术的网络受保护指数数据的获取方法
CN1737822A (zh) 用于照相机获得的文件的低分辨率光学字符识别
Sidhwa et al. Text extraction from bills and invoices
CN112115907A (zh) 固定版面证件结构化信息提取方法、装置、设备及介质
Wu et al. STR transformer: a cross-domain transformer for scene text recognition
CN113221718B (zh) 公式识别方法、装置、存储介质和电子设备
Kumar et al. A technique for human upper body parts movement tracking
Nguyen et al. A brief review of state-of-the-art object detectors on benchmark document images datasets
Lech et al. Prediction of the optical character recognition accuracy based on the combined assessment of image binarization results
US20230229292A1 (en) Restoring full online documents from scanned paper fragments
Ovodov Optical Braille recognition using object detection CNN
Azid et al. Translation Russian cyrillic to latin alphabet using SVM (support vector machine)
US20220253503A1 (en) Generating interactive screenshot based on a static screenshot
US10095802B2 (en) Methods and systems for using field characteristics to index, search for, and retrieve forms
Babadi et al. Novel grid-based optical braille conversion: from scanning to wording
Li et al. A platform for creating Smartphone apps to enhance Chinese learning using augmented reality

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140716

RJ01 Rejection of invention patent application after publication