CN112860845A - 一种试题检索方法、装置、电子设备及存储介质 - Google Patents
一种试题检索方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112860845A CN112860845A CN202110061212.0A CN202110061212A CN112860845A CN 112860845 A CN112860845 A CN 112860845A CN 202110061212 A CN202110061212 A CN 202110061212A CN 112860845 A CN112860845 A CN 112860845A
- Authority
- CN
- China
- Prior art keywords
- test question
- question
- text content
- original
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 312
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000007619 statistical method Methods 0.000 claims description 12
- 230000003287 optical effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000012015 optical character recognition Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Educational Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种试题检索方法、装置、电子设备及存储介质,该方法包括:获取用户的原始试题图片信息;对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;基于所述题眼,在试题库中进行检索,得到目标试题。本公开实施例,可以节省录入试题的时间和人力成本,提高了效率。
Description
技术领域
本公开涉及互联网教育技术领域,具体而言,涉及一种试题检索方法、装置、电子设备及存储介质。
背景技术
随着网络以及科学技术的发展,人们的学习方式越来越多样化,也越来越便捷,其中在线学习成为人们一种重要的学习方式。目前,针对线上教学,教师在课前准备教案备课时,需要用到试题的电子文档,而试题的来源多数是老师的手写内容,因此,需要提炼试题的关键字,并手动输入到试题库进行检索,得到相应的目标试题。然而,该方法由于主要依靠人工输入,导致试题检索的效率较低。
发明内容
本公开实施例至少提供一种试题检索方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例提供了一种试题检索方法,包括:
获取用户的原始试题图片信息;
对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;
基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;
基于所述题眼,在试题库中进行检索,得到目标试题。
本公开实施例中,通过获取用户的原始试题图片信息,对原始试题图片信息进行检测识别,得到原始试题图片信息对应的文本内容,然后基于预设的算法对文本内容进行分析处理,得到原始试题的题眼,进而基于题眼,在试题库中进行检索,得到目标试题,相较于现有技术,避免了人工手动输入试题的关键字的过程,节省人工录入试题关键字的时间,提高了试题的检索效率。
根据第一方面,在一种可能的实施方式中,所述对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容,包括:
基于光学字符识别技术,对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容。
本公开实施例中,通过光学字符识别技术实现对原始试题图片信息的检测识别,进而得到原始试题图片信息对应的文本内容,避免了手动输入的过程,提高了试题的输入效率。
根据第一方面,在一种可能的实施方式中,所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼之前,所述方法还包括:
将所述文本内容进行输出显示;
响应用户针对所述文本内容的操作,得到修改后的文本内容;
所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼,包括:
基于预设的算法对所述修改后的文本内容进行分析处理,得到所述原始试题的题眼。
本公开实施例中,在对文本内容分析处理之前,将所述文本内容进行输出显示,再响应用户针对所述文本内容的操作,得到修改后的文本内容,如此,使得得到的文本内容更加符合用户的需求,提高了目标试题检索的准确率。
根据第一方面,在一种可能的实施方式中,所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼之后,所述方法还包括:
将所述题眼进行输出显示;
响应用户针对所述题眼的操作,得到修改后的题眼;
所述基于所述题眼,在试题库中进行检索,得到目标试题,包括:
基于所述修改后的题眼,在试题库中进行检索,得到目标试题。
本公开实施例中,在得到所述原始试题的题眼之后,将所述题眼进行输出显示,再响应用户针对所述题眼的操作,得到修改后的题眼,如此,可以提高目标试题检索的准确率。此外,由于用户只需对题眼进行阅览及修改,节省了用户的工作量,进一步提高了目标试题的检索效率。
根据第一方面,在一种可能的实施方式中,所述基于所述题眼,在试题库中进行检索,得到目标试题,包括:
基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题;所述多个目标试题与所述原始试题的相似度大于预设阈值。
本公开实施例中,在基于所述题眼,在所述试题库中进行检索时,可以得到若干相关试题,而若要将该若干试题均呈现给用户,将导致用户花费较多的时间对检索结果进行筛选,而若只将相似度大于预设阈值的目标试题作为检索结果,则可以在提高目标试题的准确度的同时,节省用户阅览目标试题的时间。
根据第一方面,在一种可能的实施方式中,基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题之后,所述方法还包括:
根据历史检索记录以及当前检索结果,对所述试题库的试题相关信息进行统计分析,并根据统计分析结果对所述试题库的试题相关信息进行更新;所述试题相关信息包括以下多种:时间、地域、学段、学科、知识点、题型。
本公开实施例中,通过根据历史检索记录以及当前检索结果,对试题库的试题相关信息进行统计分析,并根据统计分析结果对所述试题库的试题相关信息进行更新,如此,可以使得用户及时了解到当前原始试题的知识点的状态以便为用户下一次检索试题给出相应的指示。
第二方面,本公开实施例还提供一种试题检索装置,包括:
获取模块,用于获取用户的原始试题图片信息;
识别模块,用于对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;
分析模块,用于基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;
检索模块,用于基于所述题眼,在试题库中进行检索,得到目标试题。
根据第二方面,在一种可能的实施方式中,所述识别模块具体用于:
基于光学字符识别技术,对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容。
根据第二方面,在一种可能的实施方式中,所述装置还包括:
修改模块,用于将所述文本内容进行输出显示;
响应用户针对所述文本内容的操作,得到修改后的文本内容;
所述分析模块具体用于:
基于预设的算法对所述修改后的文本内容进行分析处理,得到所述原始试题的题眼。
根据第二方面,在一种可能的实施方式中,所述修改模块还用于:
将所述题眼进行输出显示;
响应用户针对所述题眼的操作,得到修改后的题眼;
所述检索模块还用于:
基于所述修改后的题眼,在试题库中进行检索,得到目标试题。
根据第二方面,在一种可能的实施方式中,所述检索模块具体用于:
基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题;所述多个目标试题与所述原始试题的相似度大于预设阈值。
根据第二方面,在一种可能的实施方式中,所述装置还包括:
统计模块,用于根据历史检索记录以及当前检索结果,对所述试题库的试题相关信息进行统计分析,并根据统计分析结果对所述试题库的试题相关信息进行更新;所述试题相关信息包括时间、地域、学段、学科、知识点、题型。
第三方面,本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中所述的试题检索方法的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中所述的试题检索方法的步骤。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种试题检索方法的示例性系统架构图;
图2示出了本公开实施例所提供的第一种试题检索方法的流程图;
图3示出了本公开实施例所提供的一种将原始试题图片转换成对应文本内容的示意图;
图4示出了本公开实施例所提供的一种对文本内容分析处理过程的示意图;
图5示出了本公开实施例所提供的第二种试题检索方法的流程图;
图6示出了本公开实施例所提供的第三种试题检索方法的流程图;
图7示出了本公开实施例所提供的一种试题检索装置的结构示意图;
图8示出了本公开实施例所提供的另一种试题检索装置的结构示意图;
图9示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
随着网络以及科学技术的发展,人们的学习方式越来越多样化,也越来越便捷,其中在线学习成为人们一种重要的学习方式。
经研究发现,目前,针对线上教学,教师在课前准备教案备课时,需要用到试题的电子文档,而试题的来源多数是老师的手写内容,因此,需要提炼试题的关键字,并手动输入到试题库进行检索,得到相应的目标试题。然而,该方法由于主要依靠人工输入,导致试题检索的效率较低。
基于上述研究,本公开提供了一种试题检索方法,该方法通过获取用户的原始试题图片信息,对原始试题图片信息进行检测识别,得到原始试题图片信息对应的文本内容,然后基于预设的算法对文本内容进行分析处理,得到原始试题的题眼,进而基于题眼,在试题库中进行检索,得到目标试题,相较于现有技术,避免了人工手动输入试题的关键字的过程,节省人工录入试题关键字的时间,提高了试题的检索效率。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种试题检索方法进行详细介绍,本公开实施例所提供的试题检索方法的执行主体一般为具有一定计算能力的电子设备,该电子设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为移动设备、用户终端、终端、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该试题检索方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面结合具体的系统应用架构对本申请方案进行详细说明。
请参阅图1,图1示出了可以应用于本申请的试题检索方法的示例性系统架构。
如图1所示,系统架构1000可以包括服务器100、教师端200以及多个学生端300。其中,教师端200与服务器100之间,以及服务器100和多个学生端300之间通过网络400建立通信连接。也即,网络400用于在教师端200和学生端300之间提供通信链路的介质。网络400可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(Wireless-Fidelity,Wi-Fi)通信链路或微波通信链路等。
教师端200以及学生端300可以通过网络400与服务器100交互,以接收来自服务器100的消息或向服务器100发送消息。教师端200和学生端300上可以安装有各种通信客户端应用,例如:绘图应用、视频录制应用、视频播放应用、语音采集应用、语音交互应用、搜索类应用、及时通信工具、邮箱客户端以及社交平台软件等。
教师端200和学生端300可以是硬件,也可以是软件。当教师端200和学生端300为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携式计算机和台式计算机等。用户可以利用教师端200和学生端300上的显示屏来查看显示的文字、图片、视频等信息。当教师端200和学生端300为软件时,可以是安装在上述所列举的电子设备中,其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
服务器100可以是提供各种服务的业务服务器。需要说明的是,服务器100可以是硬件,也可以是软件。当服务器100为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器100为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
应理解,图1中的教师端200、学生端300、服务器100和网络400的数目仅是示意性的。根据实现需要,可以是任意数量的教师端、学生端、服务器和网络。
基于上述系统架构,教师在进行在线教学时,教师可以通过教师端200进行授课,并基于对教师端200的操作而向学生端300下发相应的指令,比如,将与学习内容相关的试题发送至所述多个学生端。学生可以通过学生端300看到教学课件、相应的试题以及教师讲课的视频。
本实施方式中,用户可以在线上教学之间,基于教师端200进行试题的检索,并根据检索到的试题准备相应的教案,然后基于上述系统架构以及准备好的教案进行线上教学。
可以理解,在线教学与实体教学相似,服务器可以建立一个虚拟教室,每个教室连接一个教师端以及若干学生端,因此教师端发出的内容可以被发送至该虚拟教室中的所有学生端。
参见图2所示,为本公开实施例所提供的第一种试题检索方法的流程图,其中,该方法可以应用于上述电子设备中,或应用于本地或云端的服务器中。图1所示的试题检索方法包括以下S101~S104:
S101,获取用户的原始试题图片信息。
本实施方式中,用户是指教师,其他实施方式中,用户还可以是培训师、讲师等,在此不做限定。原始试题是指用户基于教学内容而创作的试题,例如,原始试题可以是用户记录于题纸上的试题、或者在书本上看到的试题等。
具体地,终端设备可以通过摄像头对用户的原始试题进行拍照从而获取原始试题图片信息,也可以通过对用户的原始试题进行扫描的方式获取原始试题的图片信息。一些实施方式中,还可以从其它设备主动或被动地获取包含原始试题的图片信息,当然,也可以从图像库中获取包含原始试题的图片信息,在此不作限定。
S102,对原始试题图片信息进行检测识别,得到原始试题图片信息对应的文本内容。
在一些实施方式中,在获取到原始试题的图片信息后,可以对该原始试题的图片进行文本识别。具体地,可以采用光学字符识别(OCR,Optical Character Recognition)技术,对原始试题图片信息进行检测识别,得到原始试题图片信息对应的文本内容。当然,在其他实施方式中,也可以采用其它文本识别技术对原始试题图片信息进行检测识别,在此不作限定。
其中,光学字符识别技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
示例地,参见图3所示,为一张试题拍摄的图片转换成文本内容的过程示意图,通过OCR技术识别试题图片信息,经过精准的自动分析,获取试题图片相对应的文本内容,如此,避免了手动输入的过程,提高了试题的输入效率。
S103,基于预设的算法对文本内容进行分析处理,得到原始试题的题眼。
示例地,针对通过OCR技术识别出来的原始试题图片信息对应的文本内容,利用了计算机算法(比如NLP分词算法)对文本内容进行分析处理,得到试题的题眼。其中,题眼是指试题的重点,表达试题的意义,或决定试题内容的关键词语。
示例地,参见图4所示,为基于预设的算法将文本内容进行分析处理过程的前后对比示意图,可以理解,OCR技术识别出来的文本信息是试题图片中所包含的所有文字信息,而我们需要的只是其中试题内容的部分,也即试题的关键信息,这个过程可以通过计算机的算法进行分析处理得以实现。如此,通过解析和提炼试题的关键信息,降低了处理过程的复杂程度,提高了试题检索的精准度。
S104,基于题眼,在试题库中进行检索,得到目标试题。
其中,试题库包括本地的试题库,也包括互联网上的试题库。本地试题库可以为教师端中内置的试题库,也可以是用户经由互联网下载至教师端中的试题库,以此方便用户在联网环境下能够下载所需试题库,并能够在离线环境下访问下载好的试题库,此处不做限定。
在一些实施方式中,所述基于题眼,在试题库中进行检索,得到目标试题,包括:基于题眼,在试题库中进行检索,得到与原始试题相应的多个目标试题;多个目标试题与原始试题的相似度大于预设阈值(可灵活设定,例如可为50%、80%、90%等)。
在一些可能的实施方式中,用户还可以指学生、学员或者家长等,只要是具有试题检索需求的人,都可以作为本申请中的用户,例如,当用户为学生时,假设学生在做题的过程中,发现一个题目不会做,即可通过本申请涉及的检索方法,从题库中进行检索,以得到类似题目的参考答案以及解答思路,从而得到当前题目的解答启示,对此不做赘述。
在本发明实施例中,步骤S104最终获得的试题搜索结果的数量是无法确定的。当用户搜索的目标试题较为常见时,步骤S104可能会出现检索到的试题搜索结果很多,也可以将前N个(N为大于等于1的整数)试题搜索结果展示出来,作为目标题目;当用户搜索的目标试题较为新颖时,步骤S104可能会出现检索到的试题搜索结果很少,甚至没有的情况。针对获取的试题搜索结果数量不同,存在以下几种应用场景:
在第一种应用场景中,步骤S104没有获取到任何与目标试题相匹配的试题搜索结果。此时,直接输出无搜索结果的信息,以此告知用户,无法在已有试题库中搜索到与目标试题相匹配的题目。此时,该方法还可以包括将原始试题保存在题库中,并对该原始试题进行解答和完善,以将原始试题和相应的参考答案和解答思路都更新至题库中。需要说明的是,参考答案和解答思路也可通过图片方式上传并解析,也可直接输入,对此不做任何限定。
另外,在讲原始试题以及相应的参考答案和解答思路上传至题库之后,还可接收用户针对上传内容的编辑,例如排版、字体修改、补充等,对此不做赘述。
在第二种应用场景中,步骤S104只获取到一个试题搜索结果。此时,直接将获取到的上述一个试题搜索结果反馈给用户,供用户查阅。
在第三种应用场景中,步骤S104获取到多个试题搜索结果,而此时我们只需要输出那些相似度比较高的试题即可,例如,所述预设阈值可以是80%,也可以是90%,在此不做限定,然后将相似度较高的目标试题输出即可。如此,可以在提高目标试题的准确度的同时,节省用户阅览目标试题的时间。当然,也可根据前文,输出前N个试题搜索结果作为目标试题,对此不做任何限定。
本公开实施例中,避免了人工手动输入试题的关键字的过程,节省人工录入试题关键字的时间,提高了试题的检索效率。
参见图5所示,为本公开提供的第二种试题检索方法的流程图,与图2中的试题检索方法不同的是,本实施方式中,试题检索方法在步骤S104之后还包括:
S105,根据历史检索记录以及当前检索结果,对试题库的试题相关信息进行统计分析,并根据统计分析结果对试题库的试题相关信息进行更新;所述试题相关信息包括以下多种:时间、地域、学段、学科、知识点、题型。
示例地,为了使得用户了解当前试题库的相关试题信息,以为教师出题给出相应的提示,还可以根据历史检索记录以及当前检索结果试题库的试题相关信息进行统计分析,并根据统计分析结果对试题库的试题相关信息进行更新,其中该试题相关信息包括但不限于时间、地域、学段、学科、知识点、题型等。
其中,时间为试题所对应的命题年份(比如历年考试的真题所对应的年份),此时可以统计出与目标试题相关的试题搜索结果中,各个试题结果时间分布的情况,以便用户下一次检索试题给出的时间指示。
相对应的,地域为试题所对应的命题区域(比如全国各地的真题),此时用户在搜索试题时,可以以地域作为统计的一个维度,统计各个试题结果地域分布的情况,以便用户下一次检索试题给出的地域指示。
而针对学段,现实情况中,对于某一个知识点,往往在学习了这个知识点的学段,出题数目最为集中,而其他学段对该知识点是不会着重考察的,因而也设置了对于出题学段的统计。
同时,学科也是一个重要维度。每一个试题都有其所属的学科,但由于实际学习中,知识是交叉的,因此某些知识点可能会在多个学科中都出现。此时设置学科作为其中一个统计维度,在对搜索到的所有试题结果进行了学科统计,以便用户下一次检索试题给出的学科指示。
另外,知识点和题型同样是重要维度。比如,对于某一知识点,可能出选择题比较合适,而对于另一些知识点,则出填空题或者判断题比较合适,因此,通过对知识点和相应的题型进行统计分析后,可以为用户后续出题给出相应的指示信息。
可选地,可以根据实际需求选择使用以上几种维度中的多个进行统计。
参见图6所示,为本公开提供的第三种试题检索方法的流程图,该方法包括以下S201~S206:
S201,获取用户的原始试题图片信息。
该步骤与图2中的步骤S101类似,在此不再赘述。
S202,对原始试题图片信息进行检测识别,得到原始试题图片信息对应的文本内容。
该步骤与图2中的步骤S102类似,在此不再赘述。
S203,将文本内容进行输出显示。
S204,响应用户针对文本内容的操作,得到修改后的文本内容。
示例地,如图3所示,将OCR技术识别后的文本内容显示在可编辑的方框中,此时用户可以根据自己的实际需求进行修改,从而得到修改后的文本内容,将传统的文本检索方式和OCR识别技术相结合,如此,让检索方式更灵活。
S205,基于预设的算法对修改后的文本内容进行分析处理,得到原始试题的题眼。
该步骤与图2中的步骤S103类似,在此不再赘述。
S206,基于题眼,在试题库中进行检索,得到目标试题。
该步骤与图2中的步骤S104类似,在此不再赘述。
本公开实施例中,在对文本内容分析处理之前,将所述文本内容进行输出显示,再响应用户针对所述文本内容的操作,得到修改后的文本内容,如此,使得得到的文本内容更加符合用户的需求,提高了目标试题检索的准确率。
可以理解,在一些实施方式中,还可以在基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼之后,
将所述题眼进行输出显示;
响应用户针对所述题眼的操作,得到修改后的题眼;
然后基于所述修改后的题眼,在试题库中进行检索,得到目标试题。
示例地,如图4所示,将经过算法处理后的题眼显示在可编辑的方框中,此时用户仍可以根据自己的实际需求进行修改,从而得到修改后的题眼,再将修改后的题眼进行检索,得到用户需求的试题,如此,可以弥补算法分析处理可能存在的不足。
本公开实施例中,在得到所述原始试题的题眼之后,将所述题眼进行输出显示,再响应用户针对所述题眼的操作,得到修改后的题眼,如此,可以提高目标试题检索的准确率。此外,由于用户只需对题眼进行阅览及修改,节省了用户的工作量,进一步提高了目标试题的检索效率。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一技术构思,本公开实施例中还提供了与试题检索方法对应的试题检索装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述试题检索方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图7所示,为本公开实施例提供的一种试题检索装置的结构示意图,所述装置500包括:
获取模块501,用于获取用户的原始试题图片信息;
识别模块502,用于对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;
分析模块503,用于基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;
检索模块504,用于基于所述题眼,在试题库中进行检索,得到目标试题。
在一种可能的实施方式中,所述识别模块502具体用于:
基于光学字符识别技术,对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容。
参见图8所示,为本公开实施例提供的另一种试题检索装置的结构示意图,在一种可能的实施方式中,所述装置500还包括:
修改模块505,用于将所述文本内容进行输出显示,并响应用户针对所述文本内容的操作,得到修改后的文本内容;
所述分析模块503具体用于:
基于预设的算法对所述修改后的文本内容进行分析处理,得到所述原始试题的题眼。
在一种可能的实施方式中,所述修改模块505还用于:
将所述题眼进行输出显示,并响应用户针对所述题眼的操作,得到修改后的题眼;
所述检索模块504具体用于:
基于所述修改后的题眼,在试题库中进行检索,得到目标试题。
在一种可能的实施方式中,所述检索模块504具体用于:
基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题;所述多个目标试题与所述原始试题的相似度大于预设阈值。
在一种可能的实施方式中,所述装置500还包括:
统计模块506,用于根据历史检索记录以及当前检索结果,对所述试题库的试题相关信息进行统计分析,并根据统计分析结果对所述试题库的试题相关信息进行更新;所述试题相关信息包括时间、地域、学段、学科、知识点、题型。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本公开实施例还提供了一种电子设备。参照图9所示,为本公开实施例提供的电子设备700的结构示意图,包括处理器701、存储器702、和总线703。其中,存储器702用于存储执行指令,包括内存7021和外部存储器7022;这里的内存7021也称内存储器,用于暂时存放处理器701中的运算数据,以及与硬盘等外部存储器7022交换的数据,处理器701通过内存7021与外部存储器7022进行数据交换。
本申请实施例中,存储器702具体用于存储执行本申请方案的应用程序代码,并由处理器701来控制执行。也即,当电子设备700运行时,处理器701与存储器702之间通过总线703通信,使得处理器701执行存储器702中存储的应用程序代码,进而执行前述任一实施例中所揭示的方法。
其中,存储器702可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器701可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备700的具体限定。在本申请另一些实施例中,电子设备700可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中的试题检索方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中的试题检索方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种试题检索方法,其特征在于,包括:
获取用户的原始试题图片信息;
对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;
基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;
基于所述题眼,在试题库中进行检索,得到目标试题。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容,包括:
基于光学字符识别技术,对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容。
3.根据权利要求1或2所述的方法,其特征在于,所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼之前,所述方法还包括:
将所述文本内容进行输出显示;
响应用户针对所述文本内容的操作,得到修改后的文本内容;
所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼,包括:
基于预设的算法对所述修改后的文本内容进行分析处理,得到所述原始试题的题眼。
4.根据权利要求1或2所述的方法,其特征在于,所述基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼之后,所述方法还包括:
将所述题眼进行输出显示;
响应用户针对所述题眼的操作,得到修改后的题眼;
所述基于所述题眼,在试题库中进行检索,得到目标试题,包括:
基于所述修改后的题眼,在试题库中进行检索,得到目标试题。
5.根据权利要求1-4任一所述的方法,其特征在于,所述基于所述题眼,在试题库中进行检索,得到目标试题,包括:
基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题;所述多个目标试题与所述原始试题的相似度大于预设阈值。
6.根据权利要求5所述的方法,其特征在于,基于所述题眼,在所述试题库中进行检索,得到与所述原始试题相应的多个目标试题之后,所述方法还包括:
根据历史检索记录以及当前检索结果,对所述试题库的试题相关信息进行统计分析,并根据统计分析结果对所述试题库的试题相关信息进行更新。
7.根据权利要求6所述的方法,其特征在于,所述试题相关信息包括以下多种:
时间、地域、学段、学科、知识点、题型。
8.一种试题检索装置,其特征在于,包括:
获取模块,用于获取用户的原始试题图片信息;
识别模块,用于对所述原始试题图片信息进行检测识别,得到所述原始试题图片信息对应的文本内容;
分析模块,用于基于预设的算法对所述文本内容进行分析处理,得到所述原始试题的题眼;
检索模块,用于基于所述题眼,在试题库中进行检索,得到目标试题。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的试题检索方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任意一项所述的试题检索方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020115500180 | 2020-12-24 | ||
CN202011550018 | 2020-12-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112860845A true CN112860845A (zh) | 2021-05-28 |
Family
ID=76006259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110061212.0A Withdrawn CN112860845A (zh) | 2020-12-24 | 2021-01-18 | 一种试题检索方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112860845A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673475A (zh) * | 2021-09-01 | 2021-11-19 | 北京云蝶智学科技有限公司 | 基于图像信息的答题方法 |
CN113705706A (zh) * | 2021-09-01 | 2021-11-26 | 北京云蝶智学科技有限公司 | 基于图像识别的数据分类方法 |
CN114357116A (zh) * | 2022-01-10 | 2022-04-15 | 北京高途云集教育科技有限公司 | 一种题搜索方法、装置、设备以及存储介质 |
-
2021
- 2021-01-18 CN CN202110061212.0A patent/CN112860845A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673475A (zh) * | 2021-09-01 | 2021-11-19 | 北京云蝶智学科技有限公司 | 基于图像信息的答题方法 |
CN113705706A (zh) * | 2021-09-01 | 2021-11-26 | 北京云蝶智学科技有限公司 | 基于图像识别的数据分类方法 |
CN114357116A (zh) * | 2022-01-10 | 2022-04-15 | 北京高途云集教育科技有限公司 | 一种题搜索方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11790641B2 (en) | Answer evaluation method, answer evaluation system, electronic device, and medium | |
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
CN112860845A (zh) | 一种试题检索方法、装置、电子设备及存储介质 | |
KR20190142288A (ko) | 학습 컨텐츠 생성 방법 | |
CN111144079B (zh) | 一种智能获取学习资源的方法、装置、打印机和存储介质 | |
CN113343972A (zh) | 一种阅卷方法、装置、电子设备及存储介质 | |
Stover et al. | The authorship of the historia augusta: two new computational studies | |
CN112783825B (zh) | 数据归档方法、装置、计算机装置及存储介质 | |
CN110750624A (zh) | 信息输出方法及装置 | |
CN116303871A (zh) | 练习册批阅方法 | |
CN112149680A (zh) | 错字检测识别方法、装置、电子设备及存储介质 | |
CN107430824B (zh) | 用于评价响应的半自动系统和方法 | |
CN115050039A (zh) | 自动化试卷分析方法、系统、电子设备、存储介质 | |
CN110990527A (zh) | 自动问答方法及装置、存储介质及电子设备 | |
CN110852131A (zh) | 一种考试卡的信息采集方法、系统及终端 | |
CN114647682A (zh) | 一种习题整理方法、装置、电子设备以及存储介质 | |
CN114745594A (zh) | 直播回放视频的生成方法、装置、电子设备及存储介质 | |
CN112164262A (zh) | 一种智能阅卷辅导系统 | |
CN112784846A (zh) | 试题录入方法、装置、电子设备及存储介质 | |
CN111241378A (zh) | 教学信息查询方法及装置 | |
CN112784780B (zh) | 一种审阅方法、装置、计算机设备及存储介质 | |
CN112183402B (zh) | 一种信息处理的方法、装置、电子设备及存储介质 | |
CN111046863B (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN114817163A (zh) | 习题分类录入方法、系统及电子设备 | |
CN112364128A (zh) | 一种信息处理的方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210528 |
|
WW01 | Invention patent application withdrawn after publication |