CN116383287A - 一种试题录入方法、装置、设备及可读存储介质 - Google Patents

一种试题录入方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN116383287A
CN116383287A CN202310182232.2A CN202310182232A CN116383287A CN 116383287 A CN116383287 A CN 116383287A CN 202310182232 A CN202310182232 A CN 202310182232A CN 116383287 A CN116383287 A CN 116383287A
Authority
CN
China
Prior art keywords
test question
data
attribute data
attribute
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310182232.2A
Other languages
English (en)
Inventor
阳焕坤
黄武
史碧松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN SEA SKY LAND TECHNOLOGY CO LTD
Original Assignee
SHENZHEN SEA SKY LAND TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN SEA SKY LAND TECHNOLOGY CO LTD filed Critical SHENZHEN SEA SKY LAND TECHNOLOGY CO LTD
Priority to CN202310182232.2A priority Critical patent/CN116383287A/zh
Publication of CN116383287A publication Critical patent/CN116383287A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本申请提供了一种试题录入方法、装置、设备及可读存储介质。所述方法包括:解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;其中,试题属性数据包括:段落、图片、公式、表格;根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段;将试题属性数据段封装至试题信息库。通过本申请方案的实施,将预设试题文件中的试题属性数据进行解析,得到相应的试题属性标识,再对该试题属性标识进行解析得到相应的试题属性数据段,最后只需对该试题属性数据段进行封装,从而能够减少录入试题的工作量、提高批量录入试题的效率且能够支持图片、公式、表格等特殊业务场景。

Description

一种试题录入方法、装置、设备及可读存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种试题录入方法、装置、设备及可读存储介质。
背景技术
现行各大考试业务平台针对考试试题中不同题型的录入采取原有的单试题录入,即按照试题属性将试题数据填入对应项之后单独进行保存;或者通过Excel读取导入试题方式,即按照Excel预定制每一个单元格的属性将试题数据填入对应单元格,再通过读取已录入数据的Excel预定制文件,将对应的试题属性数据读取后进行统一批量保存。
其中,单试题录入虽然支持图片、公式、表格等特殊业务场景,但是由于各试题属性录入的复杂度对实际业务来说是相对比较耗时且不够灵活的,在正常业务下组一张试卷的工作量对于操作人员来说也是极大的。
而通过读取导入Excel预定制文件的方式,虽然能够批量导入同一种类型试题,与单试题录入相比业务复杂度较低,但是导入Excel预定制文件的方式支持的试题类型极少,并且不支持图片,公式,表格等特殊业务场景。
在原有的几种传统的录入方式中,并没有考虑到试题灵活的录入,且在高复杂度的录入情况下不能有效降低试题批量录入的时耗,也不能够支持图片、公式、表格等特殊业务场景。
发明内容
本申请的主要目的在于提供一种试题录入方法、装置、设备及可读存储介质,至少能够解决相关技术中试题录入的复杂度较高、效率低且不能支持特殊业务场景的问题。
为实现上述目的,本申请第一方面提供了一种试题录入方法,该方法包括:
解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识;其中,所述试题属性数据包括:段落、图片、公式、表格;
根据试题录入模式对所述试题属性标识进行解析,得到相应的试题属性数据段;其中,所述试题录入模式包括以下任意一种:标准模式、试题答案分离模式,所述试题属性数据段包括以下任意一种:对应于所述标准模式的第一试题属性数据段、对应于所述试题答案分离模式的第二试题属性数据段;
将所述试题属性数据段封装至试题信息库。
本申请第二方面提供了一种试题录入装置,包括:
第一解析模块,用于解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识;其中,所述试题属性数据包括:段落、图片、公式、表格;
第二解析模块,用于根据试题录入模式对所述试题属性标识进行解析,得到相应的试题属性数据段;其中,所述试题录入模式包括以下任意一种:标准模式、试题答案分离模式,所述试题属性数据段包括以下任意一种:对应于所述标准模式的第一试题属性数据段、对应于所述试题答案分离模式的第二试题属性数据段;
封装模块,用于将所述试题属性数据段封装至试题信息库。
本申请第三方面提供了一种电子设备,包括:存储器及处理器,其中,处理器用于执行存储在存储器上的计算机程序,处理器执行计算机程序时,实现上述本申请第一方面提供的试题录入方法中的各步骤。
本申请第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请第一方面提供的试题录入方法中的各步骤。
由上可见,根据本申请方案所提供的试题录入方法、装置、设备及可读存储介质,解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;其中,试题属性数据包括:段落、图片、公式、表格;根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段;其中,试题录入模式包括以下任意一种:标准模式、试题答案分离模式,试题属性数据段包括以下任意一种:对应于标准模式的第一试题属性数据段、对应于试题答案分离模式的第二试题属性数据段;将试题属性数据段封装至试题信息库。通过本申请方案的实施,将预设试题文件中的试题属性数据进行解析,得到相应的试题属性标识,再对该试题属性标识进行解析得到相应的试题属性数据段,最后只需对该试题属性数据段进行封装,从而能够减少录入试题的工作量、提高批量录入试题的效率且能够支持图片、公式、表格等特殊业务场景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请第一实施例提供的试题录入方法的基本流程示意图;
图2为本申请第二实施例提供的试题录入方法的细化流程示意图;
图3为本申请第三实施例提供的一种试题录入装置的模块示意图;
图4为本申请第四实施例提供的电子设备的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了解决相关技术中试题录入复杂度较高、效率低且不能支持特殊业务场景的问题,本申请第一实施例提供了一种试题录入方法,如图1为本实施例提供的试题录入方法的基本流程示意图,该试题录入方法包括以下的步骤:
步骤101、解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识。
具体的,在本实施例中,通过读取以及识别已录入相关数据的试题文件中的试题属性信息,可以得到对应于各试题属性信息的试题属性标识,其中,试题属性数据可以是段落、图片、公式、表格等。
在本实施例一些实施方式中,解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识的步骤,包括:对预设试题文件进行格式转换以及格式提取,得到目标试题文件;解析目标试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识。
具体的,在本实施例中,预设的试题文件可选的为Word文档,在Word文档中编辑好相关试题数据后,先把Word文档转换为Word Zip文件,再进一步提取为Office Open Xml(简称ooxml),通过解析ooxml文档中的试题属性数据例如段落、图片、公式、表格等,得到对应于试题属性数据的标签。
在本实施例另一些实施方式中,解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识的步骤之后,还包括:对试题属性标识进行无效标识去除处理,得到第一目标试题属性标识;当第一目标试题属性标识为HTML不可识别标识时,对第一目标试题属性标识进行格式转换,得到HTML可识别的第二目标试题属性标识的步骤。
具体的,在本实施例中,在得到对应于试题属性数据的试题属性标识之后,还会对一些系统不能识别的标识进行去除,从而得到均可被系统识别的试题属性标识;且在得到均有效的试题属性标识后,对于一些不能被HTML识别的标识,将再进行提取转换处理,例如将解析得到的图片标签进行提取转换为HTML可识别的<img>标签;将解析得到的公式标签进行提取转换为描述数学符号的数学标记语言对应的MathML标签,再次把MathML标签转换为可供HTML渲染的LaTex标签;将解析得到的表格标签进行提取转换为HTML可识别的<img>标签。
步骤102、根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段。
具体的,在本实施例中,针对试题录入的场景,提供了标准模式与试题答案分离模式两种模式。而得到的试题属性数据段可以是以下任意一种:对应于标准模式的第一试题属性数据段、对应于试题答案分离模式的第二试题属性数据段。通过将解析得到无规则的试题属性标签进行重排以及解析处理可以得到可渲染处理对象。本实施可选的采用数据顺序重排列算法对也处理好的无规则数据进行编排。
在本实施例的一些实施方式中,根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:根据试题录入模式对第二目标试题属性标识进行解析,得到相应的试题属性数据段。
具体的,在本实施例中,根据相应的试题录入模式进行处理的对象是有效且均可被HTML识别的试题属性标识。
进一步地,在本实施例一些实施方式中,当试题录入模式为标准模式时,对第二目标试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:基于预设解析算法对第二目标试题属性标识进行解析,得到对应于第二目标试题属性标识的试题行数据;对试题行数据进行分离,得到多个第一试题段数据;基于解析算法对第一试题段数据进行解析,得到第一试题属性数据段;其中,第一试题属性数据段包括以下至少之一:题型、题干、答案、选项、难度、分数。
具体的,在本实施例中,当选择的试题录入模式为标准模式时,可通过正则表达式对试题属性标识进行解析,可提取到对应于该标识的试题行数据,再对各试题行数据进行分离,得到多个试题段数据,最后再通过正则表达式对各试题段数据解析,得到如题型(填空题、选择题)、题干、答案、选项、难度(难题、中等题、容易题)、分数等试题属性数据段。
进一步地,在本实施例另一些实施方式中,当试题录入模式为试题答案分离模式时,对第二目标试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:根据第二目标试题属性标识,分离出试题数据标识与答案数据标识;基于预设解析算法分别对试题数据标识以及答案数据标识进行解析,得到第二试题段数据以及答案段数据;根据预设试题模板合并第二试题段数据与答案段数据,得到第二试题属性数据段。
具体的,在本实施例中,当选择的试题录入模式为试题答案分离模式时,先将得到的目标试题属性标识进行分离,得到对应于试题数据的标识和对应于答案数据的标识;再通过正则表达式解析两种类型对应的标识,得到待处理的试题数据集合答案数据集,再将试题数据集解析为试题段数据,将答案数据集解析为答案段数据,最后将试题段数据与答案段数据按照实际的试题排版样式合并为一个新的试题段数据。其中,第二试题段数据为除答案段数据外的其他数据,试题段数据包括试题段数据集所对应的如题型、题干、选项等的属性数据段,而答案段数据则可包括答案段数据集所对应的如答案等属性数据段。通过试题答案分离模式可以对考试试题中的答案以及其他试题元素分开处理,以满足个性化需求。
再进一步地,在本实施例另一些实施方式中,基于预设算法分别对试题数据标识以及答案数据标识进行解析,得到试题数据段以及答案数据段的步骤之后,还包括:获取答案数据段的特征数据段,并对特征数据段进行合法性检测;当特征数据段符合预设答案文本规则时,执行根据预设试题模板合并试题数据段与答案数据段,得到第二试题属性数据段的步骤。
具体的,在本实施例中,当分离出试题数据标识和答案数据标识并对两类标识进行解析得到试题数据段与答案数据段之后,为了防止分离不完整等差错,还可对分离得到的答案数据段进行合法性检测,提取答案数据段的相关数据段例如表示答案对应的选项A、B、C、D,将这些相关数据段与预先设定的答案文本规则进行匹配,答案文本规则可以是相关数据段的字母应为选项类型如A、B、C、D、E、F之一,或者必须包含答案对应的选项字母等。当检测到答案数据段确实合法后,再对答案数据段进行解析。
步骤103、将试题属性数据段封装至试题信息库。
具体的,在本实施例中,当得到相应的试题属性数据段后,将其进行封装至试题信息库中即可完成录入。
在本实施例一些实施方式中,将试题属性数据段封装至试题信息库的步骤,包括:将对应于试题属性数据段的数据对象封装至对应的试题对象;其中,数据对象包括:试题属性数据段所对应的属性在试题段中的起点索引、终点索引;将试题对象封装至试题信息库。
具体的,在本实施例中,先根据试题属性数据段对相应的数据对象封装后,再对试题对象进行封装,其中,数据对象包括该试题属性数据段所对应的属性在分离得到的试题段中的起点索引、终点索引、数据段节点数据以及数据段解析结果状态。当封装好各属性对象后得到相应的试题对象,将各试题对象封装试题信息库即可完成考试试题的批量录入。
基于上述本申请实施例的技术方案,解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;其中,试题属性数据包括:段落、图片、公式、表格;根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段;其中,试题录入模式包括以下任意一种:标准模式、试题答案分离模式,试题属性数据段包括以下任意一种:对应于标准模式的第一试题属性数据段、对应于试题答案分离模式的第二试题属性数据段;将试题属性数据段封装至试题信息库。通过本申请方案的实施,将预设试题文件中的试题属性数据进行解析,得到相应的试题属性标识,再对该试题属性标识进行解析得到相应的试题属性数据段,最后只需对该试题属性数据段进行封装,从而能够减少录入试题的工作量、提高批量录入试题的效率且能够支持图片、公式、表格等特殊业务场景。
图2中的方法为本申请第二实施例提供的一种细化的试题录入方法,该试题录入方法包括:
步骤201、对预设试题文件进行格式转换以及格式提取,得到目标试题文件。
步骤202、解析目标试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识。
步骤203、对试题属性标识进行无效标识去除处理,得到第一目标试题属性标识。
步骤204、当第一目标试题属性标识为HTML不可识别标识时,对第一目标试题属性标识进行格式转换,得到HTML可识别的第二目标试题属性标识。
步骤205、根据试题录入模式对第二目标试题属性标识进行解析,得到相应的试题属性数据段。
步骤206、将对应于试题属性数据段的数据对象封装至对应的试题对象。
步骤207、将试题对象封装至试题信息库。
具体的,在本实施例中,通过将预设的试题文件如Word文档转换Word Zip文件,并提取为ooxml文档,再解析ooxml文档中的试题属性数据如段落、图片、公式、表格得到对应的试题属性标签。对于HTML不可识别的试题属性标签,还进行转换处理,如将解析得到的图片标签进行文件提取转换为HTML可识别的<img>标签;将解析得到的公式标签进行提取转换为描述数学符号的数学标记语言的MathML标签,再次把MathML标签转换为可供HTML渲染的LaTex标签;将解析得到的表格标签进行提取转换为HTML可识别的<img>标签;在去除不被系统识别的标签后,通过正则表达式解析试题属性标识,得到如题型、题干、选项、答案、难度、分数等试题属性数据段,再根据该试题属性数据段封装各属性的数据对象以及试题对象,其中,数据对象包括该属性在试题段中的起点索引、终点索引、数据段节点数据以及数据段解析结果状态。
应当理解的是,本实施例中各步骤的序号的大小并不意味着步骤执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成唯一限定。
基于本申请实施例的上述技术方案,对预设试题文件进行格式转换以及格式提取,得到目标试题文件;解析目标试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;对试题属性标识进行无效标识去除处理,得到第一目标试题属性标识;当第一目标试题属性标识为HTML不可识别标识时,对第一目标试题属性标识进行格式转换,得到HTML可识别的第二目标试题属性标识;根据试题录入模式对第二目标试题属性标识进行解析,得到相应的试题属性数据段;将对应于试题属性数据段的数据对象封装至对应的试题对象;将试题对象封装至试题信息库。通过本申请方案的实施,将预设试题文件中的试题属性数据进行解析,得到相应的试题属性标识,再对该试题属性标识进行解析得到相应的试题属性数据段,最后只需对该试题属性数据段进行封装,从而能够减少录入试题的工作量、提高批量录入试题的效率且能够支持图片、公式、表格等特殊业务场景。此外,本实施例采用正则解析+数据顺序重排列的方式,将所有试题以属性段的形式解析,在校验属性数据的场景下能够快速定位异常属性;优化了按照试题属性逐个填入属性数据的耗时处理方式;并使得在批量录入试题场景下能支持复杂的业务场景,例如多层级表格嵌套、数学物理等公式;以Word文件的形式操作试题,在编辑试题的时候能以更直观的形式对所有试题进行操作;且可支撑丰富的试题类型,编辑更为灵活,在组卷场景中能极大提升制卷效率。
图3为本申请第三实施例提供的一种试题录入装置,该试题录入装置可应用于前述试题录入方法。如图3所示,该试题录入装置主要包括:
第一解析模块301,用于解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;其中,试题属性数据包括:段落、图片、公式、表格;
第二解析模块302,用于根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段;其中,试题录入模式包括以下任意一种:标准模式、试题答案分离模式,试题属性数据段包括以下任意一种:对应于标准模式的第一试题属性数据段、对应于试题答案分离模式的第二试题属性数据段;
封装模块303,用于将试题属性数据段封装至试题信息库。
在本实施例的一些实施方式中,第一解析模块具体用于:对预设试题文件进行格式转换以及格式提取,得到目标试题文件;解析目标试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识。
在本实施例的一些实施方式中,试题录入装置还包括:格式转换模块,用于对试题属性标识进行无效标识去除处理,得到第一目标试题属性标识;当第一目标试题属性标识为HTML不可识别标识时,对第一目标试题属性标识进行格式转换,得到HTML可识别的第二目标试题属性标识。
在本实施例的一些实施方式中,第二解析模块具体用于:根据试题录入模式对第二目标试题属性标识进行解析,得到相应的试题属性数据段。
进一步地,在本实施例的一些实施方式中,当试题录入模式为标准模式时,第二解析模块具体用于:基于预设解析算法对第二目标试题属性标识进行解析,得到对应于第二目标试题属性标识的试题行数据;对试题行数据进行分离,得到多个第一试题段数据;基于解析算法对第一试题段数据进行解析,得到第一试题属性数据段;其中,第一试题属性数据段包括以下至少之一:题型、题干、答案、选项、难度、分数。
进一步地,在本实施例的另一些实施方式中,当试题录入模式为试题答案分离模式时,第二解析模块具体用于:根据第二目标试题属性标识,分离出试题数据标识与答案数据标识;基于预设解析算法分别对试题数据标识以及答案数据标识进行解析,得到第二试题段数据以及答案段数据;根据预设试题模板合并第二试题段数据与答案段数据,得到第二试题属性数据段。
再进一步地,在本实施例的另一些实施方式中,试题录入装置还包括:检测模块,用于获取答案数据段的特征数据段,并对特征数据段进行合法性检测;当特征数据段符合预设答案文本规则时,执行根据预设试题模板合并第二试题段数据与答案段数据,得到第二试题属性数据段的步骤。
在本实施例的一些实施方式中,封装模块具体用于:将对应于试题属性数据段的数据对象封装至对应的试题对象;其中,数据对象包括:试题属性数据段所对应的属性在试题段中的起点索引、终点索引;将试题对象封装至试题信息库。
应当说明的是,前述实施例中的试题录入方法均可基于本实施例提供的试题录入装置实现,所属领域的普通技术人员可以清楚的了解到,为描述的方便和简洁,本实施例中所描述的试题录入装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
基于本申请上述实施例的技术方案,解析预设试题文件中试题属性数据,得到对应于试题属性数据的试题属性标识;其中,试题属性数据包括:段落、图片、公式、表格;根据试题录入模式对试题属性标识进行解析,得到相应的试题属性数据段;其中,试题录入模式包括以下任意一种:标准模式、试题答案分离模式,试题属性数据段包括以下任意一种:对应于标准模式的第一试题属性数据段、对应于试题答案分离模式的第二试题属性数据段;将试题属性数据段封装至试题信息库。通过本申请方案的实施,将预设试题文件中的试题属性数据进行解析,得到相应的试题属性标识,再对该试题属性标识进行解析得到相应的试题属性数据段,最后只需对该试题属性数据段进行封装,从而能够减少录入试题的工作量、提高批量录入试题的效率且能够支持图片、公式、表格等特殊业务场景。
图4为本申请第四实施例提供的一种电子设备,该电子设备可用于实现前述实施例中的试题录入方法,主要包括:
存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序403,存储器401和处理器402通过通信连接。处理器402执行该计算机程序403时,实现前述实施例一或二中的方法。其中,处理器的数量可以是一个或多个。
存储器401可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器401用于存储可执行程序代码,处理器402与存储器401耦合。
进一步地,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述电子设备中,该计算机可读存储介质可以是前述图4所示实施例中的存储器。
该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述实施例中的试题录入方法。进一步地,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本申请所提供的试题录入方法、装置、设备及可读存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种试题录入方法,其特征在于,包括:
解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识;其中,所述试题属性数据包括:段落、图片、公式、表格;
根据试题录入模式对所述试题属性标识进行解析,得到相应的试题属性数据段;其中,所述试题录入模式包括以下任意一种:标准模式、试题答案分离模式,所述试题属性数据段包括以下任意一种:对应于所述标准模式的第一试题属性数据段、对应于所述试题答案分离模式的第二试题属性数据段;
将所述试题属性数据段封装至试题信息库。
2.根据权利要求1所述的试题录入方法,其特征在于,所述解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识的步骤,包括:
对预设试题文件进行格式转换以及格式提取,得到目标试题文件;
解析所述目标试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识。
3.根据权利要求1所述的试题录入方法,其特征在于,所述解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识的步骤之后,还包括:
对所述试题属性标识进行无效标识去除处理,得到第一目标试题属性标识;
当所述第一目标试题属性标识为HTML不可识别标识时,对所述第一目标试题属性标识进行格式转换,得到HTML可识别的第二目标试题属性标识;
所述根据试题录入模式对所述试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:
根据试题录入模式对所述第二目标试题属性标识进行解析,得到相应的试题属性数据段。
4.根据权利要求3所述的试题录入方法,其特征在于,当所述试题录入模式为所述标准模式时,所述对所述第二目标试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:
基于预设解析算法对所述第二目标试题属性标识进行解析,得到对应于所述第二目标试题属性标识的试题行数据;
对所述试题行数据进行分离,得到多个第一试题段数据;
基于所述解析算法对所述第一试题段数据进行解析,得到第一试题属性数据段;其中,所述第一试题属性数据段包括以下至少之一:题型、题干、答案、选项、难度、分数。
5.根据权利要求3所述的试题录入方法,其特征在于,当所述试题录入模式为所述试题答案分离模式时,所述对所述第二目标试题属性标识进行解析,得到相应的试题属性数据段的步骤,包括:
根据所述第二目标试题属性标识,分离出试题数据标识与答案数据标识;
基于预设解析算法分别对所述试题数据标识以及所述答案数据标识进行解析,得到第二试题段数据以及答案段数据;
根据预设试题模板合并所述第二试题段数据与所述答案段数据,得到第二试题属性数据段。
6.根据权利要求5所述的试题录入方法,其特征在于,所述基于预设算法分别对所述试题数据标识以及所述答案数据标识进行解析,得到试题数据段以及答案数据段的步骤之后,还包括:
获取所述答案数据段的特征数据段,并对所述特征数据段进行合法性检测;
当所述特征数据段符合预设答案文本规则时,执行所述根据预设试题模板合并所述第二试题段数据与所述答案段数据,得到第二试题属性数据段的步骤。
7.根据权利要求1至6任一项所述的试题录入方法,其特征在于,所述将所述试题属性数据段封装至试题信息库的步骤,包括:
将对应于所述试题属性数据段的数据对象封装至对应的试题对象;其中,数据对象包括:所述试题属性数据段所对应的属性在试题段中的起点索引、终点索引;
将所述试题对象封装至试题信息库。
8.一种试题录入装置,其特征在于,包括:
第一解析模块,用于解析预设试题文件中试题属性数据,得到对应于所述试题属性数据的试题属性标识;其中,所述试题属性数据包括:段落、图片、公式、表格;
第二解析模块,用于根据试题录入模式对所述试题属性标识进行解析,得到相应的试题属性数据段;其中,所述试题录入模式包括以下任意一种:标准模式、试题答案分离模式,所述试题属性数据段包括以下任意一种:对应于所述标准模式的第一试题属性数据段、对应于所述试题答案分离模式的第二试题属性数据段;
封装模块,用于将所述试题属性数据段封装至试题信息库。
9.一种电子设备,其特征在于,包括存储器及处理器,其中:
所述处理器用于执行存储在所述存储器上的计算机程序;
所述处理器执行所述计算机程序时,实现权利要求1至7中任意一项所述方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7中的任意一项所述方法中的步骤。
CN202310182232.2A 2023-02-17 2023-02-17 一种试题录入方法、装置、设备及可读存储介质 Pending CN116383287A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310182232.2A CN116383287A (zh) 2023-02-17 2023-02-17 一种试题录入方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310182232.2A CN116383287A (zh) 2023-02-17 2023-02-17 一种试题录入方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN116383287A true CN116383287A (zh) 2023-07-04

Family

ID=86970233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310182232.2A Pending CN116383287A (zh) 2023-02-17 2023-02-17 一种试题录入方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116383287A (zh)

Similar Documents

Publication Publication Date Title
US20190228008A1 (en) Method, device, server and storage apparatus of reviewing sql
CN111274239B (zh) 试卷结构化处理方法、装置和设备
CN112732945B (zh) 标准知识图谱构建、标准查询方法及装置
CN112861489A (zh) 一种对word文档进行处理的方法和装置
CN108241642B (zh) 文件解析方法和装置
CN112001183B (zh) 一种基于段落语义的中小学试题分割提取方法及系统
CN113836038A (zh) 测试数据构造方法、装置、设备及存储介质
CN114818710A (zh) 表格信息提取方法、装置、设备及介质
JP2022541199A (ja) データテーブルの画像表現に基づいて構造化されたデータベースにデータ挿入するためのシステムおよび方法。
Mao et al. A dynamic feature generation system for automated metadata extraction in preservation of digital materials
CN111611788A (zh) 一种数据处理的方法及装置、电子设备、存储介质
US20130322759A1 (en) Method and device for identifying font
CN113283231A (zh) 获取签章位的方法、设置系统、签章系统及存储介质
CN116225455B (zh) 一种统计分析报表快速生成方法
CN114579796B (zh) 机器阅读理解方法及装置
EP2787448A1 (en) Method and device for determining font
CN116383287A (zh) 一种试题录入方法、装置、设备及可读存储介质
CN113657279A (zh) 一种票据类图像版面解析方法及装置
CN111401005B (zh) 文本转换方法、装置及可读存储介质
CN115146115B (zh) 基于坐标信息的家谱树展示方法及装置、电子设备
CN112541085B (zh) 问卷的结构化方法、问卷的结构化装置及存储介质
CN114637845B (zh) 模型测试方法、装置、设备和存储介质
CN111694925B (zh) 行为数据的处理方法及装置、存储介质、终端
Grigalis et al. Clustering visually similar web page elements for structured web data extraction
CN113553634B (zh) 设备公里标导入导出方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination