CN104503992A - 一种题库构建方法 - Google Patents

一种题库构建方法 Download PDF

Info

Publication number
CN104503992A
CN104503992A CN201410728366.0A CN201410728366A CN104503992A CN 104503992 A CN104503992 A CN 104503992A CN 201410728366 A CN201410728366 A CN 201410728366A CN 104503992 A CN104503992 A CN 104503992A
Authority
CN
China
Prior art keywords
file
word source
exercise
saved
source file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410728366.0A
Other languages
English (en)
Other versions
CN104503992B (zh
Inventor
郭浩伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MAINBO EDUCATION TECHNOLOGY CO., LTD.
Original Assignee
MAINBO EDUCATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MAINBO EDUCATION TECHNOLOGY Co Ltd filed Critical MAINBO EDUCATION TECHNOLOGY Co Ltd
Priority to CN201410728366.0A priority Critical patent/CN104503992B/zh
Publication of CN104503992A publication Critical patent/CN104503992A/zh
Application granted granted Critical
Publication of CN104503992B publication Critical patent/CN104503992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种题库构建方法,该方法包括:收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件将保存到指定目录中;根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;之后将第一目录中的word源文件转换为html文件,将所述html文件保存到web服务器的指定位置,最后根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。通过本发明的方法提高了基础题库构建的效率以及题库的质量。

Description

一种题库构建方法
技术领域
本发明涉及数字化处理技术领域,具体涉及一种基于python语言和java语言的题库构建方法。
背景技术
伴随着计算机技术和网络时代的推进,在线教育产品/系统在人们生活和学习过程中已经得到了越来越多的应用。与此同时,PC端、移动端的一些旨在方便用户针对性练习的辅助类教育系统/产品也越来越丰富。而这些系统,均需要以题库系统作为支撑来展开服务。因此,如何快捷、高效的构建题库系统,成为此类系统中急需解决的问题。
题库系统的建设一般分题目数据采集、题目数据解析、题目数据入库等操作。一般情况,对于IT企业来说,题目数据采集的方式是通过开发基于编辑器的web应用,实现题目数据的在线录入。该方案的缺点是:首先,习题录入时操作流程较为复杂,导致开发成本较高。另外,使用编辑器,只能实现单道题目录入,而且如果题目中包含大量图片,录入操作时效率会非常低,因而导致人力成本较高,而且也不能有效检查错误。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种题库构建方法,提高题库的构建效率和题库的质量。
为实现上述目的,本发明采用的技术方案为:一种题库构建方法,包括以下步骤:
(1)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中;
(2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;
(3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置;
(4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。
进一步,如上所述的一种题库构建方法,步骤(3)中,将word源文件转换为html文件的方式为:
将word源文件转换为表格格式文件,将表格格式文件转换为html文件。
进一步,如上所述的一种题库构建方法,步骤(1)中,所述习题文件包括教师制作的习题。
进一步,如上所述的一种题库构建方法,步骤(1)中,所述设定格式包括习题属性和习题内容;所述习题属性包括习题的来源、年份、关键字、题型和难度;所述习题内容包括习题、答案和解析。
进一步,如上所述的一种题库构建方法,步骤(2)中,当word源文件校验失败时,所述方法还包括:
对于检验失败的word源文件生成错误日记;
编辑人员根据所述错误日志对于第二目录中的word源文件进行修改;
对修改后的word文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。
进一步,如上所述的一种题库构建方法,步骤(4)中,将解析后的数据保存到数据库服务器中是指将解析后的字符数据保存到数据库服务器中;如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。
进一步,如上所述的一种题库构建方法,步骤(2)和步骤(3)中,通过python脚本语言实现对word源文件的校验和文件的转换。
进一步,如上所述的一种题库构建方法,步骤(4)中,通过java脚本语言实现对html文件的解析。
本发明的有益效果在于:本发明提供了一种根据word源文件自动校验、提取习题数据并存储的方案,该方案能够批量校验、转化源word文件为目标格式,并且可将转换后的文件批量解析、存储到数据库中,通过本发明的方法提高了基础题库构建的效率,且习题数据经校验后,质量明显提高。
附图说明
图1为本发明实施例中一种题库构建方法的流程图;
图2为本发明实施例中一种题库构建方法的详细流程图;
图3为本发明实施例中word源文件的示意图;
图4为本发明实施例中表格格式文件的示意图。
具体实施方式
下面结合说明书附图与实施例对本发明做进一步的详细说明。
本发明是针对现有传统的基于界面录入的习题收集方式效率差的问题,而提出的一种题库构建方法,该方法能够实现对习题文件的自动验证、数据提取,提高了题库的构建的效率,且能够有效提高题库的质量。
图1和图2示出了本发明实施例中一种题库构建方法的流程图,由图中可以看出,该方法可以包括以下步骤:
步骤S11:收集习题文件并将习题保存到word源文件中;
本实施例中,首先收集习题文件,将所述习题文件按照设定格式保存到word文件(初始文件,本实施例中称为word源文件)中,并将word源文件将保存到指定目录中。
其中,所述习题文件的来源可以是多种,可以是教师制作的习题、也可以是网络上下载的习题或者课本上的习题等。完成习题的收集后,将习题按照word的设定格式保存到word中,得到word源文件,并将word源文件保存到指定目录中,如可以是保存到计算机D盘名称为“word”的文件夹中,及指定目录的路径为:D:\word。
word的是设定格式可以根据需要进行设定。本实施例中,所述设定格式包括但不限于习题属性和习题内容;所述习题属性可以包括习题的来源、年份、关键字、题型、难度;所述习题内容可以包括习题、答案和解析。当然,习题内容中除了包括字符内容外,还有可能包括图片(如题目中的公式、示例图片或者题目本身所涉及到的一些网络图片等)等。
如图2所示,是针对类型为选择题而设定的一种word格式,格式中包括了习题的来源学校、年份、关键字、题型、难度、题干(具体的习题)、选项、答案及解析。收集到一选择题后,将该选择题按照上述word格式后得到的word源文件如图3所示。
步骤S12:对word源文件进行校验;
完成word源文件的存储后,根据预设条件对所述word源文件进行校验,以提高生成的题库的质量。所述校验指的是对习题的属性和习题内容进行校验。例如,对图2中所示的源文件进行校验,主要是指针对word源文件中习题的题型、难度、题干及选型等信息进行校验。其中,预设条件是根据所需构建的题库的具体内容进行设置的,例如,需要构建的是单选题的题库,题目的来源年份也是设置好的,那么预设条件便可以使判断题目是否为单选,题目的年份是否符合预设年份等。根据预设条件对word源文件进行判断后,如果word源文件中的题目都符合预设条件,则说明检验通过,如果有其中一项或多项不符合,则校验失败。
该步骤中,完成word源文件的校验后,将校验通过的word源文件保存到第一目录,即第一目录为success目录,将校验失败的word源文件保存到第二目录中,即第二目录为failure目录。
此外,本实施例中,如果word源文件没有通过校验,此时根据校验失败的原因(如哪项预设条件检验没通过)对于检验失败的word源文件生成错误日记,以便编辑人员根据所述错误日志对于第二目录中的word源文件进行修改,在完成修改后,对修改后的word文件再次进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。通过该方式能够实现对第一目录中文件的完善。
本实施例中,在实际应用中,对word源文件的校验,是基于python脚本语言实现的,通过python脚本语言开发出word校验程序,通过运行word校验程序实现对word源文件的批量校验。
步骤S13:对校验通过的word源文件进行格式转换并存储;
在完成word源文件的检验后,将校验通过的第一目录中的word源文件转换为表格格式即table格式,并将表格格式的文件转换为html文件,将所述html文件保存到web服务器的指定位置。为了节约存储资源,将html文件保存到web服务器时,一般是将html文件进行压缩后存储,如图3所示。
在转换过程中,只是将word源文件的字符部分转换成table格式,如果word源文件中包括有图片,则图片不进行转换,而是直接将图片进行存储在指定的目录下,并建立转换后的文件与图片的关联即可。
本实施例中,在实际应用中,对word源文件的转换(包括word格式转换为table格式和table格式转换为html格式),采用的也是是基于python脚本语言实现的,通过python脚本语言开发出相应的转换程序,通过运行转换程序实现文件的转换。如图4所示,为将图3中所示的word源文件转换为table格式后的示意图。当然,在进行word源文件的转换时,也可以此阿勇其它脚本语言实现,如c语言、java语言等,本实施例中采用采用python语言是因为其win32接口对office的支持更强大,而且python语言相对于java语言等,更方便调用命令行。
本实施例中,将word源文件装换为html文件时,是通过将word源文件首先转换为表格格式,再将表格格式转换为html格式,这是因为table格式转换成的html内容更规范,在后续步骤S14可以更方便快捷的对table格式转换后的html文件进行解析。
步骤S14:根据数据库服务器的数据存储格式对转换后的html文件进行解析、存储。
在步骤S13中完成文件的转换存储后,根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。其中,所述数据存储格式指的是用户根据需要设定的数据库中数据的存储形式。通过该步骤,将html文件解析成了数据库服务器中数据库所需要的数据格式,完成了数据库(题库)的构建。
其中,所述的将解析后的数据保存到数据库服务器,指的是将解析后的字符内容(文字、数字等)保存到数据库服务器。在解析后,如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。
本实施例中,对于html文件的读取与解析,采用的是基于java脚本语言实现的,通过java语言开发生成java习题导入解析程序,通过该程序读取指定位置的html文件并解析。当然,也可以采用其它的脚本语言进行html文件的解析。
本发明所述的题库构建方法,采用word模板(模版中包含一些题目数据所需的必须属性)录入习题,由开发人员定制相应的校验、解析程序针对此类word进行批量处理,并存储到数据库。与现有的基于界面录入的习题收集方式相比,在word中录入习题明显比在界面录入操作更方便,针对收集来的习题,程序可以实现批量校验、转换等操作,题目质量明显更好,效率也明显更高。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种题库构建方法,包括以下步骤:
(1)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中;
(2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;
(3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置;
(4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。
2.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(3)中,将word源文件转换为html文件的方式为:
将word源文件转换为表格格式文件,将表格格式文件转换为html文件。
3.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(1)中,所述习题文件包括教师制作的习题。
4.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(1)中,所述设定格式包括习题属性和习题内容;所述习题属性包括习题的来源、年份、关键字、题型和难度;所述习题内容包括习题、答案和解析。
5.根据权利要求1至4之一所述的一种题库构建方法,其特征在于,步骤(2)中,当word源文件校验失败时,所述方法还包括:
对于检验失败的word源文件生成错误日记;
编辑人员根据所述错误日志对于第二目录中的word源文件进行修改;
对修改后的word文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。
6.根据权利要求5所述的一种题库构建方法,其特征在于,步骤(4)中,将解析后的数据保存到数据库服务器中是指将解析后的字符数据保存到数据库服务器中;如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。
7.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(2)和步骤(3)中,通过python脚本语言实现对word源文件的校验和文件的转换。
8.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(4)中,通过java脚本语言实现对html文件的解析。
CN201410728366.0A 2014-12-04 2014-12-04 一种题库构建方法 Active CN104503992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410728366.0A CN104503992B (zh) 2014-12-04 2014-12-04 一种题库构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410728366.0A CN104503992B (zh) 2014-12-04 2014-12-04 一种题库构建方法

Publications (2)

Publication Number Publication Date
CN104503992A true CN104503992A (zh) 2015-04-08
CN104503992B CN104503992B (zh) 2018-09-25

Family

ID=52945390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410728366.0A Active CN104503992B (zh) 2014-12-04 2014-12-04 一种题库构建方法

Country Status (1)

Country Link
CN (1) CN104503992B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528831A (zh) * 2016-11-22 2017-03-22 泰康保险集团股份有限公司 数据推送方法及系统
CN109388704A (zh) * 2018-08-23 2019-02-26 深圳点猫科技有限公司 一种基于教育系统的题库题目配置方法及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184265A1 (en) * 2001-05-30 2002-12-05 Sun Microsystems Inc. Question and answer generator
CN101620637A (zh) * 2009-08-03 2010-01-06 百世教育科技股份有限公司 题库建立方法
CN102193906A (zh) * 2010-03-11 2011-09-21 北京商纳科技有限公司 Word格式试卷自动导入数据库系统的方法
CN102708160A (zh) * 2012-04-24 2012-10-03 深圳供电局有限公司 题库建立方法和装置
CN102929700A (zh) * 2012-10-11 2013-02-13 福州锐达数码科技有限公司 互动教学平台导入word题库的方法
CN103761334A (zh) * 2014-02-17 2014-04-30 网之易信息技术(北京)有限公司 从题库中查找匹配问题的方法和设备
CN103886098A (zh) * 2014-04-04 2014-06-25 浙江大学城市学院 一种Word文档格式检查方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184265A1 (en) * 2001-05-30 2002-12-05 Sun Microsystems Inc. Question and answer generator
CN101620637A (zh) * 2009-08-03 2010-01-06 百世教育科技股份有限公司 题库建立方法
CN102193906A (zh) * 2010-03-11 2011-09-21 北京商纳科技有限公司 Word格式试卷自动导入数据库系统的方法
CN102708160A (zh) * 2012-04-24 2012-10-03 深圳供电局有限公司 题库建立方法和装置
CN102929700A (zh) * 2012-10-11 2013-02-13 福州锐达数码科技有限公司 互动教学平台导入word题库的方法
CN103761334A (zh) * 2014-02-17 2014-04-30 网之易信息技术(北京)有限公司 从题库中查找匹配问题的方法和设备
CN103886098A (zh) * 2014-04-04 2014-06-25 浙江大学城市学院 一种Word文档格式检查方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528831A (zh) * 2016-11-22 2017-03-22 泰康保险集团股份有限公司 数据推送方法及系统
CN106528831B (zh) * 2016-11-22 2020-03-13 泰康保险集团股份有限公司 数据推送方法及系统
CN109388704A (zh) * 2018-08-23 2019-02-26 深圳点猫科技有限公司 一种基于教育系统的题库题目配置方法及电子设备

Also Published As

Publication number Publication date
CN104503992B (zh) 2018-09-25

Similar Documents

Publication Publication Date Title
CN109117131B (zh) 代码生成方法及装置、存储介质及电子终端
CN109933752B (zh) 一种导出电子文档的方法和装置
CN111061526B (zh) 自动化测试方法、装置、计算机设备及存储介质
CN111143556B (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN106919612B (zh) 一种上线结构化查询语言脚本的处理方法及装置
CN113505082B (zh) 应用程序测试方法及装置
US9442720B2 (en) Adding on-the-fly comments to code
CN110399306B (zh) 软件模块自动化测试方法及装置
CN108923997B (zh) 一种基于python的云服务节点自动测试方法及装置
CN114328276B (zh) 测试用例生成方法和装置,显示测试用例的方法和装置
JP2019520625A (ja) ヒューマンコンピュータインタラクション方法およびその装置
CN106294480A (zh) 一种文件格式转换方法、装置及试题导入系统
CN110688145B (zh) Android MVP代码自动生成方法、装置、介质、电子设备
US20200004795A1 (en) Method, apparatus, storage medium and electronic device for establishing question and answer system
CN112783482B (zh) 一种可视化表单生成方法、装置、设备及存储介质
CN104503992A (zh) 一种题库构建方法
CN113568621A (zh) 一种页面埋点的数据处理方法和装置
CN111078529B (zh) 客户端写入模块测试方法、装置、电子设备
CN117033249A (zh) 一种测试用例生成方法、装置、计算机设备及存储介质
CN110059184B (zh) 一种作业错题收集分析方法及系统
CN109284401A (zh) 课件标签添加、课件推荐方法、装置和存储介质
CN114546850A (zh) 一种埋点的自动化测试方法、系统、装置及存储介质
CN114115831A (zh) 数据处理方法、装置、设备和存储介质
Frye Microsoft Office Excel 2003 step by step
CN114661609B (zh) 人工智能医疗自动化测试集成系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100085, C, building 9, Ka Wah building, 801-803 3rd Street, Beijing, Haidian District

Patentee after: MAINBO EDUCATION TECHNOLOGY CO., LTD.

Address before: 100085, C, building 9, Ka Wah building, 801-803 3rd Street, Beijing, Haidian District

Patentee before: Mainbo Education Technology Co., Ltd.

CP01 Change in the name or title of a patent holder
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Question bank construction method

Effective date of registration: 20190821

Granted publication date: 20180925

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: MAINBO EDUCATION TECHNOLOGY CO., LTD.

Registration number: Y2019990000103

PE01 Entry into force of the registration of the contract for pledge of patent right