CN116070599A - 智能化题库生成及辅助管理系统 - Google Patents
智能化题库生成及辅助管理系统 Download PDFInfo
- Publication number
- CN116070599A CN116070599A CN202211525527.7A CN202211525527A CN116070599A CN 116070599 A CN116070599 A CN 116070599A CN 202211525527 A CN202211525527 A CN 202211525527A CN 116070599 A CN116070599 A CN 116070599A
- Authority
- CN
- China
- Prior art keywords
- question
- test
- module
- intelligent
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种智能化题库生成及辅助管理系统,包括文档管理模块、题干智能提取模块、客观题干扰项自动生成模块、客观题结构智能优化模块、试题去重算法分析模块、智能组卷模块、试题推送模块、流程审批模块和试题管理模块;智能组卷模块用于接收生成、录入或批量导入的试题;并对试题进行随机组合生成试卷,对试卷的基本属性、试卷参数和题目内容进行编辑设置;本发明解决快速出题、出卷的现实难题,降低基础培训业务中的人力消耗,整体提升工作质效;出题效率高,可以对试题进行在线编辑,方便管理,简单实用。
Description
技术领域
本发明涉及考试试题管理技术领域,特别涉及一种智能化题库生成及辅助管理系统。
背景技术
题库开发信息化、智能化、自主化是新时期理论考试工作的实际需求,试题库管理系统,近年来得到了很大的关注和发展。在试题库管理系统的研发中,主要有两个方面的问题需要解决,一是题库建设,另一个是智能组卷。由于试题录人信息的复杂性,大多数在线试题库生成的考卷排版并不理想,对于印刷考卷很难不经过人工调整直接使用。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的一个目的在于提出一种智能化题库生成及辅助管理系统,以解决背景技术中所提到的问题,克服现有技术中存在的不足。
为了实现上述目的,本发明提供一种智能化题库生成及辅助管理系统,包括文档管理模块、题干智能提取模块、客观题干扰项自动生成模块、客观题结构智能优化模块、试题去重算法分析模块、智能组卷模块、试题推送模块、流程审批模块和试题管理模块。
文档管理模块用于对出题文档分类管理,并显示文档内容。
题干智能提取模块用于对出题文档采用文本编辑划线形式提取主题干,比对岗位各级能力要素,判定可用来考核的部分,生成试题。
客观题干扰项自动生成模块用于通过文字识别和自然语言处理技术,构建面向岗位的考核项关键词库,生成针对关键词库的近义词库;采集识别并记录考核点前后端的连接词内容,生成针对该类用语的近义词或同义词库。
客观题结构智能优化模块用于依托关键词库,实现对考试题型、题干用语顺序或描述方式进行重构;试题生后根据出题范围修改考点内容,实现试题开发过程中的重构,导入政策、制度或宣贯型文档,对现有题库中不具有时效性和不具有准确性的命题,做智能预警以实现题库开发过程中的智能查重。
试题去重算法分析模块用于将试题语句与被抽取的关键词相似度进行对比,将关键词碎片化从新组合排列在主题干中的任意位置;并对比整个试题的题干和考点与题库中所有试题的相似度。
智能组卷模块用于接收生成、录入或批量导入的试题;并对试题进行随机组合生成试卷,对试卷的基本属性、试卷参数和题目内容进行编辑设置。
试题推送模块用于与云课堂对接,同步云课堂登录权限与试题的数据格式,对已推送和未推送试题形成标记。
流程审批模块用于对生成的试题或导出的试题进行审批。
试题管理模块用于对题库资源中的试题进行管理维护。
优选的是,还包括统计分析模块,统计分析模块用于从业务分类方面和试题类型方面统计试题。
在上述任一方案中优选的是,还包括内外网部署模块,内外网部署模块用于进行内网部署和外网部署,内网部署用于满足中心内部业务需求的同时,对内网资源资源采集;外网部署用于对接云课堂,提高试题利用率。
在上述任一方案中优选的是,还包括考点抽取模块,考点抽取模块用于在每次试题生成后,采用nlp自然语言处理技术采集试题中的考核项,用于完善干扰题的文本逻辑优化,同时考核项抽取后保存到近义词库中,作为考点或干扰项重复调用。
在上述任一方案中优选的是,还包括日志查看模块,日志查看模块用于查看所有用户的操作行为记录。
在上述任一方案中优选的是,客观题结构智能优化模块通过文字识别技术和自然语言识别技术,对现有题库中不具有时效性和准确性的命题,做智能预警以实现题库开发过程中的智能查重。
在上述任一方案中优选的是,自然语言处理技术为nlp自然语言处理技术,文字识别技术为ocr识别技术或百度文字识别技术;试题去重算法分析模块采用simHash算法去重技术将整个语句与被抽取的关键词相似度进行对比。
在上述任一方案中优选的是,还包括图文解析模块,图文解析模块用于对系统中图片文件进行图文解析,用于实现解析扫描件截图等图文内容,智能抽取图文中的文字内容,将解析的所有图片内容转换成文字文本,并通过划线操作截取文本转换成字符串生成试题。
在上述任一方案中优选的是,还包括用户管理模块,用于对用户账户基础信息进行新增、修改、删除管理。
在上述任一方案中优选的是,还包括试题修编模块,试题修编模块用于对岗位能力要素所对应的知识题库进行修改和对应评价标准的关系关联进行维护,对题库的内容进行基本信息维护。
与现有技术相比,本发明所具有的优点和有益效果为:
1、本发明的一种智能化题库生成及辅助管理系统解决快速出题、出卷的现实难题,降低基础培训业务中的人力消耗,整体提升工作质效;出题效率高,可以对试题进行在线编辑,方便管理,简单实用。
2、本发明的一种智能化题库生成及辅助管理系统采用自然语言处理和图文识别技术,实现对文本的文性分析和图文内容抓取。在此基础上还可以增加WBE端的应用封装,满足不同业务场景下的出题需求。
3、本发明的一种智能化题库生成及辅助管理系统减轻教师出题、组卷、判卷过程中的负担,帮助教师尽可能方便、快速、准确地按照材料大纲、教学方法和教学风格,组织和建立试题库,及根据不同测评面的要求,有效地生成有针对性的测评试卷。本系统出题方便、规范、能形成海量题库管理环境,并能通过随机组卷防止泄题和作弊,教师在短时间内可以按照组卷的要求完成一套考试组卷,节省了教师的时间。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的一种智能化题库生成及辅助管理系统结构示意图。
图2为根据本发明实施例的一种智能化题库生成及辅助管理系统的教师端的操作流程示意图。
图3为根据本发明实施例的一种智能化题库生成及辅助管理系中题干智能提取模块的工作原理流程图。
图4为根据本发明实施例的一种智能化题库生成及辅助管理系中客观题干扰项自动生成模块的工作原理流程图。
图5为OCR图片文字识别工作原理流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
如图1所示,本发明实施例的一种智能化题库生成及辅助管理系统,包括文档管理模块、题干智能提取模块、客观题干扰项自动生成模块、客观题结构智能优化模块、试题去重算法分析模块、智能组卷模块、试题推送模块、流程审批模块和试题管理模块;
文档管理模块用于对出题文档分类管理,并显示文档内容。
题干智能提取模块用于对出题文档采用文本编辑划线形式提取主题干,比对岗位各级能力要素,判定可用来考核的部分,生成试题。
客观题干扰项自动生成模块用于通过文字识别和自然语言处理技术,构建面向岗位的考核项关键词库,生成针对关键词库的近义词库;采集识别并记录考核点前后端的连接词内容,生成针对该类用语的近义词或同义词库。
客观题结构智能优化模块用于依托关键词库,实现对考试题型、题干用语顺序或描述方式进行重构;试题生后根据出题范围修改考点内容,实现试题开发过程中的重构,导入政策、制度或宣贯型文档,对现有题库中不具有时效性和不具有准确性的命题,做智能预警以实现题库开发过程中的智能查重。
试题去重算法分析模块用于将试题语句与被抽取的关键词相似度进行对比,将关键词碎片化从新组合排列在主题干中的任意位置;并对比整个试题的题干和考点与题库中所有试题的相似度。
智能组卷模块用于接收生成、录入或批量导入的试题;并对试题进行随机组合生成试卷,对试卷的基本属性、试卷参数和题目内容进行编辑设置。
试题推送模块用于与云课堂对接,同步云课堂登录权限与试题的数据格式,对已推送和未推送试题形成标记。
流程审批模块用于对生成的试题或导出的试题进行审批。
试题管理模块用于对题库资源中的试题进行管理维护。
试题的来源范围三种途径,一是通过文档和图文生成试题;二是手动逐条录入试题;三是导入EXCEL批量生成试题。为了提升试题使用率,对试题管理分为业务类型和岗位角色两个维度。
文档管理模块统一对出题文档分类管理,按照业务和活动两个维度分类管理文档。文档图文是试题来源,通过文档管理可直观查看相关试题。
试题推送模块实现与云课堂对接,同步云课堂登录权限与试题的数据格式。实现与云课堂无缝链接,对已推送和未推送试题形成标记。
流程审批模块为了保证试题安全性,为了避免试题外泄。普通教师生成试题或导出试题都需要通过审批后才能执行。
题干智能提取模块用于题库题干的智能生成。支持命题来源文件导入,采用文本编辑划线形式,提取主题干,同时借助自然语言处理技术,比对岗位各级能力要素,由系统智能判定可用来考核的部分,生成客观题考核点,题干智能提取模块还包括实现智能生成题库的人工干预功能,实现用户对生成题库的检视,同时也可根据需求进行编辑,插入外部素材,再次封装成标准题库。如图3所示,首先进行划线取词,对取到词的原始文本进行自然语言处理(分词、清洗、标准化、特征提取和建模),输出生成考核部分,用户再进行手工干预对考核部分进行部分的编辑和修改,最后生成最终考核项。
客观题干扰项自动生成单用于实现如下功能:1.导入专业文档,借助文字识别和自然语言处理技术,构建面向岗位的考核项关键词库,同时生成针对关键词库的近义词库。2.借助人工智能技术,采集识别并记录考核点前后端的连接词内容,同时生成针对该类用语的近义词或同义词库。3.实现根据用户操作对关键词库的干预和配置功能。如图4所示,对导入的文档进行算法查重和自然语言处理(提取文字,编辑距离算法查重,分词,进行自然语言处理)最后再进行手工干预,输出到关键词库。
客观题结构智能优化模块用书实现如下功能:1.依托关键词库,实现对考试题型、题干用语顺序或描述方式的智能重构。试题生后根据出题范围修改考点内容,实现试题开发过程中的重构功能。2.导入政策、制度或宣贯型文档,依托文字识别和自然语言识别技术,对现有题库中不具有时效性和准确性的命题,做智能预警实现题库开发过程中的智能查重功能。
试题去重算法分析模块用于实现如下功能:通过分析整个语句与被抽取的关键词相似度进行对比,把关键词碎片化从新组合排列在主题干中的任意位置。并分析真个试题的题干和考点与题库中所有试题的相似度。
进一步的,流程审批模块用于对试题管理模块生成的试题或导出的试题进行审批。
具体的,还包括统计分析模块,统计分析模块用于从业务分类方面和试题类型方面统计试题。统计分析模块用于对题库进行统计分析,计算题库全量、试题全量、各个题型总量的统计,并以柱状图或环形图展示。
具体的,还包括内外网部署模块,内外网部署模块用于进行内网部署和外网部署,内网部署用于满足中心内部业务需求的同时,对内网资源资源采集;外网部署用于对接云课堂,提高试题利用率。
进一步的,还包括考点抽取模块,考点抽取模块用于在每次试题生成后,采用nlp自然语言处理技术采集试题中的考核项,用于完善干扰题的文本逻辑优化,同时考核项抽取后保存到近义词库中,作为考点或干扰项重复调用。
具体的,还包括日志查看模块,日志查看模块用于查看所有用户的操作行为记录。
进一步的,客观题结构智能优化模块通过文字识别技术和自然语言识别技术,对现有题库中不具有时效性和准确性的命题,做智能预警以实现题库开发过程中的智能查重。
进一步的,自然语言处理技术为nlp自然语言处理技术,文字识别技术为ocr识别技术或百度文字识别技术
进一步的,试题去重算法分析模块采用算法去重技术将整个语句与被抽取的关键词相似度进行对比。
具体的,算法去重技术为simHash算法去重技术。
具体的,还包括图文解析模块,图文解析模块用于对系统中图片文件进行图文解析,用于实现解析扫描件截图等图文内容,智能抽取图文中的文字内容,将解析的所有图片内容转换成文字文本,并通过划线操作截取文本转换成字符串生成试题。
考点抽取模块对考核项智能提取,实现每次试题生成后,调用自然语言处理技术采集试题中的考核项,用于完善干扰题的文本逻辑优化。同时考核项抽取后保存到近义词库中,作为考点或干扰项重复调用。
具体的,还包括题库基础信息管理模块,用于对试题基本信息维护,包括新增、修改、删除、查看等,可以对生成的题库进行人工修改完善。
具体的,还包括试题修编模块,用于实现对当前岗位能力要素所对应的知识题库进行修改和对应评价标准的关系关联进行维护,还可对题库的内容进行基本信息维护。在线修编不仅能减少线下题库开发的工作量,同时通过题库工具对知识题库进行统一管理,减少人工管理成本和重复开发导致的人力资源浪费等问题,确保题库的可追溯性和有效保存,实现题库的智能化管理。
智能组卷模块对试题进行管理,包括对试题的导入,具有EXCEL 导入功能,批量导入试题到题库。已有试题或通过其他系统下载试题可以通过EXCEL导入,另外还有一些题库是存在个人或公司的电脑中,也是以EXCEL 格式文件存储。因此导入功能根据试题模板做到多种适配,减少人工录入试题工作量。
智能组卷模块对试题的导出选择需要导出的试题锁定范围,选择导出方式EXCEL或WORD。提交导出试题导出申请,审批通过后试题可以导入本地磁盘。如果申请被未能通过试题将无法导出。
具体的,近义词库是关联系统中自然语言算法模块中的子功能。每次试题生成后的考点和干扰项都会存入到近义词库中。在经过算法深度学习能自动补全错误选项,这就需要一个关键词库提供进行数据对比。关键词来源由三个来源构成:一是通过人工智能引擎自动收集已有试题的选项;二是从外部获取近音词数据,然后批量导入;三是人工在线维护近音词数据。
流程审批模块是为了提高数据安全性,试题生成和试题导出需要经过相关管理人员审核后才能执行。也为了避免与云课堂对接出现重复数据。每次试题推送想云课堂推送时也需要经过审批才能推送。所谓“云课堂”,是一类面向教育和培训行业的互联网服务。使用机构无需购买任何硬件和软件,仅仅通过租用网络互动直播技术服务的方式,就可以实现面向全国的高质量的网络同步和异步教学及培训,是一种真正完全突破时空限制的全方位互动性学习模式。
试题推送模块为提升试题利用率,与云课堂无缝链接。实现新试题与已有试题提送云课堂。为已推送试题和未推送试题设置状态区分。
具体的,还包括用户管理模块,用于对用户的新增、修改、删除等功能。
日志查看模块用于对数据的修改和删除操作记录都进行存储,形成操作日志,以便出现问题后追查原因。
本发明实施例可以根据使用者身份的不同对应设置不同的功能和需求例如设置教师端、教务端和管理员端,对于教师来说为学生出试题是不可避免的工作,尤其是在众多文档中抽内容形成试题,更是极其庞大的工作量。面对纷繁复杂的体量庞大的试题库和处于不同水平的学生,教师往往会无所适从。本发明实施例可以满足不同使用者的出题需求,以教师端操作流程为例:
如图2所示,整体的操作流程为:第一步:开始;第二步:打开文本或导入图文;第三步:选择体型;第四步:划出主体干;第五步:划出考点;第六步:生成试题;第七步:发起审批流程,如果审批通过,则进入第八步,如果审批不通过,则结束;第八步:是否进行推送,如果是,则推送到云课堂,如果否,则保存到试题库并结束。
首先登陆进入本系统,首页设置试题搜索、智能出题、手动录入及批量导入功能,便于用户进行相关操作。包括如下功能:
(1)试题搜索:搜索框输入试题关键字,输入框“搜索”,进入试题库,显示关键字相关试题。
(2)智能出题:点击“智能出题”,进入智能出题。
(3)手动录入:点击“手动录入”,进入手动录入试题。
(4)批量导入:点击“批量导入”,弹出试题导入框,“确定”导入试题,“取消”取消批量导入。
其次,对文件进行分类等操作,包括如下功能:
文件分类:搜索框输入文件关键词查找相关文件,搜索框下拉列表分为按内容分和按岗位分两种,选择不同分类显示不同类型的文件。
(2)文件列表:文件列表中显示序号、文件名称、文件类型、文件大小、分类、上传人、上传时间、关联试题、和操作等信息;文件名称进入生成试题,操作中的删除图标,可删除对应文件。
(3)导入文件/图片:列表显示“导入文件”和“导入图片”。点击“导入文件”,弹出选择分类,将想要导入的文件进行分类(文件格式为doc,txt,pdf,xls,xlsx),点击“确定”选择想到导入的文件,进入生成试题;点击“取消”或“×”,取消导入。点击“导入图片”选择想要导入的图片,进入生成试题。
(4)源文件搜素:显示搜索框,在搜索框中输入文件名称或文件类型,点击“查询”,列表中显示相关文件,点击“重置”,清除搜索框内容,显示全部文件。
(5)源文件分页显示:列表显示页码总数和当前所在的页码位置,以及当前页码共展示的数据量。在页码输入框中输入想要前往的页数,点击“回车”可跳转到输入的页码位置。
(6)生成试题:划出源文件中的考题及考点,智能生成各种类型的试题。显示源文件详情,显示生成的试题。在文件中通过选择考题、考点、题型后生成试题。试题生成后可对生成的试题进行编辑、删除以及统一分类或单独分类。
操作流程:①首先选择想要出的题型,分别有单选题、多选题、判断题、填空题四种题型。②在文件中划出要出题的文字范围,点击“考题”,出现红色下划线。③在红色下划线已划出的字段范围内选择考点即试题正确选项,点击“考点”,出现绿色下划线。④点击“生成试题”,生成试题。⑤生成试题后,每道试题左侧显示试题分类框,显示“编辑”和“删除”,可分别对试题进行分类、修改和删除。⑥点击“保存试题到本地”,经审核通过后,试题保存到试题库,“推送”可推送到云课堂题库中。⑦点击“返回”,返回到文件库。
其次,对试题库进行一系列的操作,试题库中包含所有已生成的试题,方便用户进行试题检索、试题导出等操作。包括如下功能操作。
(1)试题检索:对试题分类可勾选分类进行选择,选择想要检索的分类,试题分类检索,列表中显示已勾选分类下的试题。试题分类搜索框输入关键词快速分类查找试题,搜索框下拉列表分为按内容分和按岗位分两种,选择不同分类显示不同类型的试题。
(2)试题推送:勾选列表中的试题,列表“推送试题”,可将试题推送至云课堂
(3)手动录入:列表“手动录入”,跳转到手动录入。手动录入包括试题类型、试题分类、试题来源、试题内容、正确答案、错误答案等内容。以上内容输入完毕后,点击“生成试题”,生成试题并保存到题库,点击“取消”,取消录入,返回到试题库。
(4)试题编辑:试题列表中展示试题内容、题型、分类、来源、创建人、创建时间等内容,点击操作中的“编辑”图标,可对试题进行编辑,点击“删除”图标,可删除试题。
(5)试题导入:试题库列表点击“导入”,弹出试题分类弹窗,选择分类后,点击“确定”导入试题,点击“取消”取消导入试题。
(6)试题导出:在试题库,勾选想要导出的试题,列表点击“导出”,填写导入信息,点击“确定”,待管理员或教务审批通过后,可导出试题;点击“取消”,取消导出试题。
其次,对近义词库进行相关的管理操作,以列表形式展示所有文档中所有考点的近义词。包括:
(1)近义词搜索:在列表输入框输入想要查询的近义词名称或文件,输入框点击“查询”,可查询相关近义词或文件,点击“重置”,清空输入框内容,刷新。
(2)近义词删除:列表中展示近义词名称、关联的试题及近义词来源等信息,操作“删除”可删除词语及关联信息。
其次,进行统计分析相关操作,包括:
统计分类包括:每类试题总数量、每类试题占比以及不同分类下的不同试题类型数量等信息。进入统计分类,展现每类试题总数量、每类试题占比以及不同分类下的不同试题类型数量。试题统计栏点击“列表”,可将当前统计图转变为列表形式,反之亦可。
最后,进行审批管理操作,以列表形式展示所有已提交的审批,包括:(1)审批列表信息:列表中展示序号、姓名、申请理由、申请时间、状态、操作等信息。
当管理员或教务未审批时,状态下显示审批中,操作中下载不可用;当管理员或教务审批通过后,状态下显示审批通过,可将审批通过的数据下载到本地;当管理员或教务驳回审批时,状态下显示审批不通过,操作中下载不可用。
本发明能够满足培训方案设计过程中对要文内容的快速定位,能够节省教师梳理文件和图片筛选信息编辑试题的时间。实现非结构化信息与结构化数据的转换。对文档中的知识点形成试题,为教师编辑试卷提供资源。智能分析考试结果,实现出题考试一体化。
OCR图文识别技术在识别文字信息的时候,可能会有小部分文字识别错误,所以即便识别文字内容后,我们也需要对识别出的文字信息进行内容校对,避免出现错别字。
采用应用OCR图文识别技术的系统,在获取以上图片内容时,无需手动一个个敲打编辑,只需将想要获取文字信息的图片上传到中安未来OCR文字识别系统中即可,快速提取文字信息,然后导出进行编辑保存。如图5所示,OCR图片文字识别,首先,输入图片,其次,连通域/MSER处理,其次,对文字或非文字进行识别,其次,对文字行识别,其次,对文字过滤,最后,处理好文字行进行输出。
采用Apache POI是读取和写入Microsoft Office二进制和OOXML文件格式的开源完整API库,基于Office Open XML标准(OOXML)和Microsoft的OLE 2复合文档格式(OLE2)处理各种文件。
客观题结构智能优化模块还包括对试题查重去重, 首先对试题进行中文分词得到的分词结;判断分词结是否为关键词,若是则将其加入试题与关键字的关系数据库;然后采用内积计算试题与关键字的关系数据库中任意两个待检测试题之间的相似度;其次判断两个待检测试题是否为非相似试题,并将相似的试题加入重复试题关系数据库;再次根据相似度条件,从重复试题关系数据库中查找出重复试题列表;最后管理人员通过看重复试题列表进行重复试题确认,人为判断试题是否重复。本发明专利技术对试题的题干、试题候选项和试题答案进行中文分词,针对切词后的分词进行分析,从而深入分析试题,以便去重更加精准。
基于nlp(自然语言识别)技术,对现有规章制度中需要掌握的部分进行自然语言识别,同时通过大数据&人工智能技术,给出考点和相关干扰项,自动形成试题库。
智能组卷模块对题目知识结构、数据延展进行全方位跟踪管理;提供智能化组卷,提高组卷质量;多种考试形式丰富组织方式;组织者自可以定义题目的知识点、难度、教学要求、分数四项指标的下拉内容;组织者可以对题库和试卷中的题型进行自定义。
试题管理模块主要是对海量题库资源进行管理、更新、补充等环节的综合控制模块,同时可以设置公开题库供普通用户进行题库学习。
试题管理模块对题库资源维护,题库数据来源有两个途径。一是文档库,收集汇总多种格式的文本和图文数据如:PDF、WORD、WPS、PDF、扫描件、图片、截图等非结构化数据关键信息提取生成试题。二是直接导入试题和手动编辑试题。
试题管理模块主要用于对题库资源管理维护,包括如下:
基本操作:对题目增加、删除、修改。
批量操作:将excel文件中的题目批量导入系统也可将题目批量导出到excel文件中。
题目调动:动态调整题目的所属目录,避免重复劳动带来的负担。
题目查询:通过知识点、难度、教学要求、题干内容等条件查询所需题目。
题库结构:无限级层目录结构,满足各种题库结构的建立。
智能组卷模块主要包括:
1、建立试卷:
a) 试卷基本属性设置:设置试卷名称、考试时间、考生范围、防舞弊措施等信息。
b) 试卷相关参数设置:设置成绩公布方式、题型顺序等信息。
c) 试卷题目内容设置:设置试卷具体题目内容信息。
2、试卷内容微调:
组卷完毕后,系统会根据组卷过程中设定的参数自动抽取相关题目。对于试卷中具体题目内容可以以试卷的模式展示,组卷人员经过审阅对不符合要求的题目通过手工换题和自动换题功能进行更换题目,直至试卷中的所有题目都吻合考试要求,提高试卷质量。
3、智能判阅:系统依据试题的难易度、题型、所包含的章节判断错题的优先级。并把评判结果发送给学员,方便学员查阅。分析所有学员试卷中的错题。按照课题,题型等多维度分析错误率。并以列表和图形两种方式直观呈现。
本发明实施例减轻教师出题、组卷、判卷过程中的负担为目标,帮助教师尽可能方便、快速、准确地按照材料大纲、教学方法和教学风格,组织和建立试题库,及根据不同测评面的要求,有效地生成有针对性的测评试卷。本系统出题方便、规范、能形成海量题库管理环境,并能通过随机组卷防止泄题和作弊,教师在短时间内可以按照组卷的要求完成一套考试组卷,在数秒以内可以完成一套试卷答案,节省了教师的时间。
智能组卷模块还包括:智能试卷分析,统计所有学员试卷中错题点。智能推送:考试后提取试卷中的错题发送给学员查阅。智能判题:设定判题规则,判断错题优先级。错误率统计:可视化监控考题错误率效果。
提供智能化组卷,提高组卷质量;多种考试形式丰富组织方式针对考试成绩、试卷分析等评价表以图表形式直观体现;
智能算法出题是新时期理论考试工作的实际需求,试题生成的辅助工具,近年来得到了很大的关注和发展。在试题生成的研发中,主要有两个方面的问题需要解决,一是文本处理,另一个是图文处理。由于试题录人信息的复杂性,大多数在线试题库生成的考卷排版并不理想,对于印刷考卷很难不经过人工调整直接使用。通过智能算法试题生成工具解决快速出题、出卷的现实难题,降低基础培训业务中的人力消耗,整体提升工作质效;在线编辑题库,让题库数据直接转化成标准数字数据,减少导入时因格式产生的大量问题。
本发明的一种智能化题库生成及辅助管理系统可自动解析图片、截图、扫描件的文字内容,并将解析的问题转换成文体。再接触自然语言处理技术,由人为划线或算法规则生成试题。可实现:
文档自由分类,实现文档分类节点任意编辑。根据业务实际需求对文档进行分类管理。与试题关联通过列表查看每个文档出过的试题数量,图文内容抽取:读取图文扫描件以及截图中的文本内容。主要对试题分类管理。老师想要生成试卷或是导出试题可按照试题类别查询筛选试题,锁定范围导出试题或生成试卷。也可通过试题追溯出题来源文件。
近义词库中汇聚整个工具中所有的考点,并与试题相关联。近义词也可是自然语言学习的核心算法之一。在后续词库内容不断怎加积累,会提高出去的准确率。技术从系统中删除近义词,自然语言处理技术也会记录下被删除词语的使用场景和关联语句。
进一步的,本发明的一种智能化题库生成及辅助管理系还包括:
岗位管理模块:系统岗位管理,不同岗位业务范围不同,所需试题不同。试题关联岗位,方便调取试题。岗位分类管理:岗位分类分成大、中、小三级树状结构,此模块提供岗位分类的新增、修改、 删除、启用、禁用、导入、导出等功能。
操作审计管理模块:目前系统实现了对试题导出的权限控制。利用审批权限控制试题导出防止泄密或试题外泄。
管理员角色权限管理模块:每个管理员在运维系统中都承担某个角色,相同角色的管理员功能相同。一个角色信息和权限有变更,所有相关的管理员也同时变更。
统计分析模块:试题类型统计按照单选、多选、填空、判断四种题型统计试题数量,并用颜色加以区分。
业务分类统计模块:根据业务分类统计试题数量,分类八大类,理论教育、决策部署宣贯、公司战略和企业文化、教育管理、专业管理、通用管理、重大决策部署宣贯。
业务占比模块:用户型图对比八类业务试题的占比。
组织机构管理模块:对组织机构进行编辑,实现组织机构的增删改查。
参数字典管理模块:对系统数据中有些字段的固定数量选项管理。
(1)nlp自然语言处理基本技术
是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
分词:基本算是所有NLP任务中最底层的技术。不论解决什么问题,分词永远是第一步。
词性标注:判断文本中的词的词性(名词、动词、形容词等等),一般作为额外特征使用。
句法分析:分为句法结构分析和依存句法分析两种。
词干提取:从单词各种前缀后缀变化、时态变化等变化中还原词干,常见于英文文本处理。
命名实体识别:识别并抽取文本中的实体,一般采用BIO形式。
指代消歧:文本中的代词,如“他”“这个”等,还原成其所指实体。
关键词抽取:提取文本中的关键词,用以表征文本或下游应用。
词向量与词嵌入:把单词映射到低维空间中,并保持单词间相互关系不变。是NLP深度学习技术的基础。
文本生成:给定特定的文本输入,生成所需要的文本,主要应用于文本摘要、对话系统、机器翻译、问答系统等领域。
(2)ocr识别技术
对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。通常,图像信息通过扫描仪、照相机、电子传真软件等设备获取并存储在图像文件中,然后OCR软件读取、分析图像文件并通过字符识别提取出其中的字符串。
(3)文字识别
文字识别,提供多种场景下精准图像文字识别技术服务,精准识别超99%,免费试用.云端服务/离线识别SDK/私有化部署多种服务供选择。
本发明的一种智能化题库生成及辅助管理系统解决题库建设和试题管理问题。通过自然语言处理技术解决快速出题、图文识别出题的现实难题,降低基础培训业务中的人力消耗,提升整体工作质效。在线编辑题库,让题库数据直接转化成标准数字数据,减少导入时因格式产生的大量问题。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
本领域技术人员不难理解,本发明包括上述说明书的发明内容和具体实施方式部分以及附图所示出的各部分的任意组合,限于篇幅并为使说明书简明而没有将这些组合构成的各方案一一描述。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种智能化题库生成及辅助管理系统,其特征在于,包括文档管理模块、题干智能提取模块、客观题干扰项自动生成模块、客观题结构智能优化模块、试题去重算法分析模块、智能组卷模块、试题推送模块、流程审批模块和试题管理模块;
所述文档管理模块用于对出题文档分类管理,并显示文档内容;
所述题干智能提取模块用于对出题文档采用文本编辑划线形式提取主题干,比对岗位各级能力要素,判定可用来考核的部分,生成试题;
所述客观题干扰项自动生成模块用于通过文字识别和自然语言处理技术,构建面向岗位的考核项关键词库,生成针对关键词库的近义词库;采集识别并记录考核点前后端的连接词内容,生成针对该类用语的近义词或同义词库;
所述客观题结构智能优化模块用于依托关键词库,实现对考试题型、题干用语顺序或描述方式进行重构;试题生后根据出题范围修改考点内容,实现试题开发过程中的重构,导入政策、制度或宣贯型文档,对现有题库中不具有时效性和不具有准确性的命题,做智能预警以实现题库开发过程中的智能查重;
所述试题去重算法分析模块用于将试题语句与被抽取的关键词相似度进行对比,将关键词碎片化从新组合排列在主题干中的任意位置;并对比整个试题的题干和考点与题库中所有试题的相似度;
所述智能组卷模块用于接收生成、录入或批量导入的试题;并对试题进行随机组合生成试卷,对试卷的基本属性、试卷参数和题目内容进行编辑设置;
所述试题推送模块用于与云课堂对接,同步云课堂登录权限与试题的数据格式,对已推送和未推送试题形成标记;
所述流程审批模块用于对生成的试题或导出的试题进行审批;
所述试题管理模块用于对题库资源中的试题进行管理维护。
2.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括统计分析模块,所述统计分析模块用于从业务分类方面和试题类型方面统计试题。
3.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括内外网部署模块,所述内外网部署模块用于进行内网部署和外网部署,所述内网部署用于满足中心内部业务需求的同时,对内网资源资源采集;所述外网部署用于对接云课堂,提高试题利用率。
4.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括考点抽取模块,所述考点抽取模块用于在每次试题生成后,采用nlp自然语言处理技术采集试题中的考核项,用于完善干扰题的文本逻辑优化,同时考核项抽取后保存到近义词库中,作为考点或干扰项重复调用。
5.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括日志查看模块,所述日志查看模块用于查看所有用户的操作行为记录。
6.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,所述客观题结构智能优化模块通过文字识别技术和自然语言识别技术,对现有题库中不具有时效性和准确性的命题,做智能预警以实现题库开发过程中的智能查重。
7.如权利要求6所述的一种智能化题库生成及辅助管理系统,其特征在于,所述自然语言处理技术为nlp自然语言处理技术,所述文字识别技术为ocr识别技术或百度文字识别技术;所述试题去重算法分析模块采用simHash算法去重技术将整个语句与被抽取的关键词相似度进行对比。
8.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括图文解析模块,所述图文解析模块用于对系统中图片文件进行图文解析,用于实现解析扫描件截图等图文内容,智能抽取图文中的文字内容,将解析的所有图片内容转换成文字文本,并通过划线操作截取文本转换成字符串生成试题。
9.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括用户管理模块,用于对用户账户基础信息进行新增、修改、删除管理。
10.如权利要求1所述的一种智能化题库生成及辅助管理系统,其特征在于,还包括试题修编模块,所述试题修编模块用于对岗位能力要素所对应的知识题库进行修改和对应评价标准的关系关联进行维护,对题库的内容进行基本信息维护。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211525527.7A CN116070599A (zh) | 2022-12-01 | 2022-12-01 | 智能化题库生成及辅助管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211525527.7A CN116070599A (zh) | 2022-12-01 | 2022-12-01 | 智能化题库生成及辅助管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116070599A true CN116070599A (zh) | 2023-05-05 |
Family
ID=86172381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211525527.7A Pending CN116070599A (zh) | 2022-12-01 | 2022-12-01 | 智能化题库生成及辅助管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116070599A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662305A (zh) * | 2023-06-06 | 2023-08-29 | 森纵艾数(北京)科技有限公司 | 一种题库管理方法、系统、电子设备及存储介质 |
CN117290487A (zh) * | 2023-10-27 | 2023-12-26 | 知学云(北京)科技股份有限公司 | 基于大语言模型的自动组卷方法、电子设备及存储介质 |
CN117829137A (zh) * | 2024-03-06 | 2024-04-05 | 北京万物成理科技有限公司 | 汉语语素题目生成方法、装置、电子设备和存储介质 |
CN117290487B (zh) * | 2023-10-27 | 2024-05-31 | 知学云(北京)科技股份有限公司 | 基于大语言模型的自动组卷方法、电子设备及存储介质 |
-
2022
- 2022-12-01 CN CN202211525527.7A patent/CN116070599A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662305A (zh) * | 2023-06-06 | 2023-08-29 | 森纵艾数(北京)科技有限公司 | 一种题库管理方法、系统、电子设备及存储介质 |
CN117290487A (zh) * | 2023-10-27 | 2023-12-26 | 知学云(北京)科技股份有限公司 | 基于大语言模型的自动组卷方法、电子设备及存储介质 |
CN117290487B (zh) * | 2023-10-27 | 2024-05-31 | 知学云(北京)科技股份有限公司 | 基于大语言模型的自动组卷方法、电子设备及存储介质 |
CN117829137A (zh) * | 2024-03-06 | 2024-04-05 | 北京万物成理科技有限公司 | 汉语语素题目生成方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825882B (zh) | 一种基于知识图谱的信息系统管理方法 | |
Morris | Computerized content analysis in management research: A demonstration of advantages & limitations | |
CN108345640B (zh) | 一种基于神经网络语义分析的问答语料库构建方法 | |
US11823074B2 (en) | Intelligent communication manager and summarizer | |
US20160133148A1 (en) | Intelligent content analysis and creation | |
CN109299865B (zh) | 基于语义分析的心理测评系统及方法、信息数据处理终端 | |
CN111259631B (zh) | 一种裁判文书结构化方法及装置 | |
CN109766417A (zh) | 一种基于知识图谱的文学编年史问答系统的构建方法 | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
Visser et al. | Revisiting computational models of argument schemes: Classification, annotation, comparison | |
CN116070599A (zh) | 智能化题库生成及辅助管理系统 | |
CN110609983B (zh) | 一种政策文件结构化分解方法 | |
KR20050036541A (ko) | 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법 | |
CN109101551B (zh) | 一种问答知识库的构建方法及装置 | |
CN111177322A (zh) | 一种领域知识图谱的本体模型构建方法 | |
KR20200089914A (ko) | 교육 플랫폼에서 전문가 자동 매칭 시스템 | |
CN113742496B (zh) | 一种基于异构资源融合的电力知识学习系统及方法 | |
CN114186041A (zh) | 一种答案输出方法 | |
CN111949781B (zh) | 一种基于自然语句句法分析的智能交互方法及装置 | |
CN114417010A (zh) | 面向实时工作流的知识图谱构建方法、装置和存储介质 | |
JP3910823B2 (ja) | アンケート分析装置、アンケート分析方法及びプログラム | |
Mastley | Representation of Black History in Archives: A Collection-Centered Quantitative Analysis of the Billups-Garth Archive | |
Wang et al. | Design of an Intelligent Support System for English Writing Based on Rule Matching and Probability Statistics. | |
Lapesa et al. | Analysis of political debates through newspaper reports: methods and outcomes | |
Arbizu | Extracting knowledge from documents to construct concept maps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |