CN110674722A - 一种试卷拆分方法及其系统 - Google Patents

一种试卷拆分方法及其系统 Download PDF

Info

Publication number
CN110674722A
CN110674722A CN201910885041.6A CN201910885041A CN110674722A CN 110674722 A CN110674722 A CN 110674722A CN 201910885041 A CN201910885041 A CN 201910885041A CN 110674722 A CN110674722 A CN 110674722A
Authority
CN
China
Prior art keywords
test
test paper
guide
question
test question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910885041.6A
Other languages
English (en)
Other versions
CN110674722B (zh
Inventor
张新华
魏鹏
刘严
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lange Technology Co Ltd
Original Assignee
Zhejiang Lange Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lange Technology Co Ltd filed Critical Zhejiang Lange Technology Co Ltd
Priority to CN201910885041.6A priority Critical patent/CN110674722B/zh
Publication of CN110674722A publication Critical patent/CN110674722A/zh
Application granted granted Critical
Publication of CN110674722B publication Critical patent/CN110674722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及教育领域,公开了一种试卷拆分方法及其系统,该方法包括:根据样本试卷的试卷结构、试题导语、试题序号构建试卷信息特征库;根据试卷结构特征,将待拆分试卷划成若干段落;根据试题导语特征和试题序号特征,标识出导语段落和序号段落,并结合上下段落关系,将待拆分试卷划分为若干独立试题。本发明提出的方法实现了计算机全自动将试卷中试题一一进行拆分,并且准确性高、速度快,满足各学科、任意题型独立试题划分,通用性强。

Description

一种试卷拆分方法及其系统
技术领域
本发明属于教育领域,尤其涉及一种试卷拆分方法及其系统。
背景技术
随着人工智能技术的发展,教育智能化产品逐渐走入人们的生活,其智能化和便捷性为广大师生带来了更高的工作和学习效率。在各类教学产品中,如智能化组卷、学生个性化学习等都需要海量题库作为支撑,因此对海量试卷中的试题进行提取是题库构建的最基础的一部分。
然而,目前对试卷中的试题进行拆分与提取,大部分是由人工操作,这将会耗费大量人力和物力。而已有的一些试题提取技术存在试题提取准确率低、通用性低等问题。
发明内容
本发明的目的在于针对现有技术的不足,提供一种新的试卷拆分方法及其系统,能够快速、准确地对批量试卷中的试题自动进行拆分,便于题库资源的自我建设。
本发明的目的是通过以下技术方案来实现的:本发明在预先构建的试卷信息特征库的基础上,通过特征匹配的方式识别试卷中的各试题导语以及试题序号,并根据试题导语与序号之间的关系,最终将试卷准确地划分为若干个独立的试题。具体地:
本发明公开了一种试卷拆分方法,该方法包括:
根据样本试卷的试卷结构、试题导语、试题序号构建试卷信息特征库;
根据试卷结构特征,将待拆分试卷划成若干段落;
根据试题导语特征和试题序号特征,标识出导语段落和序号段落,并结合上下段落关系,将待拆分试卷划分为若干独立试题。
进一步地,将待拆分试卷划成若干段落后,剔除试卷首语段落和试卷答案段落,剩余段落再进行导语段落和序号段落的识别。
进一步地,序号段落的识别过程中,判断不规范序号,基于已识别的规范序号形式,将不规范序号修正为规范序号。
进一步地,序号段落的识别过程中,判断干扰性序号,剔除干扰性序号对应的序号段落标识。
进一步地,导语段落的识别过程中,根据导语关键词,提取包含相同导语关键词的标准导语;
计算该试题导语与其对应的各标准导语的关键词相似度,筛选出关键词相似度大于阈值T的标准导语;
计算该试题导语与筛选出的各标准导语的内容相似度,取内容相似度最大的标准导语作为试题导语;
若没有筛选出符合要求的标准导语,则取消导语段落标识。
进一步地,导语段落的识别过程中,判断干扰性导语,剔除干扰性导语对应的导语段落标识。
进一步地,将两个相邻试题导语段落之间的内容划分为一个独立试题块;
基于各独立试题块中的试题导语、试题序号的关系,将独立试题块划分为若干独立试题。
进一步地,试卷信息特征库中的试题序号特征包含试题有效序号、试题不规则序号;
试题导语特征包括导语样式、导语关键词、标准导语;
试卷结构特征包含试卷首语关键词、答案解析关键词。
本发明还公开了一种试卷拆分系统,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行该计算机可执行指令时实现如前文描述的方法中的步骤。
本发明还公开了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本发明采用多个措施实现了计算机全自动、高效、准确地将试卷中试题一一进行拆分,每小时能够处理600~700张试卷,其准确率高达98%;并且,满足各学科、任意题型(单试题、综合题、复合题型等)独立试题的划分,通用性强。所采用的措施包括:
(1)通过对试卷结构、试题导语、试题序号特征进行分析与提取,构建试卷客观的信息特征库,使计算机能够准确地匹配出有效信息,即试卷中的试题导语段落、试题序号段落,并且根据这些有效信息之间的关系,自动地对试卷中的试题进行划分;
(2)在试卷中试题序号和试题导语判定的过程中,通过分析试题序号上下段落关系,可修正不规范序号和剔除干扰序号,即可以兼容一些情况下非规范信息,具有一定的容错性;通过分析试题导语上下段落关系,可有效地剔除干扰性导语,便于后续独立试题的划分,提高了试题划分的准确性;
同时,在试题序号段落匹配过程中,根据试题序号位于段首特点,进行试题序号匹配;在试题导语匹配过程中,根据试题导语的特征,通过粗匹配与细匹配相结合的方式,可以以较小的计算量、更短的运行时间匹配出试题序号和试题导语,从而提高了试卷拆分的效率。
附图说明
图1为本发明试卷拆分方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
本发明提供了一种试卷拆分法,如图1所示,首先根据样本试卷的试卷结构、试题导语、试题序号构建试卷信息特征库;然后根据试卷结构特征,将待拆分试卷划成若干段落,进一步的,根据试题导语特征和试题序号特征,标识出导语段落和序号段落,并结合上下段落关系,将待拆分试卷划分为若干独立试题;本发明具体实现流程如下:
步骤1:预先构建试卷信息特征库(试卷信息元素数据库)
收集各学科试卷,包括小初高全学科,以及各类考试试卷,对试卷结构、试题导语、试题序号等进行统计与特征分析,构建试卷各信息特征库。具体如下:
①试题序号特征库:包含题目的各类序号特征信息,具体包括“试题有效序号”、“试题不规则序号”如下表:
②试题导语特征库:试题导语指针对不同题型的试题考核要求,向应试者指明的考查、答题方式的语句。包括“导语样式”、“导语关键词”特征信息等。
A、“导语样式”信息:包含导语序号、格式、标点、内容特征等。如下表:
Figure BDA0002207054430000042
B、“导语关键词”信息:包含有“标准导语”以及对应的“导语关键词”、“导语对应题型”等。如下表:
标准导语文本 导语关键词 对应题型
Part I Listening Comprehension Listening;Comprehension 听力选择、听力填空等
This part is to test your listening ability Test;listening;ability 听力简答
…… …… ……
③试卷结构特征库:试卷结构通常包括试卷首语、试题内容、答案解析三部分,提取“试卷首语关键词”、“答案解析关键词”信息等。如下表:
关键词类型 关键词
试卷首语 试卷名称、科目号、注意事项、考生号、姓名等
答案解析 参考答案,试题答案等
步骤2:导入待处理试卷,进行试卷预处理
①将word文档转换为html文本文件(如果待处理试卷不是word文档,比如pdf文档等,则先转化为word文档),剔除水印等无关内容;
②标记段落处及特殊格式内容,如斜体字、加粗、下划线等;
提取<style>标签中的html样式信息,以便后续使用。
步骤3:试卷段落划分
依据html文档中的段落标签(即html语言中的“p、h1、br、table”等标签),将试卷拆分成若干份段落(即试卷的最小单位),将段落集合记为A;
基于“试卷首语关键词”信息,识别并提取试卷首语段落,集合记为B;
基于“答案解析关键词”信息,识别并提取试卷答案段落,集合记为C;
输出试卷的试题段落集合R(R1,R2,……,Rn),其中,R=A-(B+C)。
步骤4:试题序号判定
基于“试卷序号特征库”,对试卷的试题段落R中的试题序号进行识别;进一步的,通过分析试题序号上下文关系,修正不规范序号以及剔除干扰性序号。
具体步骤如下:
4.1试题序号识别
基于“试题序号”特征信息,结合“序号位于段首”的特点,识别出各段落的试题序号,并在此序号前添加序号标签,同时标识此段落为序号段落。
4.2修正不规范序号
根据各试题序号的上下段落关系,判断是否存在不规范序号,若存在,则基于已识别的规范序号形式,修正为规范序号。
判断依据为“当前试题序号值-同类型上个试题序号值=1”,若是,说明不存在不规范序号;若否,说明存在不规范序号,进一步的,基于“试卷不规范序号”,识别当前不规范序号。同类型序号是指数字类型和格式均相同的序号,比如:“1、”“2、”“3、”……为一类型;“1.”“2.”“3.”……为一类型;“(1)”“(2)”“(3)”……为一类型;“Ⅰ.”“Ⅱ.”“Ⅲ.”……为一类型。
例如:上一个序号、不规则序号、当前序号分别为“1.”、“2,”、“3.”,将不规则序号“2,”修正为“2.”。
4.3剔除干扰性序号
根据各试题序号的上下段落关系,判断是否存在干扰序号,并对干扰序号删除序号标签,同时取消序号段落标识。
判断依据为“当前序号值-同类型的上个序号值<0”或“同类型下个序号值-当前序号值<0”;若否,说明不存在干扰序号;若是,说明当前试题序号为干扰序号。
例如:上一个、当前、下一个序号分别为“36.”、“15.”、“37.”,则当前序号“15.”为干扰序号。
步骤5:试题导语判定
基于“试题导语特征库”,对试卷中导语进行粗匹配与细匹配,并剔除干扰性导语,从而实现试题导语的准确判定。具体如下:
5.1粗匹配
基于“试题导语”特征信息,将R中的各段落与其特征信息进行匹配,并将符合相应一条及其以上特征条件的段落前添加导语标签,同时标识此段落为导语段落。
例如:段落中包含“第一卷”“第一部分”等导语序号的、段落首部含有英语试卷中的“Directions”关键词等情况,这些必定是导语。
5.2细匹配
通过分析各试题导语与标准导语的相似度,二次校验试题导语判定的准确性。具体步骤如下:
1)根据“导语关键词”信息,提取包含相同导语关键词的标准导语;
2)计算该试题导语与其对应的各标准导语的相似度;
a)若导语关键词相似度均小于阈值T(经大量实验数据,确定的最佳经验值),则该试题导语为假导语,删除该试题导语标签,同时取消导语段落标识;
b)若导语关键词相似度有大于阈值T,则排除小于T的标准导语,进一步的,计算该试题导语与其剩下的各标准导语的内容相似度,取导语内容相似度最大的标准导语作为该试题导语类型。
其中,导语的关键词相似度的计算方式为:
Figure BDA0002207054430000071
其中,i为该试题导语,j为标准导语,mij为两个导语的关键词相似度;si、sj分别是i试题导语和j标准导语中的导语关键词个数,Min(si,sj)为导语关键词交集个数,Max(si,sj)为两导语之间关键词最多的导语对应的关键词个数。
导语的内容相似度,指两导语全部的字词的相似度,其计算方式与“导语的关键词相似度”相同。
注:细匹配之前,还包括去掉导语段落中的序号,对段落文本进行分词(例如:中文采用jieba分词、英文按空格分词),将导语段落分割成若干字词,便于后续导语关键词匹配与内容匹配。
5.3剔除干扰性导语
“干扰性导语”指不能作为独立试题划分的描述性导语(例:阅读选择题篇章与试题之间的描述语)。具体判断如下:
根据各试题导语上下段落关系,判断“当前试题导语段落与上一个试题导语段落之间是否存在带有试题序号标签,若不存在带有试题序号标签且当前导语段落的下一个段落存在带有试题序号标签”,则为干扰性导语,标识该段落为干扰性导语段落;否则,不是干扰性导语。
步骤6:基于已判定的试题导语、试题序号,进行独立试题划分
基于试题导语段落、试题序号段落的判定结果,并根据上下段落关系,将试题内容划分为若干个独立试题,具体如下:
6.1独立试题块划分
以“试题导语”为划分点,将两个相邻试题导语段落之间的内容划分为一个“独立试题块”。
每个独立试题块可能是1个完整的独立试题(例如:1个阅读题包含5个选择题)、或多个独立试题(例如:1个翻译题型包含4个独立的翻译题)。
6.2独立试题划分
基于各试题块中的试题导语、试题序号的关系,进一步的,将“独立试题块”划分为若干个“独立试题”,其划分原理为:
1)判断独立试题块中的试题导语是否含有“回答多少题”例如“回答X~Y题”等类似的导语关键词(例如:听力题,1个音频对应多个听题单选题);
若有,则此独立试题块即为1个完整的独立试题;否则,继续下一步;
2)判断独立试题块中是否存在干扰性导语(例如:阅读选择题);
若是,则此独立试题块为1个完整的独立试题;
否则,从独立试题块中的第一个试题序号开始,划分为若干个独立试题。
步骤7:完成待处理试卷拆分,即独立试题提取后,可以进行如下应用:
(1)对大量试卷进行拆分,可快速的构建海量试题库,为人工组卷和计算机自动组卷提供了丰富的试题资源;
(2)经计算机拆分的最终XML形式存储的试题,可直接应用于考试系统中,有利于进行无纸化考试模式。
本发明还公开了一种试卷拆分系统,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行该计算机可执行指令时实现如前文描述的方法中的步骤。
本发明还公开了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施案例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种试卷拆分方法,其特征在于,该方法包括:
根据样本试卷的试卷结构、试题导语、试题序号等构建试卷信息特征库。
根据所述试卷结构特征,将待拆分试卷划成若干段落。
根据所述试题导语特征和试题序号特征,标识出导语段落和序号段落,并结合上下段落关系,将待拆分试卷划分为若干独立试题。
2.根据权利要求1所述的试卷拆分方法,其特征在于,将待拆分试卷划成若干段落后,剔除试卷首语段落和试卷答案段落,剩余段落再进行导语段落和序号段落的识别。
3.根据权利要求1所述的试卷拆分方法,其特征在于,所述序号段落的识别过程中,判断不规范序号,基于已识别的规范序号形式,将所述不规范序号修正为规范序号。
4.根据权利要求1所述的试卷拆分方法,其特征在于,所述序号段落的识别过程中,判断干扰性序号,剔除所述干扰性序号对应的序号段落标识。
5.根据权利要求1所述的试卷拆分方法,其特征在于,所述导语段落的识别过程中,根据导语关键词,提取包含相同导语关键词的标准导语。
计算该试题导语与其对应的各标准导语的关键词相似度,筛选出关键词相似度大于阈值T的标准导语。
计算该试题导语与筛选出的各标准导语的内容相似度,取内容相似度最大的标准导语作为试题导语。
若没有筛选出符合要求的标准导语,则取消导语段落标识。
6.根据权利要求1所述的试卷拆分方法,其特征在于,所述导语段落的识别过程中,判断干扰性导语,剔除所述干扰性导语对应的导语段落标识。
7.根据权利要求1所述的试卷拆分方法,其特征在于,将两个相邻试题导语段落之间的内容划分为一个独立试题块;
基于各独立试题块中的试题导语、试题序号的关系,将独立试题块划分为若干独立试题。
8.根据权利要求1所述的试卷拆分方法,其特征在于,所述试卷信息特征库中的试题序号特征包含试题有效序号、试题不规则序号;
所述试题导语特征包括导语样式、导语关键词、标准导语;
所述试卷结构特征包含试卷首语关键词、答案解析关键词。
9.一种试卷拆分系统,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至8中任意一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至8中任意一项所述的方法中的步骤。
CN201910885041.6A 2019-09-19 2019-09-19 一种试卷拆分方法及其系统 Active CN110674722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910885041.6A CN110674722B (zh) 2019-09-19 2019-09-19 一种试卷拆分方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910885041.6A CN110674722B (zh) 2019-09-19 2019-09-19 一种试卷拆分方法及其系统

Publications (2)

Publication Number Publication Date
CN110674722A true CN110674722A (zh) 2020-01-10
CN110674722B CN110674722B (zh) 2023-04-07

Family

ID=69078238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910885041.6A Active CN110674722B (zh) 2019-09-19 2019-09-19 一种试卷拆分方法及其系统

Country Status (1)

Country Link
CN (1) CN110674722B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209734A (zh) * 2020-01-13 2020-05-29 浙江蓝鸽科技有限公司 试题去重方法及其系统
CN112001183A (zh) * 2020-07-26 2020-11-27 湖南省侍禾教育科技有限公司 一种基于段落语义的中小学试题分割提取方法及系统
CN113703948A (zh) * 2021-09-03 2021-11-26 四川宇德中创信息科技有限公司 一种试卷拆分系统及其拆分方法
CN113821598A (zh) * 2021-09-14 2021-12-21 广东德诚科教有限公司 一种用于试卷录入的题目内容识别处理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354740A (zh) * 2016-05-04 2017-01-25 上海秦镜网络科技有限公司 一种电子试卷的导入方法
WO2018094925A1 (zh) * 2016-11-22 2018-05-31 深圳市鹰硕技术有限公司 一种填空题试题的生成和判卷的方法及系统
CN110083808A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 基于用户答案的作弊判定方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354740A (zh) * 2016-05-04 2017-01-25 上海秦镜网络科技有限公司 一种电子试卷的导入方法
WO2018094925A1 (zh) * 2016-11-22 2018-05-31 深圳市鹰硕技术有限公司 一种填空题试题的生成和判卷的方法及系统
CN110083808A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 基于用户答案的作弊判定方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
俞婷等: "基于词法分析和XML技术的多媒体试题批量导入研究", 《计算机应用与软件》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209734A (zh) * 2020-01-13 2020-05-29 浙江蓝鸽科技有限公司 试题去重方法及其系统
CN112001183A (zh) * 2020-07-26 2020-11-27 湖南省侍禾教育科技有限公司 一种基于段落语义的中小学试题分割提取方法及系统
CN113703948A (zh) * 2021-09-03 2021-11-26 四川宇德中创信息科技有限公司 一种试卷拆分系统及其拆分方法
CN113821598A (zh) * 2021-09-14 2021-12-21 广东德诚科教有限公司 一种用于试卷录入的题目内容识别处理系统及方法

Also Published As

Publication number Publication date
CN110674722B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110674722B (zh) 一种试卷拆分方法及其系统
CN110188347B (zh) 一种面向文本的知识主题间认知关系抽取方法
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN110659352B (zh) 试题考点识别方法及其系统
CN111274239A (zh) 试卷结构化处理方法、装置和设备
CN103500216B (zh) 一种文件信息的提取方法
CN113626573B (zh) 一种销售会话异议及应对提取方法及系统
CN111143531A (zh) 一种问答对构建方法、系统、装置及计算机可读存储介质
CN112434496A (zh) 一种公告文档表格数据识别方法及终端
CN105389303B (zh) 一种异源语料自动融合方法
CN107357765A (zh) Word文档碎片化方法及装置
CN109213998A (zh) 中文错字检测方法及系统
CN111428480A (zh) 简历识别方法、装置、设备及存储介质
CN111191413B (zh) 一种基于图排序模型的事件核心内容自动标记方法、装置及系统
CN113934814B (zh) 古诗文主观题自动评分方法
CN116306487A (zh) 高等院校学位论文格式智能检测系统及方法
CN116451646A (zh) 一种标准草案检测方法、系统、电子设备及存储介质
CN115730038A (zh) 一种试卷自动生成与考试方法、装置、电子设备及介质
CN116796726A (zh) 简历解析方法、装置、终端设备及介质
CN110765107B (zh) 基于数字化编码的题型识别方法及其系统
CN112699671A (zh) 一种语言标注方法、装置、计算机设备和存储介质
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
CN116822634A (zh) 一种基于布局感知提示的文档视觉语言推理方法
CN114661900A (zh) 一种文本标注推荐方法、装置、设备及存储介质
CN110223206B (zh) 课文专业方向确定方法及系统和解析课件匹配方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Zhang Xinhua

Inventor after: Wang Chaoxuan

Inventor after: Wei Peng

Inventor after: Liu Yan

Inventor before: Zhang Xinhua

Inventor before: Wei Peng

Inventor before: Liu Yan

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant