CN114781373A - 一种基于知识约束的mct完形填空智能出题方法及系统 - Google Patents
一种基于知识约束的mct完形填空智能出题方法及系统 Download PDFInfo
- Publication number
- CN114781373A CN114781373A CN202210464130.5A CN202210464130A CN114781373A CN 114781373 A CN114781373 A CN 114781373A CN 202210464130 A CN202210464130 A CN 202210464130A CN 114781373 A CN114781373 A CN 114781373A
- Authority
- CN
- China
- Prior art keywords
- question
- medical
- mct
- text
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 201000010099 disease Diseases 0.000 claims abstract description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 11
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 5
- 238000003491 array Methods 0.000 claims description 2
- 208000024891 symptom Diseases 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 10
- 230000000699 topical effect Effects 0.000 abstract description 3
- 239000002253 acid Substances 0.000 description 7
- 206010067171 Regurgitation Diseases 0.000 description 4
- 206010014561 Emphysema Diseases 0.000 description 2
- 201000001883 cholelithiasis Diseases 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000037303 wrinkles Effects 0.000 description 2
- SUBDBMMJDZJVOS-UHFFFAOYSA-N 5-methoxy-2-{[(4-methoxy-3,5-dimethylpyridin-2-yl)methyl]sulfinyl}-1H-benzimidazole Chemical compound N=1C2=CC(OC)=CC=C2NC=1S(=O)CC1=NC=C(C)C(OC)=C1C SUBDBMMJDZJVOS-UHFFFAOYSA-N 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 208000007107 Stomach Ulcer Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000010515 dystocia Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 201000005917 gastric ulcer Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 206010025482 malaise Diseases 0.000 description 1
- 229960000381 omeprazole Drugs 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于知识约束的MCT完形填空智能出题方法及系统,方法包括:基于HSK中文水平等级和医学词典等多维复杂知识约束对医疗文本进行篇章语义解析,以筛选出符合要求的医疗文本作为出题语料;基于MCT等级的知识约束对出题语料进行考点词挖空;基于医学知识图谱、HSK中文水平等级、MCT等级等多维复杂知识约束完成干扰项生成;将题干挖空文本和题目列表组成完形填空题目进行输出。本发明针对参加MCT考试的医学专业留学生,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述,通过海量的医学词典、医疗知识图谱为MCT题库智能生成提供医疗知识数据支撑,实现医学汉语资源的科学利用。
Description
技术领域
本发明属于推荐算法技术领域,具体涉及一种基于知识约束的MCT完形填空智能出题方法及系统。
背景技术
为满足医学专业留学生在专业学习和临床实习过程中运用中文进行交际的需求,切实提高来华留学医学教育质量,2019年12月15日,教育部中外语言交流合作中心和汉考国际联合创建的医学汉语水平考试(Medical Chinese Test,简称MCT)正式启动。MCT旨在考查留学生在医学/医疗场景中与患者、医护人员及相关人员用中文进行交际的能力,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述。
然而,MCT题库资源的建设仍然停留在初级和传统阶段,至今市场上仍没有能够实现MCT完形填空题的智能生成。在信息化时代,教育与科技的融合是大势所趋,通过互联网、云技术和人工智能可以拓展MCT题库构建工程,提升MCT题库生成的智能化,实现MCT考试的提效增速。而在如今大数据时代的背景下,海量的医疗知识字典、医疗知识图谱同样可以作为医疗知识库数据支撑,为MCT题库智能生成注入新鲜活力,实现医学汉语资源的科学利用。
发明内容
本发明公开了一种基于知识约束的MCT完形填空智能出题方法及系统,包括:基于HSK中文水平等级和医学词典等多维复杂知识约束对医疗文本进行篇章语义解析,以筛选出符合要求的医疗文本作为出题语料;基于MCT等级的知识约束对出题语料进行考点词挖空;基于医学知识图谱、HSK中文水平等级、MCT等级等多维复杂知识约束完成干扰项生成;将题干挖空文本和题目列表组成完形填空题目进行输出。本发明针对参加MCT考试的医学专业留学生,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述,海量的医学词典、医疗知识图谱为MCT题库智能生成提供医疗知识数据支撑,实现医学汉语资源的科学利用。
一方面,一种基于知识约束的MCT完形填空智能出题方法,包括以下步骤:
S1:医疗文本出题语料筛选步骤
S11:对医疗题干文本进行分词,分词结果存储于数组listOfStr中;
S12:将“中医疾病与病征编码”词典中词汇存储于数组txt中,如果listOfStr中的词汇包含于词典中,则舍弃对应的医疗题干文本;
S13:若医疗题干文本被保留,则依次遍历listOfStr中的每个词语,判断listOfStr中的每个词语是否都存在于“科室-疾病”医学词典department中;若存在,则对字典time中的相同键次数+1;
S14:遍历结束后,找出字典time中键次数最大的值,即出现次数最多的科室,将该科室名判断为题干文本的类别;若类别符合MCT出题要求,则该医疗题干文本保留;
S15:若保留医疗题干文本,将HSK中文水平等级的等级词汇“HSK”存储于数组strDict1中;
S16:依次遍历listOfStr中的每个词语,在数组strDict1中寻找词语对应的HSK中文水平等级;设当前出题对应的MCT等级值为c,其中c包括一级、二级和三级,设置MCT等级一级对应HSK1-4级、MCT等级二级对应HSK5级、MCT等级三级对应HSK6-9级;若词语对应的HSK等级超过其对应的MCT等级,则舍弃对应的医疗题干文本;
S17:若医疗题干文本被保留,则将该医疗题干文本确定为出题语料文本TextQuestion;
S2:考点词挖空步骤
S21:将MCT考试大纲中的等级词库小于当前出题MCT等级值c的词汇存储于数组strDict2中;所述等级词库包括词汇及其对应的MCT等级;
S22:判断listOfStr中的词语否存在于strDict2中,如果存在,则将该词语存储于候选挖空词组listLine中;
S23:如果候选挖空词组中词汇数量多于设定的MCT单题出题词语数量限定值n,则随机剔除词汇,保证剩余挖空词汇不多于n个,由剩余挖空词汇组成的词组为最终挖空词组;
S24:遍历最终挖空词组,对每个词在出题语料文本TextQuestion中找到该词第一处出现的位置,将该词替换为挖空字符“____”;
S23:基于完成挖空后的出题语料文本TextQuestion形成题干挖空文本;
S3:干扰项生成步骤
S31:创建题目选项数组key,遍历最终挖空词组中的词汇,每个词语依次存入数组key的第1个单元key[0];
S32:若key[0]存在于医学知识图谱中,则在该知识图谱中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,并将题目标注为“医学题”,将题目标注的值存入key的第5个单元中;
S33:若key[0]不存在于医学知识图谱中,则进一步判断key[0]是否存在于HSK中文水平等级词汇数组strDict1中,若存在,则在数组strDict1中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,将题目标注为“语法题”,将题目标注的值存入key的第5个单元中;
S34:若key[0]不存在于HSK中文水平等级词汇中,则在MCT考试大纲等级词库strDict3中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,将题目标注为“其它题”,将题目标注的值存入key的第5个单元中;
S4:完形填空题目输出步骤
S41:将获得与最终挖空词组的数量m一致的m个题目选项数组key作为题目列表;其中,m≤n。
S42:将题干挖空文本和题目列表组成完形填空题目进行输出。
另一方面,一种基于知识约束的MCT完形填空智能出题系统,包括:
医疗文本出题语料筛选模块,用于基于HSK中文水平等级和医学词典的知识约束对医疗文本进行篇章语义解析,筛选出符合要求的医疗文本作为出题语料;
考点词挖空模块,用于基于MCT等级的知识约束对出题语料进行考点词挖空,形成题干挖空文本;
干扰项生成模块,用于基于医学知识图谱、HSK中文水平等级和MCT等级的知识约束完成干扰项生成,获得题目列表;
完形填空题目输出模块,用于输出由题干挖空文本和题目列表组成的完形填空题目。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
本发明针对参加MCT考试的医学专业留学生,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述,海量的医学词典、医疗知识图谱为MCT题库智能生成提供医疗知识数据支撑,实现医学汉语资源的科学利用。
附图说明
图1为本发明的基于知识约束的MCT完形填空智能出题方法的流程图;
图2为本发明的基于知识约束的MCT完形填空智能出题系统的结构框图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
参见图1所示,为本发明一种基于知识约束的MCT完形填空智能出题方法的详细步骤。
具体的,如下将以一个具体的实施例进行说明,已知题干文本“demo.txt”的内容如下表1。
表1
本发明方法对应的实施步骤如下:
S1:医疗文本出题语料筛选步骤
S11:对医疗题干文本进行分词,分词结果存储于数组listOfStr中。数组内容为:['history',”,'患者','胃会','反酸','偶尔','会痛','是','什么','病','医生','你好','很','高兴','能','帮到','你','胃炎','胃溃疡','都','有','这种','表现','可以','胃镜','检查','那要','吃','药好','吃点','奥美拉唑','和','铝','碳酸镁','片','看看','两种','一起','药','吗','的','怎么','吃法','多','大','年纪','啊','还有','其他','不适','79']
S12:将“中医疾病与病征编码”(https://pan.hqu.edu.cn/share/ 1545f0798a2e625 cf10f472fb8)中词汇存储于数组txt中。因listOfStr中的词汇不包含于其中,则该医疗题干文本保留。
S13:依次遍历listOfStr中的每个词语,是否存在于“科室-疾病”医学词典(https://pan.hqu.edu.cn/share/6394d8125e42c2d38b419a01e2)department中。若存在,则对字典time中的相同键次数+1。
S14:遍历结束后,找出字典time中数量最大的值,即出现次数最多的为“内科”。则该题干文本标注类型为“内科”。该类型符合MCT出题要求,故医疗题干文本保留。
S15:将HSK中文水平等级的等级词汇“HSK”存储于数组strDict1(https:// pan.hqu.edu.cn/share/a1a69fd1e5479dfde939ad2aac)中。
S16:依次遍历listOfStr中的每个词语,在数组strDict1中寻找该词语对应的HSK中文水平等级。设当前出题对应的MCT等级值为二,则listOfStr中的每个词语对应的HSK等级均未超过其对应的MCT等级,故该医疗题干文本保留。
S17:该医疗题干文本确定为出题语料文本TextQuestion。
S2:考点词挖空步骤
S21:将MCT考试大纲中的等级词库(包含词汇及其对应的MCT等级)小于当前出题MCT等级值二的词汇存储于数组strDict2((https://pan.hqu.edu.cn/share/ c868ac8e1fa2f3d633bcf2261d))中。
S22:判断listOfStr中的词汇是否存在于strDict2中,如果存在,则将该词存储于候选挖空词组listLine中。针对题干文本“demo.txt”的文本出题,存入候选挖空词组listLine中的词有:['反酸','什么','表现','胃镜','检查','片','怎么','年纪']。
S23:因为候选挖空词组中词汇数量多于MCT单题挖空词数量限定值4,则随机剔除词汇,保证剩余挖空词汇不多于4个。由剩余挖空词汇组成的词组为最终挖空词组,经随机剔除后生成的最终挖空词组为:['反酸','什么','表现','胃镜']。
S24:对最终挖空词组进行遍历,对每个词在出题语料文本TextQuestion中找到该词第一处出现的位置,将该词替换为挖空字符“____”。
S25:如步骤S24所述,完成挖空后的出题语料文本TextQuestion形成题干挖空文本。
最终形成的题干挖空文本如下表2。
表2
S3:干扰项生成步骤
S31:创建题目选项数组key,对最终挖空词组['反酸','什么','表现','胃镜']中的词汇遍历,每个词依次存入数组key的第1个单元key[0]。
S32:以“反酸”为例。因“反酸”存在于医学知识图谱(https://pan.hqu.edu.cn/ share/55d92f1b611e8046e41fed9fc9)中,则在该知识图谱中随机选择另外3个词语[“皱纹”,“哺乳”,“手掌”]构成干扰项,并将这3个字符串存入数组key的2-4单元中。并将题目标注为“医学题”,并将该标注值存入key的第5个单元中。
S33:以“什么”为例。因“什么”存在于HSK中文水平等级词汇数组strDict1中,则在数组strDict1中随机选择另外3个词语[“咱”,“哪些”,“各”]构成干扰项,并将这3个字符串存入数组key的2-4单元中。并将题目标注为“语法题”,并将该标注值存入key的第5个单元中。
S34:以“表现”为例。因“表现”不存在于知识图谱和HSK中文水平等级词汇数组strDict1中,则在MCT考试大纲等级词库strDict3(https://pan.hqu.edu.cn/share/ 49f9e6c9e6319589063357901d)中随机选择另外3个词语[“断端”,“胆石病”,“肺气肿”]构成干扰项,并将这3个字符串存入数组key的2-4单元中。并将题目标注为“其它题”,并将该标注值存入key的第5个单元中。
S4:完形填空题目输出步骤
S41:如步骤S3所述,获得与最终挖空词组数量4一致的4个题目选项数组key,即题目列表。针对题干文本“demo.txt”的文本生成的最终干扰项题目列表如下:
{[“反酸”,“皱纹”,“哺乳”,“手掌”,“医学题”]
[“什么”,“咱”,“哪些”,“各”,“语法题”]
[“表现”,“断端”,“胆石病”,“肺气肿”,“其它题”]
[“胃镜”,“胃镜”,“难产”,“失神”,“其它题”]}
S42:由题干挖空文本和题目列表组成完形填空题目进行输出。
最终生成的题目如下表3。
参见图2所示,本发明一种基于知识约束的MCT完形填空智能出题系统,包括:
医疗文本出题语料筛选模块201,用于基于HSK中文水平等级和医学词典的知识约束对医疗文本进行篇章语义解析,筛选出符合要求的医疗文本作为出题语料;
考点词挖空模块202,用于基于MCT等级的知识约束对出题语料进行考点词挖空,形成题干挖空文本;
干扰项生成模块203,用于基于医学知识图谱、HSK中文水平等级和MCT等级的知识约束完成干扰项生成,获得题目列表;
完形填空题目输出模块204,用于输出由题干挖空文本和题目列表组成的完形填空题目。
表3
一种基于知识约束的MCT完形填空智能出题系统的具体实现同基于知识约束的MCT完形填空智能出题方法,本实施例不再重复说明。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (2)
1.一种基于知识约束的MCT完形填空智能出题方法,包括以下步骤:
S1:医疗文本出题语料筛选步骤
S11:对医疗题干文本进行分词,分词结果存储于数组listOfStr中;
S12:将“中医疾病与病征编码”词典中词汇存储于数组txt中,如果listOfStr中的词汇包含于词典中,则舍弃对应的医疗题干文本;
S13:若医疗题干文本被保留,则依次遍历listOfStr中的每个词语,判断listOfStr中的每个词语是否都存在于“科室-疾病”医学词典department中;若存在,则对字典time中的相同键次数+1;
S14:遍历结束后,找出字典time中键次数最大的值,即出现次数最多的科室,将该科室名判断为题干文本的类别;若类别符合MCT出题要求,则该医疗题干文本保留;
S15:若保留医疗题干文本,将HSK中文水平等级的等级词汇“HSK”存储于数组strDict1中;
S16:依次遍历listOfStr中的每个词语,在数组strDict1中寻找词语对应的HSK中文水平等级;设当前出题对应的MCT等级值为c,其中c包括一级、二级和三级,设置MCT等级一级对应HSK1-4级、MCT等级二级对应HSK5级、MCT等级三级对应HSK6-9级;若词语对应的HSK等级超过其对应的MCT等级,则舍弃对应的医疗题干文本;
S17:若医疗题干文本被保留,则将该医疗题干文本确定为出题语料文本TextQuestion;
S2:考点词挖空步骤
S21:将MCT考试大纲中的等级词库小于当前出题MCT等级值c的词汇存储于数组strDict2中;所述等级词库包括词汇及其对应的MCT等级;
S22:判断listOfStr中的词语否存在于strDict2中,如果存在,则将该词语存储于候选挖空词组listLine中;
S23:如果候选挖空词组中词汇数量多于设定的MCT单题出题词语数量限定值n,则随机剔除词汇,保证剩余挖空词汇不多于n个,由剩余挖空词汇组成的词组为最终挖空词组;
S24:遍历最终挖空词组,对每个词在出题语料文本TextQuestion中找到该词第一处出现的位置,将该词替换为挖空字符“____”;
S23:基于完成挖空后的出题语料文本TextQuestion形成题干挖空文本;
S3:干扰项生成步骤
S31:创建题目选项数组key,遍历最终挖空词组中的词汇,每个词语依次存入数组key的第1个单元key[0];
S32:若key[0]存在于医学知识图谱中,则在该知识图谱中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,并将题目标注为“医学题”,将题目标注的值存入key的第5个单元中;
S33:若key[0]不存在于医学知识图谱中,则进一步判断key[0]是否存在于HSK中文水平等级词汇数组strDict1中,若存在,则在数组strDict1中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,将题目标注为“语法题”,将题目标注的值存入key的第5个单元中;
S34:若key[0]不存在于HSK中文水平等级词汇中,则在MCT考试大纲等级词库strDict3中随机选择另外3个词语构成干扰项,并将这3个字符串存入数组key的第2至第4单元中,将题目标注为“其它题”,将题目标注的值存入key的第5个单元中;
S4:完形填空题目输出步骤
S41:将获得与最终挖空词组的数量m一致的m个题目选项数组key作为题目列表;其中,m≤n。
S42:将题干挖空文本和题目列表组成完形填空题目进行输出。
2.一种基于知识约束的MCT完形填空智能出题系统,包括:
医疗文本出题语料筛选模块,用于基于HSK中文水平等级和医学词典的知识约束对医疗文本进行篇章语义解析,筛选出符合要求的医疗文本作为出题语料;
考点词挖空模块,用于基于MCT等级的知识约束对出题语料进行考点词挖空,形成题干挖空文本;
干扰项生成模块,用于基于医学知识图谱、HSK中文水平等级和MCT等级的知识约束完成干扰项生成,获得题目列表;
完形填空题目输出模块,用于输出由题干挖空文本和题目列表组成的完形填空题目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464130.5A CN114781373A (zh) | 2022-04-29 | 2022-04-29 | 一种基于知识约束的mct完形填空智能出题方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464130.5A CN114781373A (zh) | 2022-04-29 | 2022-04-29 | 一种基于知识约束的mct完形填空智能出题方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114781373A true CN114781373A (zh) | 2022-07-22 |
Family
ID=82434238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210464130.5A Pending CN114781373A (zh) | 2022-04-29 | 2022-04-29 | 一种基于知识约束的mct完形填空智能出题方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781373A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010157199A (ja) * | 2008-12-02 | 2010-07-15 | Mie Univ | 自動演習システム及び自動演習プログラム |
CN110060749A (zh) * | 2019-04-10 | 2019-07-26 | 华侨大学 | 基于sev-sdg-cnn的电子病历智能诊断方法 |
CN110232180A (zh) * | 2019-06-06 | 2019-09-13 | 北京师范大学 | 一种面向古诗词测评的自动命题方法和系统 |
CN110516232A (zh) * | 2019-07-22 | 2019-11-29 | 北京师范大学 | 一种用于汉语评测的自动命题方法和系统 |
CN111311459A (zh) * | 2020-03-16 | 2020-06-19 | 宋继华 | 一种面向国际汉语教学的交互式出题方法及系统 |
CN112015883A (zh) * | 2020-08-24 | 2020-12-01 | 上海松鼠课堂人工智能科技有限公司 | 英文题目自动生成方法和系统 |
CN112948453A (zh) * | 2021-04-07 | 2021-06-11 | 浙江创课网络科技有限公司 | 一种基于题目难度出卷的系统 |
CN113065334A (zh) * | 2021-03-24 | 2021-07-02 | 广州摩翼信息科技有限公司 | 一种基于阅读理解练习的词汇水平测试处理方法及系统 |
CN113505195A (zh) * | 2021-06-24 | 2021-10-15 | 作业帮教育科技(北京)有限公司 | 知识库及其构建、检索方法、基于其的出题方法和系统 |
CN113627137A (zh) * | 2021-10-11 | 2021-11-09 | 江西软云科技股份有限公司 | 一种题目生成方法、系统、存储介质及设备 |
-
2022
- 2022-04-29 CN CN202210464130.5A patent/CN114781373A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010157199A (ja) * | 2008-12-02 | 2010-07-15 | Mie Univ | 自動演習システム及び自動演習プログラム |
CN110060749A (zh) * | 2019-04-10 | 2019-07-26 | 华侨大学 | 基于sev-sdg-cnn的电子病历智能诊断方法 |
CN110232180A (zh) * | 2019-06-06 | 2019-09-13 | 北京师范大学 | 一种面向古诗词测评的自动命题方法和系统 |
CN110516232A (zh) * | 2019-07-22 | 2019-11-29 | 北京师范大学 | 一种用于汉语评测的自动命题方法和系统 |
CN111311459A (zh) * | 2020-03-16 | 2020-06-19 | 宋继华 | 一种面向国际汉语教学的交互式出题方法及系统 |
CN112015883A (zh) * | 2020-08-24 | 2020-12-01 | 上海松鼠课堂人工智能科技有限公司 | 英文题目自动生成方法和系统 |
CN113065334A (zh) * | 2021-03-24 | 2021-07-02 | 广州摩翼信息科技有限公司 | 一种基于阅读理解练习的词汇水平测试处理方法及系统 |
CN112948453A (zh) * | 2021-04-07 | 2021-06-11 | 浙江创课网络科技有限公司 | 一种基于题目难度出卷的系统 |
CN113505195A (zh) * | 2021-06-24 | 2021-10-15 | 作业帮教育科技(北京)有限公司 | 知识库及其构建、检索方法、基于其的出题方法和系统 |
CN113627137A (zh) * | 2021-10-11 | 2021-11-09 | 江西软云科技股份有限公司 | 一种题目生成方法、系统、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107748757B (zh) | 一种基于知识图谱的问答方法 | |
CN111415740B (zh) | 问诊信息的处理方法、装置、存储介质及计算机设备 | |
CN109684448B (zh) | 一种智能问答方法 | |
CN110210037B (zh) | 面向循证医学领域的类别检测方法 | |
CN112597774B (zh) | 中文医疗命名实体识别方法、系统、存储介质和设备 | |
CN112650840A (zh) | 一种基于知识图谱推理的医疗智能问答处理方法及系统 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
CN113505243A (zh) | 基于医疗知识图谱的智能问答方法和装置 | |
Sharma et al. | A survey of methods, datasets and evaluation metrics for visual question answering | |
CN112667799B (zh) | 一种基于语言模型和实体匹配的医疗问答系统构建方法 | |
CN111625658A (zh) | 基于知识图谱的语音交互方法、装置、设备及存储介质 | |
WO2023029506A1 (zh) | 病情分析方法、装置、电子设备及存储介质 | |
CN111046272A (zh) | 一种基于医疗知识图谱的智能问答系统 | |
Potts et al. | Encoding and retrieval in comparative judgments | |
CN113569023A (zh) | 一种基于知识图谱的中文医药问答系统及方法 | |
WO2023029501A1 (zh) | 智能问诊方法、装置、电子设备及存储介质 | |
CN113764112A (zh) | 一种在线医疗问答方法 | |
CN112328773A (zh) | 基于知识图谱的问答实现方法和系统 | |
CN116881425A (zh) | 一种通用型文档问答实现方法、系统、设备及存储介质 | |
CN113254609B (zh) | 一种基于负样本多样性的问答模型集成方法 | |
CN111191045A (zh) | 一种应用于知识图谱的实体对齐方法及系统 | |
CN114781373A (zh) | 一种基于知识约束的mct完形填空智能出题方法及系统 | |
CN115525751A (zh) | 一种基于知识图谱的智能问答系统和方法 | |
CN115905554A (zh) | 一种基于多学科分类的中文学术知识图谱构建方法 | |
CN115905852A (zh) | 基于预训练提示的故事生成方法、系统、存储介质和终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |