CN113505195A - 知识库及其构建、检索方法、基于其的出题方法和系统 - Google Patents

知识库及其构建、检索方法、基于其的出题方法和系统 Download PDF

Info

Publication number
CN113505195A
CN113505195A CN202110707931.5A CN202110707931A CN113505195A CN 113505195 A CN113505195 A CN 113505195A CN 202110707931 A CN202110707931 A CN 202110707931A CN 113505195 A CN113505195 A CN 113505195A
Authority
CN
China
Prior art keywords
question
knowledge
knowledge base
assertion
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110707931.5A
Other languages
English (en)
Inventor
崔寅生
刘培娜
王锋辉
王伟戌
陶扬
韩均雷
潘东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baige Feichi Technology Co.,Ltd.
Original Assignee
Zuoyebang Education Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zuoyebang Education Technology Beijing Co Ltd filed Critical Zuoyebang Education Technology Beijing Co Ltd
Priority to CN202110707931.5A priority Critical patent/CN113505195A/zh
Publication of CN113505195A publication Critical patent/CN113505195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Educational Technology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种知识库及其构建、检索方法、基于其的出题方法和系统。所述知识库的构建方法包括:将最小粒度的知识点存储在单一条目中形成所述知识库。本发明还提出一种基于所述知识库的出题方法,包括:检索知识库得一知识条目;将所述知识条目切分成多个实词;根据出题类型对一个或多个实词进行处理,即得到待出的题干和答案。本发明构建的知识库结构简单、检索速度快,非常方便于中小学生对各种题型的变换出题,能够极大地节省存储空间,节约出题资源和成本。

Description

知识库及其构建、检索方法、基于其的出题方法和系统
技术领域
本发明属于数据知识库技术领域,更具体的是涉及一种知识库及其构建方法、检索方法、基于其的出题方法及系统,以及采用其的电子设备和计算机可读介质。
背景技术
随着技术的进步,各种帮助学生学习的软件应运而生,其中一大类就是试题库软件,该类型的软件可以为学生提供对应年级、水平的练习和考试试题,能够自动完成批改和点评,已成为了学生学习的好帮手。
对于试题库来说,其中收录了多种试题类型,例如选择题、填空题、判断题和应用题等。在学生习题中经常出现一个概念反复考查的情形,例如对于数学中的一个公理、定理或某种规则,如乘法口诀,经常会针对其故意缺少一个特征来提出问题。如果每一个问题都通过题干-答案的形式去存储的话,将会浪费大量的存储空间。对于这种基于同一个概念出不同题目考察时,可能会从不同角度、不同题型去重新设计、去存储答案、去搜索答案的情形,如何避免精力和成本的浪费是值得研究的问题。
发明内容
有鉴于此,本发明的主要目的在于提出一种知识库及其构建、检索方法、基于其的出题方法和系统,以期至少部分地解决上述技术问题中的至少之一。
为了实现上述目的,作为本发明的第一个方面,提供了一种知识库的构建方法,包括如下步骤:
将最小粒度的知识点存储在单一条目中形成所述知识库。
所述最小粒度的知识点为一条公理、一条定理或一个规则。
所述将最小粒度的知识点存储在单一条目中形成知识库的步骤包括:将所述最小粒度的知识点以断言的形式存储在单一条目中形成所述知识库;或者抽取所述最小粒度的知识点的实体关系,并采用结构化表述或者知识图谱表述将其存储在单一条目中形成所述知识库。
可选地,所述将最小粒度的知识点以断言的形式存储在单一条目中形成知识库的步骤包括:对待入库的知识进行断言抽取,抽取的一个断言对应一个最小粒度的知识点;将每个断言存储于一个单一条目中形成所述知识库。
作为优选,进行断言抽取时,捕捉断言语句并进行切分,根据所切分的断言与上下文的相关性判断所切分的断言是否是完整的断言。
可选地,所述知识库中还存储有与所述知识点相对应的出题信息。
可选地,所述出题信息包括下述中的至少一项:所述知识点相对应的学科类别、适用年级、适用学生年龄段。
作为本发明的第二个方面,还提供了一种知识库,其通过如上所述的任一构建方法构建而成。
作为本发明的第三个方面,还提供了一种知识条目的检索方法,包括如下步骤:将若干个关键词在所述知识库中进行检索,当所有关键词都落入所述知识库中的某一单一条目中时,即表示检索命中相应知识条目,所述若干个关键词基于欲检索的知识点或待检索的题目。
可选地,当所述若干个关键词基于待检索的题目时,所述方法还包括:在检索之前识别所述题目的类型;当所述题目的类型为知识类题目时,将若干个关键词在所述知识库中进行检索。
可选地,在进行检索之前,所述知识条目检索方法还包括:查找所述关键词的同义词和/或近似表达方式;在所述知识库中进行检索时,采用所述关键词,以及所述关键词的同义词和/或近似表达方式进行检索。
作为本发明的第四个方面,还提供了一种基于知识库的出题方法,包括如下步骤:根据出题人提供的出题信息,在所述知识库中检索知识条目;根据出题人的指令,从检索到的知识条目中确定一个或多个知识条目作为出题依据;将作为出题依据的一个或多个所述知识条目的每一个切分成多个实词;根据出题类型对所述多个实词中的一个或多个进行出题处理,即得到待出的题干和答案。
可选地,所述出题类型包括选择题、填空题、判断题和/或改错题;
作为优选,所述根据出题类型对实词进行出题处理的步骤,包括:
在所述多个实词中选择至少一个实词;
如果是选择题,则从预先设置的备选答案库中检索几个与所选实词不同义的短语作为选项;如果是判断题或改错题,则保留所选实词不变或用其它实词进行替换;如果是填空题,则直接将所选实词对应替换成空格,并将所选实词作为答案;
作为优选,在检索之前还包括如下步骤:根据所述出题信息,将所述知识库的检索范围限缩到对应的出题范围,再在所述出题范围之内根据所述出题信息进行检索。
作为本发明的第六个方面,还提供了一种基于知识库的出题系统,包括:
知识点检索单元,根据出题人提供的出题信息,在如上所述的知识库中随机检索知识条目;
知识点切分单元,用于将检索到的知识条目切分成多个独立的实词;
出题单元,用于根据指定的出题类型,对其中一个或多个实词进行出题处理,得到题目的题干和答案。
作为本发明的第七个方面,还提供了一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机可执行程序被所述处理器执行时,所述处理器执行如上所述的方法。
作为本发明的第八个方面,还提供了一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现如上所述的方法。
基于上述技术方案可知,本发明的知识库及其构建、检索方法、基于其的出题方法和系统相对于现有技术至少具有如下有益效果之一:
本发明设计的知识库不同于现有的各种多项目、多网格的知识库,而仅仅是简单收录一条条的单一知识条目,既节约了空间,又简化了数据库结构,减少了检索时间;
本发明设计的知识库能够非常独特地用于出题系统,可以通过知识库辅助系统的辅助处理,灵活机动地生成各种类型的试题,极大地简化了同一概念试题的存储空间,节约了设计时间成本;
本发明设计的出题系统将题目信息(一般包括题干和答案信息)拆分成最细粒度的知识断言,从而不管其怎么排列组合,均可以根据该最小粒度在本发明的知识库中找到对应资源来完成出题和解答,从而可以极大地节约存储资源和试题研发和解答的成本。
附图说明
图1是本发明的知识库的数据结构示意图;
图2是本发明的知识库的构建与维护方法的示意图;
图3是本发明的出题方法的方框流程图;
图4是本发明的电子设备的结构示意图;
图5是本发明的计算机可读记录介质的示意图;
具体实施方式
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
本发明是针对现在学生习题考查中经常出现一个概念反复考的情形而提出来的,例如数学领域对于一个公理、定理或某种规则,如乘法口诀,经常会针对其故意缺少一个特征来提出问题,如果每一个问题都通过题干 -答案的形式去存储的话,将会浪费大量的存储空间,且对于同一个概念出题目时需要反反复复从不同角度去重新设计、去存储答案、去搜索答案,也造成很大精力和成本的浪费。
基于此,本发明提出了一种知识库的构建方法,包括:将最小粒度的知识点存储在单一条目中形成所述知识库。
优选地,将知识点以断言的形式存储在单一条目中形成所述知识库。后续可以基于所述条目形成试题,或者通过查询该知识库的条目获取考察知识这种类型的题目。
其中,本实施例所述知识点例如是一条公理、一条定理、一个规则,比如“两条平行线永远不相交”、“三角形三内角和为180°”、“四八三二”、……等等。
其中,这里的“最小粒度”是对知识点的限定,要求存储的知识点彼此独立,不能再切割,且逻辑上完整。一条最小粒度知识点只涉及一个知识点,而不是多个知识的组合。但需要注意的是,这里的知识点虽然是最小粒度,不能再切割,也还是一个完整的叙述,而不是孤立的一个名词、一个概念。例如,所述知识点是一条公理、一条定理、一个规则,比如“两条平行线永远不相交”、“三角形三内角和为180°”、“四八三二”、……等等。反面事例例如,仅是一个名词概念,比如“三角形”、“内角”不能构成这里的知识点。
其中,本发明的方法还可以进一步优化为:
将所述最小粒度的知识点以断言的形式存储在单一条目中形成所述知识库;或者
抽取所述最小粒度的知识点的实体关系,并采用结构化表述或者知识图谱表述将其存储在单一条目中形成所述知识库。
在本发明中,“断言”原本是一个编程领域的术语,表示为一些布尔表达,在这里借用来表示一种表示肯定的论断,因为能够收录到知识库中通常都应该是正确的描述,且应该是完整的描述,不能带有缺陷、疑问或反问。在本发明中,最早的研发思路来自于数学习题,但该知识点并不限于数学,还可以例如是物理、化学、历史、地理、……等,只要知识点能够形成一个大家公认的完整逻辑闭环(断言),根据其中大部分内容可以准确无误地确定其余部分的内容。其它领域的例子例如:生物学科的“正常人类包括23对染色体”,等等。而对于开放性答案的试题则无法形成断言,例如“你的人生理想职业是——”,可以回答“教师”、“企业家”、“科学家”、……等各种答案,由于每个人看法都不尽相同,由此没有标准答案,也就无法形成断言收录。
其中,这里的结构化表述或知识图谱表述例如是本领域公知的,通过思维导图等图形或者通过插入标签或特定符号而生成的具有结构或关系的若干实词的文本进行的表述。这里优选采用文本表述,因为便于存储和进一步加工处理。
其中,将最小粒度的知识点以断言的形式存储在单一条目中形成知识库的具体步骤例如可包括:
对待入库的知识进行断言抽取,抽取的一个断言对应一个最小粒度的知识点;
将每个断言存储于一个单一条目中形成所述知识库;
其中,在进行断言抽取的步骤中,还可以包括捕捉断言语句并进行切分,根据所切分的断言与上下文的相关性判断所切分的断言是否是完整的断言。通过断言识别和切分,可以捕获最小粒度的知识点。
其中,所述知识库中还存储有与所述知识点相对应的出题信息;
其中,所述出题信息例如包括下述中的至少一项:所述知识点相对应的学科类别、适用年级、适用学生年龄段、常见/参考考察点等。出题信息可以与所述知识点储存于同一条目中,也可以独立存储,但二者存在对应关系。本发明还提出了一种知识库,通过如上所述的构建方法构建而成。
如图1所示,这个知识库结构非常简单,就包括索引号和知识条目,也可以适当扩展,再加上学科类别、适应年级、适应年龄段等条目,由于条目非常简单,可以节约大量的存储空间。
本发明还提出了一种基于上述知识库的知识条目的检索方法,具体包括如下步骤:
确定检索用的若干个关键词,所述若干个关键词例如可基于欲检索的知识点或待检索的题目;
将所述若干个关键词在所述知识库中进行检索,当所有关键词都落入所述知识库中的某一单一条目中时,即表示检索命中相应知识条目。
其中,确定检索用的若干个关键词的步骤中,例如可以是直接输入拟检索的关键词,也可以是根据现有的题目,从其中确定要检索的关键词。出题时,可以基于欲检索的知识点,或者出题信息例如可以包括欲考查学生的年级、学科、难易程度等来确定关键词。在拍照搜题等检索题目对答案的情境中,可以从检索题目抽取/生成若干个关键词。
作为优选,检索题目例如是通过拍照、图片扫描识别或上网抓取的方式来获取,而从其中抓取关键词则可以通过常规的文本处理,对其进行分词,去停用词,整理得到相应的关键词。
其中,所述知识库也可以预先建立索引表,从知识条目和/或对应的出题信息中抽取则相应关键词建立索引表,通过索引表进行检索可以规范关键词检索中的无效检索结果。
其中,采用关键词进行检索之前还可以对其进行扩展,例如先通过查找所述关键词的同义词或其近似表达方式,从而避免某些不规范的表达未收录在知识库中而不能命中相应的知识条目。例如,“三角形三内角和为 180°”,通常采用关键词“三角形”、“内角和”和“180°”即可检索到,如果检索时输入关键词为“三角之和”去检索,就不会检索到结果。由此可以对一些关键词建立同义词和近似表达方式的扩展库,在采用其在知识库中检索之前,先在扩展库中查找是否存在同义词和/或近似表达方式,从而换成不同的表达进行检索之后,可能就能够检索到正确的知识条目。
扩展的具体步骤例如为:查找关键词的同义词或近似表达方式等,与原关键词以“或”的方式同时进行检索。由此,所述检索方法例如包括如下子步骤:
(1)将待检索的知识点(关键词)进行扩展处理(在预定义的相应同义词近义词库里查找其同义词、近似表达方式等,或者通过查字典或同时进行);
(2)以“或”的形式将所有知识点(关键词)在知识库中检索,查找同时满足所有检索条件的知识条目。
其中,为了避免出现某一表述超出收录的关键词的近义词库的情形,建议知识库中对于同一知识点尽量收录其不同的多种表述方式,因为虽然在检索时尽量对关键词进行扩展,但毕竟有些表述上的改变机器还是无法完全识别,所以建议在知识库中尽量将同一知识点的各种变体都收录,以避免遗漏。例如对于“三角形三内角和为180°”,换一种说法是“三角形中的一个内角等于180°减去另外两个内角的差值”,再继续推导可以得到“三角形中一个内角的补角等于与其不相邻的另外两个内角之和”,这三条可以作为三个知识条目进行存储。
在另一些实施例中,同一知识点的变体可以存储在同一条目中,检索时,通过关键词命中该条目后,再继续将待检索题目与同一条目中的同一知识点的各个变体进行比对,根据比对结果给出最匹配的一个作为检索结果。
本发明还提出了一种上述知识库的修改/维护方法,具体包括如下步骤:
在如上所述的知识库中定位到需要修改的某单一条目,对所述知识条目进行删除、修改和/或更新。
其中,所述定位的步骤通过如上所述的检索方法来实现。可通过关键词定位到需要修改的某单一条目。
本发明还提出了一种基于上述知识库的出题方法,具体包括如下步骤:
根据出题人提供的出题信息,在所述知识库中检索知识条目,其中,出题信息包括但不限于例如包括学科、年级、知识点关键词等等;
根据出题人的指令,从检索到的知识条目中确定一个或多个知识条目作为出题依据;
将作为出题依据的一个或多个所述知识条目中的每一个切分成多个实词;
根据出题类型对所述多个实词中的一个或多个进行出题处理,即得到待出的题干和答案;出题处理,是指根据出题类型将所述多个实词中的一个或多个进行去除、替换为易混淆实词,替换为反义词等等。
其中,所述出题类型例如可包括选择题、填空题、判断题和/或改错题等。但出题类型并不限于此,随着题目的花样越来越多,出题类型例如也可以包括其它的如连线题、气球题、……等等,只要题目本身满足答案相对封闭、固定的特点。
其中,根据出题类型对实词进行处理的步骤例如可包括但不限于:
在所述多个实词中选择至少一个实词;
如果是选择题,则从备选库中检索预定数目的与所选实词同义或不同义的选项;其中,由于选择题包括三选一、四选一、多选一等,包括单选、多选和不定项选择,所以正确答案可以不唯一,选项也不要求一定只有四个。
如果是判断题或改错题,则保留原实词不变或用其它实词进行替换;其它实词可以是同义或不同义的。
如果是填空题,则直接将若干实词对应成空格的位置,并将其作为答案。对于一些填空大题,可以有多个空白小题需要填写。
可选地,所述知识库中还可存储有与所述知识点相对应的题目库,供出题人出题时参考。但在检索题目答案时,可设置为对检索用户不可见。题目库中的题目可收录例如拍照搜题中收集到的基于同一知识点的各题目。
出题时用到的备选库可以提前设置,也可以基于上述在例如拍照搜题等场景中收集到的基于同一知识点的各题目提取的相关实词。
出题时,当出题人点选或框选某一个或几个实词作为考察点出题时,自动虚化选定的某一个或几个实词,同时在附近出现选自备选库的相关实词作为出题建议。对于只是条目:“三角形内角和为180度”,当出题人点选或框选“三角形”时,“三角形”虚化,并在“三角形”所在位置附件出现“替换为括号()?”“替换为括号四边形?”等菜单,可以辅助出题人进行题目处理,简化出题步骤。
其中,在检索之前还可以包括如下步骤:根据所述出题信息,将所述知识库的检索范围限缩到对应的出题范围,再在所述出题范围之内根据所述出题信息进行检索。
其中,所述限缩到对应的出题范围是指根据出题信息例如知识点所属年级、学科等,将检索范围限制到符合出题人需要的年级或学科的知识点。
此外,对于本出题方法并不排除同时检索多个不同的单一知识条目,对其进行组合出题的情形,只是由于这样的出题方式涉及多个知识条目的交叉使用,需要更强的语义逻辑识别系统来避免彼此冲突出错。
本发明还提出了一种基于如上所述的知识库的出题系统,具体包括:
出题人指示输入单元,用于输入出题人的指示和/或信息;
知识点检索单元,用于基于所述出题人的指示和/或信息在所述知识库中检索知识条目;
知识点切分单元,用于将所述知识点检索单元检索到的知识条目切分成多个独立的实词;
出题单元,用于根据出题人指定的出题类型,对所述知识点切分单元输出的所述实词中的一个或多个进行出题处理,得到待出的题干和答案。
其中,所述出题类型例如包括选择题、填空题、判断题和/或改错题等。
其中,所述知识点检索单元还可以根据知识点的分级,将检索范围限缩到符合出题人需要的年级或级别的知识点内。
其中,所述出题单元根据出题类型对实词进行处理的步骤例如包括但不限于:
如果是选择题,则从预先建立的备选库中检索预设数目的与所选实词同义或不同义的选择题选项;
如果是判断题或改错题,则保留原实词不变或用其它实词进行替换;
如果是填空题,则直接将所述实词对应成空格的位置,并将其作为答案。
本发明还公开了一种电子设备,其包括处理器和存储器,所述存储器用于存储计算机可执行程序,其中当所述计算机可执行程序被所述处理器执行时,所述处理器执行如上所述的方法。
该电子设备例如可以以通用计算设备的形式表现。其中,处理器可以是一个,也可以是多个且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
其中,存储器存储有计算机可执行程序,通常是机器可读的代码,该计算机可执行程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
该存储器包括易失性存储器,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(ROM)。
可选的,该实施方式中,电子设备还包括有I/O接口,其用于电子设备与外部的设备进行数据交换。I/O接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按钮、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
本发明还公开了一种计算机可读介质,其上存储有计算机可执行程序,其中所述计算机可执行程序被执行时,实现如上所述的方法。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如 Python、Java、C++等,还包括常规的过程式程序设计语言—诸如C语言、汇编语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。需要注意的是,下述实施例仅是用于说明本发明,而不是用于对本发明作出限制。
实施例1
图1是本发明的知识库的数据结构示意图,图2是本发明的知识库的构建与维护方法的方框示意图。如图1、2所示,本实施例的知识库的构建方法,具体包括如下步骤:
将知识点以断言的形式存储在单一条目中形成所述知识库。
图中以数学知识点“三角形三内角和为180°”、“四八三二”来进行举例,如图1所示,可以看到每一个知识点以一条条目的形式存储。
图4是本发明实施例1的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机可执行程序被所述处理器执行时,所述处理器执行如上所述的方法。
图5是本发明实施例1的计算机可读记录介质的示意图,如图5所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明如上所述的方法。
实施例2
本实施例为一种知识库的检索方法,具体包括如下步骤:
将若干个索引词在知识库中进行检索,当所有索引词都落入知识库中的某一单一条目中时,即表示检索到相应知识条目。
其中,将待检索的索引词进行扩展处理(查找同义词、近似表达方式),然后再以“或”的形式将所有索引词在知识库中检索,查找同时满足所有检索条件的知识条目。
例如,对于索引词“三角形”和“180°”,可以分别进行扩展“三边形”、“平角”、“一百八”、“一百八十度”等。
将上述索引词在知识库中检索,得到如下条目:
“三角形三内角和为180°”;
“三角形中的一个内角等于180°减去另外两个内角的差值”;
“三角形的一个内角与其补角之和为180°”
……
而如果增加索引词“内角和”,则可以精确定位到“三角形三内角和为180°”。
实施例3
如图3所示,本实施例的基于知识库的出题方法,包括如下步骤:
在如上所述的知识库中限缩到合适的出题范围,再在范围之内随机检索到相应的单一条目,将其切分成多个实词,根据出题类型对其中某一个实词进行处理,即得到待出的题干和答案。
这里同样以上面的知识条目“三角形三内角和为180°”为例,例如要出初中的几何试题,题目类型包括选择题、填空题和判断题,则系统检索到这一知识条目后,先对其进行切分,得到“三角形”、“三内角”、“内角和”和“180°”,然后根据出题类型对其中一个实词,例如“180°”进行处理,包括:
选择题:从备选库中随机检索几个与所选实词不同义的选项,由此检索得到“120°”、“150°”、“210°”等,与“180°”作为A、B、 C、D四个选项;
判断题:保留原实词不变,即让判断“三角形三内角和为180°”是否正确;而用其它实词进行替换时,例如用“150°”代替“180°”,让判断“三角形三内角和为150°”是否正确;
填空题,则直接将所述实词对应成空格的位置,例如“三角形三内角和为”,答案为“180°”。
通过对上述实施方式的描述,本领域的技术人员易于理解,本发明构建的知识库结构简单、检索速度快,非常方便于中小学生对各种题型的变换出题,能够极大地节省存储空间,节约出题资源和成本。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种知识库的构建方法,其特征在于,
将最小粒度的知识点存储在单一条目中形成所述知识库。
2.根据权利要求1所述的知识库的构建方法,其特征在于,
所述最小粒度的知识点为一条公理、一条定理或一个规则。
3.根据权利要求1或2所述的知识库的构建方法,其特征在于,所述将最小粒度的知识点存储在单一条目中形成知识库的步骤包括:
将所述最小粒度的知识点以断言的形式存储在单一条目中形成所述知识库;或者
抽取所述最小粒度的知识点的实体关系,并采用结构化表述或者知识图谱表述将其存储在单一条目中形成所述知识库。
可选地,所述将最小粒度的知识点以断言的形式存储在单一条目中形成知识库的步骤包括:对待入库的知识进行断言抽取,抽取的一个断言对应一个最小粒度的知识点;将每个断言存储于一个单一条目中形成所述知识库。
作为优选,进行断言抽取时,捕捉断言语句并进行切分,根据所切分的断言与上下文的相关性判断所切分的断言是否是完整的断言。
4.根据权利要求1所述的知识库的构建方法,其特征在于,所述知识库中还存储有与所述知识点相对应的出题信息;
可选地,所述出题信息包括下述中的至少一项:所述知识点相对应的学科类别、适用年级、适用学生年龄段、考察点。
5.一种知识库,其特征在于,通过如权利要求1-4中任一项所述的知识库的构建方法构建而成。
6.一种基于如权利要求5所述的知识库的知识条目检索方法,其特征在于,包括:
将若干个关键词在所述知识库中进行检索,当所有关键词都落入所述知识库中的某一单一条目中时,即表示检索命中相应知识条目,所述若干个关键词基于欲检索的知识点或待检索的题目;
可选地,当所述若干个关键词基于待检索的题目时,所述方法还包括:在检索之前识别所述题目的类型;当所述题目的类型为知识类题目时,将若干个关键词在所述知识库中进行检索。
7.根据权利要求6所述的知识条目检索方法,其特征在于,在进行检索之前,所述知识条目检索方法还包括:
查找所述关键词的同义词和/或近似表达方式;
在所述知识库中进行检索时,采用所述关键词,以及所述关键词的同义词和/或近似表达方式进行检索。
8.一种基于如权利要求5所述的知识库的出题方法,其特征在于,包括如下步骤:
根据出题人提供的出题信息,在所述知识库中检索知识条目;
根据出题人的指令,从检索到的知识条目中确定一个或多个知识条目作为出题依据;
将作为出题依据的一个或多个所述知识条目的每一个切分成多个实词;
根据出题类型对所述多个实词中的一个或多个进行出题处理,即得到待出的题干和答案;
可选地,所述出题类型包括选择题、填空题、判断题和/或改错题;
作为优选,所述根据出题类型对实词进行出题处理的步骤包括:
在所述多个实词中选择至少一个实词;
如果是选择题,则从预先设置的备选答案库中检索几个与所选实词不同义的短语作为选项;
如果是判断题或改错题,则保留所选实词不变或用其它实词进行替换;
如果是填空题,则直接将所选实词对应替换成空格,并将所选实词作为答案;
作为优选,在检索之前还包括如下步骤:根据所述出题信息,将所述知识库的检索范围限缩到对应的出题范围,再在所述出题范围之内根据所述出题信息进行检索。
9.一种基于如权利要求5所述的知识库的出题系统,其特征在于,包括:
知识点检索单元,根据出题人提供的出题信息,在所述知识库中检索知识条目;
知识点切分单元,用于将检索到的知识条目切分成多个独立的实词;
出题单元,用于根据指定的出题类型,对其中一个或多个实词进行出题处理,得到题目的题干和答案。
10.一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于:
当所述计算机可执行程序被所述处理器执行时,所述处理器执行如权利要求1-4、6-8中任一项所述的方法。
CN202110707931.5A 2021-06-24 2021-06-24 知识库及其构建、检索方法、基于其的出题方法和系统 Pending CN113505195A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110707931.5A CN113505195A (zh) 2021-06-24 2021-06-24 知识库及其构建、检索方法、基于其的出题方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110707931.5A CN113505195A (zh) 2021-06-24 2021-06-24 知识库及其构建、检索方法、基于其的出题方法和系统

Publications (1)

Publication Number Publication Date
CN113505195A true CN113505195A (zh) 2021-10-15

Family

ID=78010586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110707931.5A Pending CN113505195A (zh) 2021-06-24 2021-06-24 知识库及其构建、检索方法、基于其的出题方法和系统

Country Status (1)

Country Link
CN (1) CN113505195A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781373A (zh) * 2022-04-29 2022-07-22 华侨大学 一种基于知识约束的mct完形填空智能出题方法及系统
CN117829137A (zh) * 2024-03-06 2024-04-05 北京万物成理科技有限公司 汉语语素题目生成方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719005B1 (en) * 2006-02-10 2014-05-06 Rusty Shawn Lee Method and apparatus for using directed reasoning to respond to natural language queries
CN104765767A (zh) * 2015-05-12 2015-07-08 上海复勤商务咨询有限公司 针对智能学习的知识存储算法
CN109753656A (zh) * 2018-12-29 2019-05-14 咪咕互动娱乐有限公司 一种数据处理方法、装置及存储介质
CN111311459A (zh) * 2020-03-16 2020-06-19 宋继华 一种面向国际汉语教学的交互式出题方法及系统
CN112800182A (zh) * 2021-02-10 2021-05-14 联想(北京)有限公司 试题生成方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719005B1 (en) * 2006-02-10 2014-05-06 Rusty Shawn Lee Method and apparatus for using directed reasoning to respond to natural language queries
CN104765767A (zh) * 2015-05-12 2015-07-08 上海复勤商务咨询有限公司 针对智能学习的知识存储算法
CN109753656A (zh) * 2018-12-29 2019-05-14 咪咕互动娱乐有限公司 一种数据处理方法、装置及存储介质
CN111311459A (zh) * 2020-03-16 2020-06-19 宋继华 一种面向国际汉语教学的交互式出题方法及系统
CN112800182A (zh) * 2021-02-10 2021-05-14 联想(北京)有限公司 试题生成方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781373A (zh) * 2022-04-29 2022-07-22 华侨大学 一种基于知识约束的mct完形填空智能出题方法及系统
CN117829137A (zh) * 2024-03-06 2024-04-05 北京万物成理科技有限公司 汉语语素题目生成方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110502621B (zh) 问答方法、问答装置、计算机设备及存储介质
US10528878B2 (en) Tailoring question answering system output based on user experience
US10698977B1 (en) System and methods for processing fuzzy expressions in search engines and for information extraction
US11132370B2 (en) Generating answer variants based on tables of a corpus
US10713571B2 (en) Displaying quality of question being asked a question answering system
US10303767B2 (en) System and method for supplementing a question answering system with mixed-language source documents
US9373075B2 (en) Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation
US7877343B2 (en) Open information extraction from the Web
US10664530B2 (en) Control of automated tasks executed over search engine results
CN109657068B (zh) 面向智慧博物馆的文物知识图谱生成与可视化方法
CN111475623A (zh) 基于知识图谱的案件信息语义检索方法及装置
US20160071022A1 (en) Machine Learning Model for Level-Based Categorization of Natural Language Parameters
CN115455935A (zh) 一种文本信息智能处理系统
CN108829682B (zh) 计算机可读存储介质、智能问答方法及智能问答装置
US20190188271A1 (en) Supporting evidence retrieval for complex answers
Smith et al. Evaluating visual representations for topic understanding and their effects on manually generated topic labels
US10303766B2 (en) System and method for supplementing a question answering system with mixed-language source documents
US11461613B2 (en) Method and apparatus for multi-document question answering
US11868355B2 (en) System and method for personalized retrieval of academic content in a hierarchical manner
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN113505195A (zh) 知识库及其构建、检索方法、基于其的出题方法和系统
WO2021089129A1 (en) Analysis and comparison of character-coded digital data, in particular for job matching
US20190318220A1 (en) Dispersed template-based batch interaction with a question answering system
US11494560B1 (en) System and methodology for computer-facilitated development of reading comprehension test items through passage mapping
CN112559711A (zh) 一种同义文本提示方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230606

Address after: 6001, 6th Floor, No.1 Kaifeng Road, Shangdi Information Industry Base, Haidian District, Beijing, 100085

Applicant after: Beijing Baige Feichi Technology Co.,Ltd.

Address before: 100085 4002, 4th floor, No.1 Kaifa Road, Shangdi Information Industry base, Haidian District, Beijing

Applicant before: ZUOYEBANG EDUCATION TECHNOLOGY (BEIJING) CO.,LTD.

TA01 Transfer of patent application right