CN111666423A - 知识图谱构建方法及系统 - Google Patents

知识图谱构建方法及系统 Download PDF

Info

Publication number
CN111666423A
CN111666423A CN202010513045.4A CN202010513045A CN111666423A CN 111666423 A CN111666423 A CN 111666423A CN 202010513045 A CN202010513045 A CN 202010513045A CN 111666423 A CN111666423 A CN 111666423A
Authority
CN
China
Prior art keywords
target
extracted
solution
answer
phrases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010513045.4A
Other languages
English (en)
Other versions
CN111666423B (zh
Inventor
栗浩洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yixue Education Technology Co Ltd
Original Assignee
Shanghai Yixue Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yixue Education Technology Co Ltd filed Critical Shanghai Yixue Education Technology Co Ltd
Priority to CN202010513045.4A priority Critical patent/CN111666423B/zh
Publication of CN111666423A publication Critical patent/CN111666423A/zh
Application granted granted Critical
Publication of CN111666423B publication Critical patent/CN111666423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了知识图谱构建方法及系统,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。

Description

知识图谱构建方法及系统
技术领域
本发明涉及人工智能教育的技术领域,特别涉及知识图谱构建方法及系统。
背景技术
在教学过程中,学生的知识图谱能够准确地反映学生的知识掌握水平和知识掌握程度,并且还能够根据不同学生的知识图谱对其制定出有针对性地教学方案。目前,对于知识图谱的构建都只是对学生的作业数据和考试数据进行简单的分析汇总,其并不能对这些作业数据和考试数据进行智能化和纵向与横向深度化的智能挖掘分析,这严重地降低了知识图谱的可靠性和准确性。
发明内容
针对现有技术存在的缺陷,本发明提供知识图谱构建方法及系统,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM蒙特卡洛统计模拟等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。
本发明提供知识图谱构建方法,其特征在于,所述知识图谱构建方法包括如下步骤:
步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;
步骤S2,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;
步骤S3,从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;
步骤S4,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;
步骤S5,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱;
进一步,在所述步骤S1中,对预设对象进行拍照,以此获得预设对象照片具体包括,
步骤S101,对所述预设对象进行第一次拍照,以此获得第一预设对象照片,并分析计算所述第一预设对象照片中关于所述预设对象的拍照覆盖完整度和字符清晰度;
步骤S102,判断所述拍摄覆盖完整度是否超过预设拍摄覆盖比例阈值以及所述字符清晰度是否超过预设分辨率阈值,若是,则将所述第一预设对象照片作为所述步骤S2进行识别的目标照片,若否,则重新对所述预设对象进行拍照,直到重新获得的预设对象照片的拍摄覆盖完整度和字符清晰度分别超过所述预设拍摄覆盖比例阈值和所述预设分辨率阈值为止;
进一步,在所述步骤S2中,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容具体包括,
步骤S201,对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;
步骤S202,对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态;
进一步,在所述步骤S4中,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点具体包括,
以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;
Figure BDA0002529123380000031
在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;
或者,
在所述步骤S4中,对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,
Figure BDA0002529123380000041
在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;
自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤;
进一步,在所述步骤S5中,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱具体包括,
以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;
Figure BDA0002529123380000051
在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为所述标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定所述预设对象的知识图谱,其中,所述知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
本发明还提供知识图谱构建系统,其特征在于:
所述知识图谱构建系统包括拍照模块、照片识别模块、照片内容解析模块、知识点获取模块、解答步骤分析模块和知识图谱确定模块;其中,
所述拍照模块用于对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;
所述照片识别模块用于对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号
所述照片内容解析模块用于从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;
所述知识点获取模块用于对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;
所述解答步骤分析模块用于对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;
所述知识图谱确定模块用于根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱;
进一步,所述拍照模块包括拍照执行子模块、拍照覆盖完整度计算子模块、字符清晰度计算子模块和对象照片确定子模块;其中,
所述拍照执行子模块用于对所述预设对象进行拍照,以此获得对象照片;
所述拍照覆盖完整度计算子模块用于分析计算所述预设对象照片中关于所述预设对象的拍照覆盖完整度;
所述符清晰度计算子模块用于分析计算所述预设对象照片中关于所述预设对象的字符清晰度;
所述对象照片确定子模块在所述拍摄覆盖完整度超过预设拍摄覆盖比例阈值以及所述字符清晰度超过预设分辨率阈值时,将所述对象照片作为所述照片识别模块进行识别的目标照片;
进一步,所述照片识别模块包括第一识别子模块和第二识别子模块;其中,
所述第一识别子模块用于对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;
所述第二识别子模块用于对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态;
进一步,所述知识点获取模块用于对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点,具体包括,
以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;
Figure BDA0002529123380000071
在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;
或者,
所述解答步骤分析模块用于对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤,具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,
Figure BDA0002529123380000081
在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;
自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤;
进一步,所述知识图谱确定模块用于根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱,具体包括,
以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;
Figure BDA0002529123380000091
在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为所述标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定所述预设对象的知识图谱,其中,所述知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
相比于现有技术,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的知识图谱构建方法的流程示意图。
图2为本发明提供的知识图谱构建系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的知识图谱构建方法的流程示意图。该知识图谱构建方法包括如下步骤:
步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,该预设对象包括被老师批改过的学生所做的作业或者试卷;
步骤S2,对该预设对象照片进行识别,以此获得该预设对象所包含的预设内容,其中,该预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;
步骤S3,从该预设内容中获得该解答结果被评判为错误的目标题目的题目内容和解答结果;
步骤S4,对该目标题目的题目内容进行分析,以此获得该目标题目中包含的知识点;对该目标题目的解答结果进行分析,以此获得该目标题目的解答结果中开始出错的解答步骤;
步骤S5,根据该目标题目中包含的知识点和该目标题目的解答结果中开始出错的解答步骤,确定该预设对象的知识图谱。
该知识图谱构建方法通过对预设对象的作业和试卷进行照片拍摄和识别照片中的题目内容和解答结果,并应用智能化技术(例如MCM等技术)来完成对该题目内容和解答结果进行知识点和解答步骤的分析,以此准确地定位学生在完成作业和试卷过程中的出错解答步骤,从而有针对性地构建预设对象的知识图谱,该智能化技术(例如MCM等技术)本质上为人工智能数据分析技术,其能够对该题目内容和该解答结果进行细化的和有针对性的分析,从而保证该分析结果能够如实地反映学生的知识点掌握情况,以最大限度地优化该知识图谱的构建效率和准确性。
优选地,在该步骤S1中,对预设对象进行拍照,以此获得预设对象照片具体包括,
步骤S101,对该预设对象进行第一次拍照,以此获得第一预设对象照片,并分析计算该第一预设对象照片中关于该预设对象的拍照覆盖完整度和字符清晰度;
步骤S102,判断该拍摄覆盖完整度是否超过预设拍摄覆盖比例阈值以及该字符清晰度是否超过预设分辨率阈值,若是,则将该第一预设对象照片作为该步骤S2进行识别的目标照片,若否,则重新对该预设对象进行拍照,直到重新获得的预设对象照片的拍摄覆盖完整度和字符清晰度分别超过该预设拍摄覆盖比例阈值和该预设分辨率阈值为止。
通过判断对该预设对象的拍照后获得的照片相对于预设对象实体整体的覆盖完整度和拍摄字符清晰度是否满足预定数值条件,能够保证该照片能够最大限度反映该预设对象的数据完整性和真实性,从而避免发生照片无法识别或者识别错误的情况。
优选地,在该步骤S2中,对该预设对象照片进行识别,以此获得该预设对象所包含的预设内容具体包括,
步骤S201,对该预设对象照片进行关于字符撰写格式与否的第一识别处理,并将该预设对象照片中具有标准化字符撰写格式的部分识别为该题目内容、以及将该预设对象照片中具有手写化字符撰写格式的部分识别为该解答结果;
步骤S202,对该预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态。
通过第一识别处理和第二识别处理这两种不同的识别方式能够有效地识别区分题目内容部分和学生的题目解答部分,以及对该题目解答部分进行准确的对错状态识别,从而有效地保证对照片内容的识别区别准确性以及避免后续发生误分析的情况。
优选地,在该步骤S4中,对该目标题目的题目内容进行分析,以此获得该目标题目中包含的知识点具体包括,
以该目标题目的题目内容为锚点抽取该目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用该题目内容语义分析值匹配找到与该目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将该新的词组作为该知识点;
Figure BDA0002529123380000131
在上述公式(1)中,ni,j表示抽取到的该目标题目的题目内容的第i个单词和词组与未抽取到的该目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的该目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的该目标题目的题目内容的第j个单词和词组的词向量,w表示该目标题目的题目内容的单词和词组的总个数,v表示抽取到的该目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的该目标题目的题目内容的第i个单词和词组与未抽取到的该目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为该知识点。
通过上述公式(1)分析计算得到该知识点,能够有效地利用抽取到的目标题目的题目内容的单词和词组得到目标题目的题目内容上下文关联的且并未抽取到的单词和词组,从而扩大后续数据处理的对象范围,其能够更加准确地和全面地确定对应的知识点。
优选地,在该步骤S4中,对该目标题目的解答结果进行分析,以此获得该目标题目的解答结果中开始出错的解答步骤具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对该目标题目的解答结果进行相似度匹配计算,并根据该相似度匹配计算的结果确定该目标题目的解答结果中开始出错的解答步骤,
Figure BDA0002529123380000141
在上述公式(2)中,Hk表示该目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示该目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示该预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,该阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;
自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为该目标题目的解答结果中开始出错的解答步骤向量,并将该解答步骤向量对应的解答步骤作为该目标题目的解答结果中开始出错的解答步骤。
通过上述公式(2)确定该目标题目的解答结果中开始出错的解答步骤,其不仅一方面保证了后续的计算连续性,并且还另一方面提高计算的效率和便捷性。
优选地,在该步骤S5中,根据该目标题目中包含的知识点和该目标题目的解答结果中开始出错的解答步骤,确定该预设对象的知识图谱具体包括,
以该目标题目的解答结果中开始出错的解答步骤为锚点抽取该目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用该出错解答步骤语义分析值匹配找到与该目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将该新的词组作为标准错误解答步骤实体;
Figure BDA0002529123380000151
在上述公式(3)中,mt,g表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示该目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与该目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为该标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定该预设对象的知识图谱,其中,该知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
通过上述公式(3)计算得到该标准错误解答步骤实体,这样能够有效地扩大知识图谱的知识点覆盖范围和知识图谱的实用性。
参阅图2,为本发明实施例提供的知识图谱构建系统的结构示意图。该知识图谱构建系统包括拍照模块、照片识别模块、照片内容解析模块、知识点获取模块、解答步骤分析模块和知识图谱确定模块;其中,
该拍照模块用于对预设对象进行拍照,以此获得预设对象照片,其中,该预设对象包括被老师批改过的学生所做的作业或者试卷;
该照片识别模块用于对该预设对象照片进行识别,以此获得该预设对象所包含的预设内容,其中,该预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号
该照片内容解析模块用于从该预设内容中获得该解答结果被评判为错误的目标题目的题目内容和解答结果;
该知识点获取模块用于对该目标题目的题目内容进行分析,以此获得该目标题目中包含的知识点;
该解答步骤分析模块用于对该目标题目的解答结果进行分析,以此获得该目标题目的解答结果中开始出错的解答步骤;
该知识图谱确定模块用于根据该目标题目中包含的知识点和该目标题目的解答结果中开始出错的解答步骤,确定该预设对象的知识图谱。
该知识图谱构建系统通过对预设对象的作业和试卷进行照片拍摄和识别照片中的题目内容和解答结果,并应用智能化技术(例如MCM等技术)来完成对该题目内容和解答结果进行知识点和解答步骤的分析,以此准确地定位学生在完成作业和试卷过程中的出错解答步骤,从而有针对性地构建预设对象的知识图谱,该智能化技术(例如MCM等技术)本质上为人工智能数据分析技术,其能够对该题目内容和该解答结果进行细化的和有针对性的分析,从而保证该分析结果能够如实地反映学生的知识点掌握情况,以最大限度地优化该知识图谱的构建效率和准确性。
优选地,该拍照模块包括拍照执行子模块、拍照覆盖完整度计算子模块、字符清晰度计算子模块和对象照片确定子模块;其中,
该拍照执行子模块用于对该预设对象进行拍照,以此获得对象照片;
该拍照覆盖完整度计算子模块用于分析计算该预设对象照片中关于该预设对象的拍照覆盖完整度;
该符清晰度计算子模块用于分析计算该预设对象照片中关于该预设对象的字符清晰度;
该对象照片确定子模块在该拍摄覆盖完整度超过预设拍摄覆盖比例阈值以及该字符清晰度超过预设分辨率阈值时,将该对象照片作为该照片识别模块进行识别的目标照片。
通过判断对该预设对象的拍照后获得的照片相对于预设对象实体整体的覆盖完整度和拍摄字符清晰度是否满足预定数值条件,能够保证该照片能够最大限度反映该预设对象的数据完整性和真实性,从而避免发生照片无法识别或者识别错误的情况。
优选地,该照片识别模块包括第一识别子模块和第二识别子模块;其中,
该第一识别子模块用于对该预设对象照片进行关于字符撰写格式与否的第一识别处理,并将该预设对象照片中具有标准化字符撰写格式的部分识别为该题目内容、以及将该预设对象照片中具有手写化字符撰写格式的部分识别为该解答结果;
该第二识别子模块用于对该预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态。
通过第一识别处理和第二识别处理这两种不同的识别方式能够有效地识别区分题目内容部分和学生的题目解答部分,以及对该题目解答部分进行准确的对错状态识别,从而有效地保证对照片内容的识别区别准确性以及避免后续发生误分析的情况。
优选地,该知识点获取模块用于对该目标题目的题目内容进行分析,以此获得该目标题目中包含的知识点,具体包括,
以该目标题目的题目内容为锚点抽取该目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用该题目内容语义分析值匹配找到与该目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将该新的词组作为该知识点;
Figure BDA0002529123380000181
在上述公式(1)中,ni,j表示抽取到的该目标题目的题目内容的第i个单词和词组与未抽取到的该目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的该目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的该目标题目的题目内容的第j个单词和词组的词向量,w表示该目标题目的题目内容的单词和词组的总个数,v表示抽取到的该目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的该目标题目的题目内容的第i个单词和词组与未抽取到的该目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为该知识点。
通过上述公式(1)分析计算得到该知识点,能够有效地利用抽取到的目标题目的题目内容的单词和词组得到目标题目的题目内容上下文关联的且并未抽取到的单词和词组,从而扩大后续数据处理的对象范围,其能够更加准确地和全面地确定对应的知识点。
优选地,该解答步骤分析模块用于对该目标题目的解答结果进行分析,以此获得该目标题目的解答结果中开始出错的解答步骤,具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对该目标题目的解答结果进行相似度匹配计算,并根据该相似度匹配计算的结果确定该目标题目的解答结果中开始出错的解答步骤,
Figure BDA0002529123380000191
在上述公式(2)中,Hk表示该目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示该目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示该预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,该阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;
自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为该目标题目的解答结果中开始出错的解答步骤向量,并将该解答步骤向量对应的解答步骤作为该目标题目的解答结果中开始出错的解答步骤。
通过上述公式(2)确定该目标题目的解答结果中开始出错的解答步骤,其不仅一方面保证了后续的计算连续性,并且还另一方面提高计算的效率和便捷性。
优选地,该知识图谱确定模块用于根据该目标题目中包含的知识点和该目标题目的解答结果中开始出错的解答步骤,确定该预设对象的知识图谱,具体包括,
以该目标题目的解答结果中开始出错的解答步骤为锚点抽取该目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用该出错解答步骤语义分析值匹配找到与该目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将该新的词组作为标准错误解答步骤实体;
Figure BDA0002529123380000201
在上述公式(3)中,mt,g表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示该目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的该目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的该目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与该目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的该目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为该标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定该预设对象的知识图谱,其中,该知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
通过上述公式(3)计算得到该标准错误解答步骤实体,这样能够有效地扩大知识图谱的知识点覆盖范围和知识图谱的实用性。
从上述实施例的内容可知,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.知识图谱构建方法,其特征在于,所述知识图谱构建方法包括如下步骤:
步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;
步骤S2,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;
步骤S3,从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;
步骤S4,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;
步骤S5,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱。
2.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S1中,对预设对象进行拍照,以此获得预设对象照片具体包括,
步骤S101,对所述预设对象进行第一次拍照,以此获得第一预设对象照片,并分析计算所述第一预设对象照片中关于所述预设对象的拍照覆盖完整度和字符清晰度;
步骤S102,判断所述拍摄覆盖完整度是否超过预设拍摄覆盖比例阈值以及所述字符清晰度是否超过预设分辨率阈值,若是,则将所述第一预设对象照片作为所述步骤S2进行识别的目标照片,若否,则重新对所述预设对象进行拍照,直到重新获得的预设对象照片的拍摄覆盖完整度和字符清晰度分别超过所述预设拍摄覆盖比例阈值和所述预设分辨率阈值为止。
3.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S2中,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容具体包括,
步骤S201,对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;
步骤S202,对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态。
4.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S4中,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点具体包括,
以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;
Figure FDA0002529123370000021
在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;
或者,
在所述步骤S4中,对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,
Figure FDA0002529123370000031
在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤。
5.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S5中,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱具体包括,
以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;
Figure FDA0002529123370000041
在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为所述标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定所述预设对象的知识图谱,其中,所述知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
6.知识图谱构建系统,其特征在于:
所述知识图谱构建系统包括拍照模块、照片识别模块、照片内容解析模块、知识点获取模块、解答步骤分析模块和知识图谱确定模块;其中,所述拍照模块用于对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;
所述照片识别模块用于对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号
所述照片内容解析模块用于从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;
所述知识点获取模块用于对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;
所述解答步骤分析模块用于对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;
所述知识图谱确定模块用于根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱。
7.如权利要求6所述的知识图谱构建方系统,其特征在于:
所述拍照模块包括拍照执行子模块、拍照覆盖完整度计算子模块、字符清晰度计算子模块和对象照片确定子模块;其中,
所述拍照执行子模块用于对所述预设对象进行拍照,以此获得对象照片;
所述拍照覆盖完整度计算子模块用于分析计算所述预设对象照片中关于所述预设对象的拍照覆盖完整度;
所述符清晰度计算子模块用于分析计算所述预设对象照片中关于所述预设对象的字符清晰度;
所述对象照片确定子模块在所述拍摄覆盖完整度超过预设拍摄覆盖比例阈值以及所述字符清晰度超过预设分辨率阈值时,将所述对象照片作为所述照片识别模块进行识别的目标照片。
8.如权利要求6所述的知识图谱构建方系统,其特征在于:
所述照片识别模块包括第一识别子模块和第二识别子模块;其中,
所述第一识别子模块用于对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;
所述第二识别子模块用于对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态。
9.如权利要求6所述的知识图谱构建方系统,其特征在于:
所述知识点获取模块用于对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点,具体包括,
以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;
Figure FDA0002529123370000071
在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;
或者,
所述解答步骤分析模块用于对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤,具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,
Figure FDA0002529123370000081
在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤。
10.如权利要求6所述的知识图谱构建方系统,其特征在于:
所述知识图谱确定模块用于根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱,具体包括,
以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;
Figure FDA0002529123370000091
在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为所述标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定所述预设对象的知识图谱,其中,所述知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。
CN202010513045.4A 2020-06-08 2020-06-08 知识图谱构建方法及系统 Active CN111666423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010513045.4A CN111666423B (zh) 2020-06-08 2020-06-08 知识图谱构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010513045.4A CN111666423B (zh) 2020-06-08 2020-06-08 知识图谱构建方法及系统

Publications (2)

Publication Number Publication Date
CN111666423A true CN111666423A (zh) 2020-09-15
CN111666423B CN111666423B (zh) 2024-04-05

Family

ID=72387028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010513045.4A Active CN111666423B (zh) 2020-06-08 2020-06-08 知识图谱构建方法及系统

Country Status (1)

Country Link
CN (1) CN111666423B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101481498B1 (ko) * 2014-05-07 2015-01-13 오종현 시험지의 자동채점 및 오답데이터 관리 시스템
WO2017117787A1 (zh) * 2016-01-07 2017-07-13 汤美 一种智能教学系统
WO2018006294A1 (zh) * 2016-07-06 2018-01-11 王楚 一种基于图像模式识别技术的阅卷系统、装置和方法
CN108109453A (zh) * 2017-12-29 2018-06-01 广州大学 作业批改装置
CN109785691A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种通过终端辅助学习的方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101481498B1 (ko) * 2014-05-07 2015-01-13 오종현 시험지의 자동채점 및 오답데이터 관리 시스템
WO2017117787A1 (zh) * 2016-01-07 2017-07-13 汤美 一种智能教学系统
WO2018006294A1 (zh) * 2016-07-06 2018-01-11 王楚 一种基于图像模式识别技术的阅卷系统、装置和方法
CN108109453A (zh) * 2017-12-29 2018-06-01 广州大学 作业批改装置
CN109785691A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种通过终端辅助学习的方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张站;刘政怡;吴建国;李炜;: "基于图像识别的阅卷系统的设计与实现" *
韩磊;黄陈蓉;林忠;蔡玮;: "简答题在线自动批改系统的研究" *

Also Published As

Publication number Publication date
CN111666423B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
CN109271401B (zh) 一种题目搜索、批改方法、装置、电子设备和存储介质
CN110008933B (zh) 一种通用智能阅卷系统和方法
CN111144191B (zh) 字体识别方法、装置、电子设备及存储介质
CN104268603B (zh) 用于文字性客观题的智能阅卷方法及系统
CN109284355B (zh) 一种批改试卷中口算题的方法及装置
CN108090857A (zh) 一种多模态的学生课堂行为分析系统和方法
CN109189895B (zh) 一种针对口算题的题目批改方法及装置
CN112381099A (zh) 一种基于数字教育资源的录题系统
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN111539456B (zh) 一种目标识别方法及设备
CN111597305B (zh) 实体标记方法、装置、计算机设备和存储介质
CN115661836A (zh) 一种自动批改方法、装置、系统及可读存储介质
CN110555375B (zh) 答题卡填涂信息的识别方法
WO2020199512A1 (zh) 一种题目信息采集的方法及系统
CN112686263B (zh) 文字识别方法、装置、电子设备及存储介质
CN113822907A (zh) 图像处理方法及装置
CN112991410A (zh) 一种文本图像配准方法、电子设备及其存储介质
CN111666423B (zh) 知识图谱构建方法及系统
TWI799236B (zh) 自動閱卷方法及系統
CN116884006A (zh) 结合视觉扫描识别与纠正的数学解题方法和系统
CN115358232A (zh) 一种试题答案解析方法及系统
CN114140282B (zh) 一种基于深度学习的普教课堂答题快速评审方法及装置
CN113344079A (zh) 一种图像标签半自动标注方法、系统、终端及介质
CN111460821A (zh) 一种实体识别与链接方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200237 9 / F and 10 / F, building 2, No. 188, Yizhou Road, Xuhui District, Shanghai

Applicant after: Shanghai squirrel classroom Artificial Intelligence Technology Co.,Ltd.

Address before: 200237 9 / F and 10 / F, building 2, No. 188, Yizhou Road, Xuhui District, Shanghai

Applicant before: SHANGHAI YIXUE EDUCATION TECHNOLOGY Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant