CN116597461A - 基于人工智能的题目知识点关联方法及系统 - Google Patents

基于人工智能的题目知识点关联方法及系统 Download PDF

Info

Publication number
CN116597461A
CN116597461A CN202310863259.8A CN202310863259A CN116597461A CN 116597461 A CN116597461 A CN 116597461A CN 202310863259 A CN202310863259 A CN 202310863259A CN 116597461 A CN116597461 A CN 116597461A
Authority
CN
China
Prior art keywords
text
semantic
text information
ocr
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310863259.8A
Other languages
English (en)
Other versions
CN116597461B (zh
Inventor
黎国权
朱晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Xinjufeng Technology Co ltd
Original Assignee
Guangdong Xinjufeng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Xinjufeng Technology Co ltd filed Critical Guangdong Xinjufeng Technology Co ltd
Priority to CN202310863259.8A priority Critical patent/CN116597461B/zh
Publication of CN116597461A publication Critical patent/CN116597461A/zh
Application granted granted Critical
Publication of CN116597461B publication Critical patent/CN116597461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及人工智能技术领域,特别涉及一种基于人工智能的题目知识点关联方法及系统。本发明在对各待处理OCR扫描文本信息进行判别分析时,能够提升在待处理OCR扫描文本信息所对应的文本质量语义矩前提下所实现的判别分析的精度和可解释性,且牵涉联系表征用于表征各待处理OCR扫描文本信息各自包括的各视觉文本识别单元之间的题目知识点联系特征,判别观点包括相应待处理OCR扫描文本信息所对应的知识点掌握量化评价,在此基础上,可以对学习APP场景下的知识掌握情况进行辅助评价分析。

Description

基于人工智能的题目知识点关联方法及系统
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于人工智能的题目知识点关联方法及系统。
背景技术
人工智能(Artificial Intelligence)是智能学科重要的组成部分,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
随着人工智能的不断发展,其在学习软件/APP领域的应用越来越广泛。例如可以辅助实现对学生知识点掌握情况的判别分析。然而,发明人经研究和分析发现,在实际对学生知识点掌握情况的判别分析时,传统的人工智能技术仍然呈现出一定的局限性。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于人工智能的题目知识点关联方法及系统。
第一方面,本发明实施例提供了一种基于人工智能的题目知识点关联方法,应用于人工智能决策系统,所述方法包括:
获得各待处理OCR扫描文本信息各自包括的各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,其中,所述各待处理OCR扫描文本信息包含各原始OCR扫描文本信息以及所述各原始OCR扫描文本信息完成文本纠错后生成的各OCR纠错文本信息;
利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本;
基于预调试的深度语义模型,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩;
利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点。
在一些可选的实施例中,所述牵涉联系表征用于表征所述各待处理OCR扫描文本信息各自包括的各视觉文本识别单元之间的题目知识点联系特征;所述判别观点包括相应待处理OCR扫描文本信息所对应的知识点掌握量化评价。
在一些可选的实施例中,利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:
对于各所述待处理OCR扫描文本信息,将所述待处理OCR扫描文本信息所包括的各视觉文本识别单元分别确定为相应的AI知识要素;
利用所述待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各所述AI知识要素之间的牵涉联系表征;
依据各所述AI知识要素以及各所述AI知识要素之间的牵涉联系表征,将所述待处理OCR扫描文本信息表示为对应的所述关系型输出文本。
在一些可选的实施例中,利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:
对于各所述待处理OCR扫描文本信息,识别所述待处理OCR扫描文本信息所包括的各视觉文本识别单元簇;
将所述各视觉文本识别单元簇以及所述待处理OCR扫描文本信息中除所述各视觉文本识别单元簇以外的各视觉文本识别单元分别确定为相应的AI知识要素;
利用所述待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各所述AI知识要素之间的牵涉联系表征;
依据各所述AI知识要素以及各所述AI知识要素之间的牵涉联系表征,将所述待处理OCR扫描文本信息表示为所述关系型输出文本。
在一些可选的实施例中,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:
对于各所述待处理OCR扫描文本信息,通过所述深度语义模型挖掘所述待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;
通过所述深度语义模型对所述各AI知识要素的局部文本质量语义矩进行聚合,得到所述待处理OCR扫描文本信息的文本质量语义矩。
在一些可选的实施例中,所述深度语义模型中包含有特征关注子模型,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:
对于各所述待处理OCR扫描文本信息,通过所述深度语义模型挖掘所述待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;
通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子;
通过所述深度语义模型根据各所述语义强化因子对所述各AI知识要素的局部文本质量语义矩进行聚合,得到所述待处理OCR扫描文本信息的文本质量语义矩。
在一些可选的实施例中,通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子,包括:
通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义特征规模变量;
根据所述语义特征规模变量确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子。
在一些可选的实施例中,利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点,包括:
基于预调试的观点判别网络,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点。
在一些可选的实施例中,所述方法还包括:
当进行预调试时,以所述深度语义模型的生成结果作为所述观点判别网络的传入信息得到所述观点判别网络的输出结果,并以所述观点判别网络的输出结果为指导对所述深度语义模型以及所述观点判别网络进行优化。
在一些可选的实施例中,以所述深度语义模型的生成结果为所述观点判别网络的传入信息得到所述观点判别网络的输出结果,包括:
将事先获取的各已认证OCR扫描文本信息分别转换成对应的关系型输出文本,其中,所述各已认证OCR扫描文本信息包含各原始OCR扫描文本信息以及所述各原始OCR扫描文本信息完成基于第一判别观点的文本纠错后生成的各OCR纠错文本信息;
基于所述深度语义模型,从各所述已认证OCR扫描文本信息的关系型输出文本中分别挖掘所述各已认证OCR扫描文本信息各自对应的文本质量语义矩;
基于所述观点判别网络,从所述各已认证OCR扫描文本信息的文本质量语义矩中推理得到所述已认证OCR扫描文本信息的第二判别观点;
以所述观点判别网络的输出结果为指导对所述深度语义模型以及所述观点判别网络进行优化,包括:确定所述第一判别观点与所述第二判别观点之间的区别;利用所述区别对所述深度语义模型以及所述观点判别网络进行优化。
在一些可选的实施例中,确定所述第一判别观点与所述第二判别观点之间的区别,包括:
确定所述第一判别观点在观点特征金字塔之中的第一金字塔分布标签以及所述第二判别观点在所述观点特征金字塔之中的第二金字塔分布标签,其中,所述观点特征金字塔为将全部候选判别观点按照上下游特征进行整理得到的金字塔模型;
利用所述第一金字塔分布标签与所述第二金字塔分布标签,确定所述第一判别观点与所述第二判别观点之间的区别。
在一些可选的实施例中,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点,包括:
对所述各原始OCR扫描文本信息各自对应的文本质量语义矩进行均值化处理,得到全局原始文本质量语义矩;
对所述各OCR纠错文本信息各自对应的文本质量语义矩进行均值化处理,得到全局纠错文本质量语义矩;
通过所述观点判别网络根据所述全局原始文本质量语义矩以及所述全局纠错文本质量语义矩确定所述各待处理OCR扫描文本信息的判别观点。
在一些可选的实施例中,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点,包括:
通过预调试的特征聚焦模型对所述各原始OCR扫描文本信息各自对应的文本质量语义矩进行处理,得到所述各原始OCR扫描文本信息各自对应的第一语义强化因子;
通过所述特征聚焦模型对所述各OCR纠错文本信息各自对应的文本质量语义矩进行处理,得到所述各OCR纠错文本信息各自对应的第二语义强化因子;
利用所述第一语义强化因子对所述各原始OCR扫描文本信息的文本质量语义矩进行处理,得到全局原始文本质量语义矩;
利用所述第二语义强化因子对所述各OCR纠错文本信息的文本质量语义矩进行处理,得到全局纠错文本质量语义矩;
通过所述观点判别网络根据所述全局原始文本质量语义矩以及所述全局纠错文本质量语义矩确定所述各待处理OCR扫描文本信息的判别观点。
第二方面,本发明还提供了一种人工智能决策系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
本发明实施例在对各待处理OCR扫描文本信息进行判别分析时,对于涉及文本纠错的各待处理OCR扫描文本信息,通过基于待处理OCR扫描文本信息所包括的各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征将待处理OCR扫描文本信息变更成关系型输出文本,进而从该关系型输出文本中挖掘出的待处理OCR扫描文本信息所对应的文本质量语义矩可以反映该待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,提升了待处理OCR扫描文本信息所对应的文本质量语义矩的特征输出性能,这样提升了在待处理OCR扫描文本信息所对应的文本质量语义矩前提下所实现的判别分析的精度和可解释性。
综上,本发明实施例能够解决现有技术难以准确且有解释性地进行作业文本质量判别的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种基于人工智能的题目知识点关联方法的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在人工智能决策系统、计算机设备或者类似的运算装置中执行。以运行在人工智能决策系统上为例,人工智能决策系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述人工智能决策系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述人工智能决策系统的结构造成限定。例如,人工智能决策系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于人工智能的题目知识点关联方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至人工智能决策系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括人工智能决策系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于人工智能的题目知识点关联方法的流程示意图,该方法应用于人工智能决策系统,进一步可以包括STEP110-STEP140。
STEP110、获得各待处理OCR扫描文本信息各自包括的各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征。
其中,所述各待处理OCR扫描文本信息包含各原始OCR扫描文本信息以及所述各原始OCR扫描文本信息完成文本纠错后生成的各OCR纠错文本信息。
STEP120、利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本。
STEP130、基于预调试的深度语义模型,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩。
STEP140、利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点。
本发明实施例中,针对待确定相应判别观点的待处理OCR扫描文本信息,人工智能决策系统确定涉及了文本纠错(包括但不限于文本审阅和文本批改等)的各原始OCR扫描文本信息各自包括的各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征,并确定涉及了文本纠错的各OCR纠错文本信息各自包括的各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征。
举例而言,待处理OCR扫描文本信息包括的原始OCR扫描文本信息为最初的OCR扫描文本信息,比如可以是学生提交的作业、考试、专项练习、课堂练习的做题文本,进一步地,待处理OCR扫描文本信息包括的OCR纠错文本信息是人工智能决策系统对以上做题文本进行文本审阅、文本批改等处理后得到的文本信息。更进一步地,视觉文本识别单元可以理解为相应文本信息中的文本块或者局部文本集,比如可以按照作业、考试、专项练习、课堂练习对相应文本信息进行拆分,也可以按照其他思路对相应文本信息进行拆分,在此不作限定。在此基础上,牵涉联系表征用于表征不同视觉文本识别单元之间的知识点关联情况(比如知识点的从属关系、并列关系、总分关系等)。
另外,牵涉联系表征还用于表征所述各待处理OCR扫描文本信息各自包括的各视觉文本识别单元之间的题目知识点联系特征。
本发明实施例中,获得各待处理OCR扫描文本信息各自包括的各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征后,基于此,可以将各待处理OCR扫描文本信息分别转换成对应的关系型输出文本。其中,该关系型输出文本能够通过结构化的形式对文本内容进行记载,因而可以直观地反映文本内容之间的关联情况(也即相应知识点之间的关联情况)。
在一些可能的示例下,依据各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征,将各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:对于各待处理OCR扫描文本信息,将待处理OCR扫描文本信息所包括的各视觉文本识别单元分别确定为相应的AI知识要素;基于待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各AI知识要素之间的牵涉联系表征;依据各AI知识要素以及各AI知识要素之间的牵涉联系表征,将待处理OCR扫描文本信息表示为对应的关系型输出文本。
在该示例下,人工智能决策系统将OCR扫描文本信息中的视觉文本识别单元分别确定为相应的AI知识要素。该AI知识要素可以通过特征节点的形式进行记录。
示例性的,OCR扫描文本信息中的视觉文本识别单元为该OCR扫描文本信息所包括的各视觉文本识别单元。对于由24个视觉文本识别单元构成的原始OCR扫描文本信息original text,人工智能决策系统将该24个视觉文本识别单元分别确定为对应的24个AI知识要素;基于该24个视觉文本识别单元之间的牵涉联系表征,确定该24个AI知识要素之间的牵涉联系表征;以便基于该牵涉联系表征生成该24个AI知识要素所对应的关系型输出文本(原始OCR扫描文本信息original text所对应的关系型输出文本)。此外,关系型输出文本还可以通过特征矩阵或者特征列表的形式进行表征。
应用该示例,通过实现关系型输出文本的转换,能够确保关系型输出文本所反映的牵涉联系表征信息的准确性和全面性。
在一些可独立的示例下,基于待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各AI知识要素之间的牵涉联系表征,包括:根据待处理OCR扫描文本信息所包括的各视觉文本识别单元的传递特征,确定对应的各AI知识要素的传递特征;确定待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的语义逻辑特征的语义逻辑特征标签;基于对语义逻辑特征标签事先配置的语义强化因子,确定各AI知识要素的传递特征的关联语义逻辑特征。
在该示例下,在确定各AI知识要素之间的牵涉联系表征时,人工智能决策系统根据语义逻辑特征标签确定各AI知识要素的传递特征的关联语义逻辑特征。
示例性的,AI知识要素之间的牵涉联系表征,可以分为如下两个情况:是否存在联系、若存在联系则关联语义逻辑特征的特征变量是怎样的。该示例中关联语义逻辑特征对应语义逻辑特征标签的语义强化因子。人工智能决策系统可以根据语义逻辑特征的贡献大小为各种语义逻辑特征标签配置相应的语义强化因子(比如:为从属逻辑特征标签配置1.5的语义强化因子,为总分逻辑特征标签配置1.2的语义强化因子,为并列逻辑特征标签配置1.0的语义强化因子)。人工智能决策系统确定各视觉文本识别单元之间的牵涉联系表征后,针对其中任两个视觉文本识别单元,确定这两个视觉文本识别单元之间是否具有存在联系的语义逻辑特征。如果这两个视觉文本识别单元之间具有存在联系的语义逻辑特征,则人工智能决策系统可以确定这两个视觉文本识别单元所对应的两个AI知识要素是存在联系的;进而确定这两个视觉文本识别单元之间语义逻辑特征的标签(类别),并将该语义逻辑特征标签对应的语义强化因子确定为这两个AI知识要素的关联语义逻辑特征。从而人工智能决策系统确定各AI知识要素之间的牵涉联系表征。
应用该示例,通过语义逻辑特征标签确定各AI知识要素的传递特征的关联语义逻辑特征,使得确定出的各AI知识要素之间的牵涉联系表征能够准确完整地反映OCR扫描文本信息中的语义逻辑特征信息。
在一些可能的示例下,依据各视觉文本识别单元以及各视觉文本识别单元之间的牵涉联系表征,将各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:对于各待处理OCR扫描文本信息,识别待处理OCR扫描文本信息所包括的各视觉文本识别单元簇;将各视觉文本识别单元簇以及待处理OCR扫描文本信息中除各视觉文本识别单元簇以外的各视觉文本识别单元分别确定为相应的AI知识要素;基于待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各AI知识要素之间的牵涉联系表征;依据各AI知识要素以及各AI知识要素之间的牵涉联系表征,将待处理OCR扫描文本信息变更成关系型输出文本。
在该示例下,人工智能决策系统将OCR扫描文本信息中的视觉文本识别单元分别确定为相应的AI知识要素。
示例性的,OCR扫描文本信息中的视觉文本识别单元主要为该OCR扫描文本信息所包括的各视觉文本识别单元簇以及除各视觉文本识别单元簇以外的单一视觉文本识别单元。视觉文本识别单元簇中的各视觉文本识别单元在文本纠错的过程中一般视作一个对象进行纠错参与反应(比如:在文本纠错的过程中,视觉文本识别单元簇“诗词鉴赏”中的诗词翻译文本识别单元以及中心思想概括文本识别单元一般视作一个对象)。对于由24个视觉文本识别单元构成的原始OCR扫描文本信息original text,人工智能决策系统识别出其所包括的各视觉文本识别单元簇有“诗词鉴赏”以及“散文解析”,进而将该2个视觉文本识别单元簇以及另外10个视觉文本识别单元分别确定为对应的12个AI知识要素;将该2个视觉文本识别单元簇分别作为对应的一个对象,根据原始OCR扫描文本信息original text所包括的24个视觉文本识别单元之间的牵涉联系表征确定该12个AI知识要素之间的牵涉联系表征;以生成该12个AI知识要素所对应的关系型输出文本,即,原始OCR扫描文本信息original text所对应的关系型输出文本。
应用该示例,以OCR扫描文本信息的视觉文本识别单元为参考进行关系型输出文本的生成,在确保关系型输出文本所反映的牵涉联系表征信息的全面性和准确性的前提下,能够有效节约确定关系型输出文本的运算开销。
本发明实施例中,人工智能决策系统预调试深度语义模型。该深度语义模型以关系型输出文本为传入信息,进而通过该深度语义模型对传入的关系型输出文本进行调整,输出可以是特征向量形式的结果,从而得到该关系型输出文本对应的文本质量语义矩。深度语义模型从关系型输出文本中挖掘得到的文本质量语义矩同样可以反映该关系型输出文本所包括的AI知识要素之间的牵涉联系表征。
在一些可能的示例下,从各关系型输出文本中分别挖掘各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:对于各待处理OCR扫描文本信息,通过深度语义模型挖掘待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;通过深度语义模型对各AI知识要素的局部文本质量语义矩进行聚合,得到待处理OCR扫描文本信息的文本质量语义矩。
在该示例下,对于各待处理OCR扫描文本信息,人工智能决策系统基于预调试的深度语义模型,将该待处理OCR扫描文本信息所对应的关系型输出文本输入该深度语义模型;进而该深度语义模型挖掘出各AI知识要素的局部文本质量语义矩,进而再对各AI知识要素的局部文本质量语义矩聚合,输出待处理OCR扫描文本信息的文本质量语义矩。
比如,文本质量语义矩用于表征待处理OCR扫描文本信息的做题正确率、卷面整洁程度等质量指标特征。
在一些可能的示例下,深度语义模型中包含有特征关注子模型,从各关系型输出文本中分别挖掘各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:对于各待处理OCR扫描文本信息,通过深度语义模型挖掘待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;通过特征关注子模型确定各AI知识要素的局部文本质量语义矩各自对应的语义强化因子;通过深度语义模型根据各语义强化因子对各AI知识要素的局部文本质量语义矩进行聚合,得到待处理OCR扫描文本信息的文本质量语义矩。
在该示例下,人工智能决策系统预调试的深度语义模型中包含有特征关注子模型(也可以理解为注意力子模型)。特征关注子模型用于确定输入信息的各局部信息的语义强化因子。该语义强化因子可以理解为注意力权重。
对于各待处理OCR扫描文本信息,人工智能决策系统基于该深度语义模型,将该待处理OCR扫描文本信息所对应的关系型输出文本输入该深度语义模型;进而该深度语义模型挖掘出各AI知识要素的局部文本质量语义矩;进而各AI知识要素的局部文本质量语义矩输入特征关注子模型,特征关注子模型进行处理,确定各AI知识要素的局部文本质量语义矩各自对应的语义强化因子;进而深度语义模型根据该语义强化因子对各AI知识要素的局部文本质量语义矩进行聚合,输出待处理OCR扫描文本信息的文本质量语义矩。
应用该示例,通过应用特征关注子模型,能够提升文本质量语义矩的挖掘时效性。
在一些可能的示例下,通过特征关注子模型确定各AI知识要素的局部文本质量语义矩各自对应的语义强化因子,包括:通过特征关注子模型确定各AI知识要素的局部文本质量语义矩各自对应的语义特征规模变量;根据语义特征规模变量确定各AI知识要素的局部文本质量语义矩各自对应的语义强化因子。
在该示例下,特征关注子模型基于局部文本质量语义矩的语义特征规模变量为局部文本质量语义矩配置语义强化因子。
示例性的,对于以特征列表形式表示的关系型输出文本,特征关注子模型可以以AI知识要素在该特征列表中所对应的横向列表单元或者纵向列表单元中非0数值的数量为参考,确定该AI知识要素的局部文本质量语义矩的语义特征规模变量;对于以结构化形式表示的关系型输出文本,特征关注子模型可以以AI知识要素对应的视觉文本识别单元数目以及该AI知识要素所关联的剩余AI知识要素数目为参考,确定该AI知识要素的局部文本质量语义矩的语义特征规模变量。进而再根据语义特征规模变量确定AI知识要素的局部文本质量语义矩所对应的语义强化因子,相对语义特征规模变量越大,所对应的语义强化因子便相对越高。
本发明实施例中,人工智能决策系统在获取到的各待处理OCR扫描文本信息各自对应的文本质量语义矩前提下确定各待处理OCR扫描文本信息的判别观点。
在一些可独立的示例下,依据各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定各待处理OCR扫描文本信息的判别观点,包括:将各原始OCR扫描文本信息的文本质量语义矩组合成第一文本质量特征关系网;将各OCR纠错文本信息的文本质量语义矩组合成第二文本质量特征关系网;确定将第一文本质量特征关系网转换为第二文本质量特征关系网的质量映射特征关系网,以及识别质量映射特征关系网的关系网属性;基于质量映射特征关系网的关系网属性确定各待处理OCR扫描文本信息的判别观点。
在该示例下,人工智能决策系统通过特征列表之间的转换确定各待处理OCR扫描文本信息的判别观点。
示例性的,鉴于待处理OCR扫描文本信息中的各OCR纠错文本信息是由待处理OCR扫描文本信息中的各原始OCR扫描文本信息经过文本纠错生成的,各原始OCR扫描文本信息的文本质量语义矩与各OCR纠错文本信息的文本质量语义矩之间存在一个未知的映射情况,可以根据未知的映射情况确定涉及相应文本纠错的待处理OCR扫描文本信息的判别观点。其中,该映射情况可以表示为特征列表。
比如,人工智能决策系统将获取到的各原始OCR扫描文本信息各自对应的文本质量语义矩组合成文本质量特征关系网map1(比如:文本质量特征关系网map1中的每一纵向列表单元分别是一个原始OCR扫描文本信息所对应的文本质量语义矩),将获取到的各OCR纠错文本信息各自对应的文本质量语义矩组合成文本质量特征关系网map2(比如:文本质量特征关系网map1中的每一纵向列表单元分别是一个原始OCR扫描文本信息所对应的文本质量语义矩);将文本质量特征关系网map1与文本质量特征关系网map2转换为对应的映射关系网;确定文本质量特征关系网map2的衍生特征关系网map3;将文本质量特征关系网map1与文本质量特征关系网map2的衍生特征关系网map3相乘得到质量映射特征关系网map4。该质量映射特征关系网map4即为判别观点所对应的特征列表。进而人工智能决策系统通过解析质量映射特征关系网map4的关系网属性,将质量映射特征关系网map4的关系网属性与预先配置的各种判别观点所具有的关系网属性进行配对分析,从而确定该各原始OCR扫描文本信息生成该各OCR纠错文本信息所涉及的文本纠错的判别观点。
在一些可能的示例下,依据各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定各待处理OCR扫描文本信息的判别观点,包括:基于预调试的观点判别网络,从各待处理OCR扫描文本信息的文本质量语义矩中确定各待处理OCR扫描文本信息的判别观点。
在该示例下,人工智能决策系统预调试观点判别网络。该观点判别网络以各原始OCR扫描文本信息的文本质量语义矩以及各OCR纠错文本信息的文本质量语义矩为传入信息,进而通过该观点判别网络对传入的文本质量语义矩进行处理,输出判别观点,即涉及的文本纠错待处理OCR扫描文本信息对应的判别观点。示例性的,该判别观点能够反映学生对相关知识点的掌握情况,比如判别观点1表征学生对相关知识点的掌握情况为“优”、判别观点2表征学生对相关知识点的掌握情况为“良”、判别观点3表征学生对相关知识点的掌握情况为“差”等。
在另外一些示例下,判别观点还可以包括相应待处理OCR扫描文本信息所对应的知识点掌握量化评价。比如对相关知识点的掌握情况为“优”的知识点掌握量化评价的取值区间可以为[0.8,1],对相关知识点的掌握情况为“良”的知识点掌握量化评价的取值区间可以为[0.5,0.8),对相关知识点的掌握情况为“差”的知识点掌握量化评价的取值区间可以为[0,0.5)。
应用该示例,由于观点判别网络可以以大量的调试示例进行调试,从而使得相较于通过特征列表的转换进行的判别评价,通过基于观点判别网络能够更准确合理且有解释性地进行观点判别。
在一些可能的示例下,从各待处理OCR扫描文本信息的文本质量语义矩中确定各待处理OCR扫描文本信息的判别观点,包括:对各原始OCR扫描文本信息各自对应的文本质量语义矩进行均值化处理,得到全局原始文本质量语义矩;对各OCR纠错文本信息各自对应的文本质量语义矩进行均值化处理,得到全局纠错文本质量语义矩;通过观点判别网络根据全局原始文本质量语义矩以及全局纠错文本质量语义矩确定各待处理OCR扫描文本信息的判别观点。
在该示例下,人工智能决策系统通过均值化对OCR扫描文本信息的文本质量语义矩进行处理。
示例性的,对各原始OCR扫描文本信息的文本质量语义矩进行均值化处理,得到处理后的一个全局原始文本质量语义矩;对各OCR纠错文本信息的文本质量语义矩进行均值化处理,得到处理后的一个全局纠错文本质量语义矩。进而将该全局原始文本质量语义矩与该全局纠错文本质量语义矩作为观点判别网络的传入信息,从而通过观点判别网络的处理确定各待处理OCR扫描文本信息的判别观点。
在一些可能的示例下,从各待处理OCR扫描文本信息的文本质量语义矩中确定各待处理OCR扫描文本信息的判别观点,包括:通过预调试的特征聚焦模型对各原始OCR扫描文本信息各自对应的文本质量语义矩进行处理,得到各原始OCR扫描文本信息各自对应的第一语义强化因子;通过特征聚焦模型对各OCR纠错文本信息各自对应的文本质量语义矩进行处理,得到各OCR纠错文本信息各自对应的第二语义强化因子;基于第一语义强化因子对各原始OCR扫描文本信息的文本质量语义矩进行处理,得到全局原始文本质量语义矩;基于第二语义强化因子对各OCR纠错文本信息的文本质量语义矩进行处理,得到全局纠错文本质量语义矩;通过观点判别网络根据全局原始文本质量语义矩以及全局纠错文本质量语义矩确定各待处理OCR扫描文本信息的判别观点。
在该示例下,在深度语义模型与观点判别网络之间引入特征聚焦模型,该特征聚焦模型用于高效确定各OCR扫描文本信息对应的语义强化因子。进而人工智能决策系统通过特征加权思路对OCR扫描文本信息的文本质量语义矩进行处理。
示例性的,将各原始OCR扫描文本信息各自对应的文本质量语义矩输入该特征聚焦模型,通过该特征聚焦模型的处理确定各原始OCR扫描文本信息各自对应的第一语义强化因子;同理确定各OCR纠错文本信息各自对应的第二语义强化因子。进而第一语义强化因子对各原始OCR扫描文本信息的文本质量语义矩进行处理,得到处理后的一个全局原始文本质量语义矩;根据第二语义强化因子对各OCR纠错文本信息的文本质量语义矩进行处理,得到处理后的一个全局纠错文本质量语义矩。通过观点判别网络对该全局原始文本质量语义矩与该全局纠错文本质量语义矩的处理,确定各待处理OCR扫描文本信息的判别观点。
在一些可能的示例下,该方法还包括:当进行预调试时,以深度语义模型的生成结果作为观点判别网络的传入信息得到观点判别网络的输出结果,并以观点判别网络的输出结果为指导对深度语义模型以及观点判别网络进行优化。
在该示例下,挖掘OCR扫描文本信息的文本质量语义矩的深度语义模型与根据OCR扫描文本信息的文本质量语义矩进行判别的观点判别网络作为一个对象联合。
示例性的,在预调试深度语义模型时,得到深度语义模型输出的OCR扫描文本信息的文本质量语义矩;在预调试观点判别网络的过程中,将该OCR扫描文本信息的文本质量语义矩作为观点判别网络的传入信息得到观点判别网络输出的判别观点。此时观点判别网络输出的判别观点通常与先验观点(已认证的正确观点)存在一定偏差,故以观点判别网络输出的判别观点作为指导对观点判别网络进行优化,并对深度语义模型进行优化(比如:根据观点判别网络输出的判别观点与先验观点(已认证的正确观点)之间的区别确定对应的模型训练代价,进而根据该模型训练代价对观点判别网络的网络变量进行改进,并对深度语义模型的网络变量进行改进)。直到观点判别网络输出的判别观点的精度符合相应条件时,对深度语义模型以及观点判别网络的预调试结束。
应用该示例,以这种整体化的调试思路将深度语义模型与观点判别网络共同进行预调试,使得深度语义模型挖掘出的文本质量语义矩更加适合观点判别网络,从而提升了整体层面的观点判别合理性和可解释性。
在一些可能的示例下,以深度语义模型的生成结果为观点判别网络的传入信息得到观点判别网络的输出结果,包括:将事先获取的各已认证OCR扫描文本信息分别转换成对应的关系型输出文本,其中,各已认证OCR扫描文本信息包含各原始OCR扫描文本信息以及各原始OCR扫描文本信息完成基于第一判别观点的文本纠错后生成的各OCR纠错文本信息;基于深度语义模型,从各已认证OCR扫描文本信息的关系型输出文本中分别挖掘各已认证OCR扫描文本信息各自对应的文本质量语义矩;基于观点判别网络,从各已认证OCR扫描文本信息的文本质量语义矩中预测已认证OCR扫描文本信息的第二判别观点;以观点判别网络的输出结果为指导对深度语义模型以及观点判别网络进行优化,包括:确定第一判别观点与第二判别观点之间的区别;基于区别对深度语义模型以及观点判别网络进行优化。
在该示例下,第一判别观点为正确/先验的判别观点,第二判别观点为观点判别网络所输出的判别观点。人工智能决策系统根据第一判别观点与第二判别观点之间的区别对深度语义模型以及观点判别网络进行优化。
比如:人工智能决策系统事先已确定OCR扫描文本信息text1与OCR扫描文本信息text2完成基于第一判别观点的文本纠错后OCR纠错文本信息text3与OCR纠错文本信息text4。预调试过程中,人工智能决策系统将OCR扫描文本信息text1、OCR扫描文本信息text2、OCR纠错文本信息text3与OCR纠错文本信息text4分别转换成对应的关系型输出文本,并输入深度语义模型,得到该深度语义模型输出的这4个OCR扫描文本信息分别所对应的文本质量语义矩;将OCR扫描文本信息text1的文本质量语义矩与OCR扫描文本信息text2的文本质量语义矩整理成同一个全局原始文本质量语义矩,将OCR纠错文本信息text3的文本质量语义矩与OCR纠错文本信息text4的文本质量语义矩整理成同一个全局纠错文本质量语义矩,并将该全局原始文本质量语义矩与该全局纠错文本质量语义矩输入观点判别网络,得到该观点判别网络推理得到输出的第二判别观点。
人工智能决策系统确定第一判别观点与第二判别观点之间的区别,进而以该区别为指导依据,根据该区别对该深度语义模型进行优化,并对观点判别网络进行优化。
在一些可能的示例下,确定所述第一判别观点与所述第二判别观点之间的区别,包括:确定所述第一判别观点在观点特征金字塔之中的第一金字塔分布标签以及所述第二判别观点在所述观点特征金字塔之中的第二金字塔分布标签,其中,所述观点特征金字塔为将全部候选判别观点按照上下游特征进行整理得到的金字塔模型;利用所述第一金字塔分布标签与所述第二金字塔分布标签,确定所述第一判别观点与所述第二判别观点之间的区别。
在该示例下,人工智能决策系统预先将全部候选判别观点按照上下游特征进行整理得到金字塔模型的观点特征金字塔。每一候选判别观点在该观点特征金字塔中都匹配一个不重复的金字塔层。
人工智能决策系统得到观点判别网络推理得到输出的第二判别观点,查询该观点特征金字塔确定第二判别观点在观点特征金字塔中的第二金字塔分布标签以及第一判别观点在观点特征金字塔中的第一金字塔分布标签。进而基于第一金字塔分布标签与第二金字塔分布标签,确定第一判别观点与第二判别观点之间的区别。
在一些可能的应用场景下,可以通过以上方案对学生的作业进行智能化、自动化的审阅和批改,从而根据学生的作业、考试、专项练习、课堂练习的做题情况,以及题目所关联的知识点,外加知识本身的关联度,对学生的知识掌握情况进行辅助评价。另外,上述技术方案结合OCR技术实现,不仅可以对纯文本形式的信息进行分析,还可以对图文混合形式的信息进行分析,从而扩展了方案的应用范围。
在另一些可独立的设计思路下,在所述利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点之后,所述方法还包括:将各待处理OCR扫描文本信息及其判别观点进行关联存储。
应用该设计思路,能够将各待处理OCR扫描文本信息及其判别观点以电子文档的形式进行存储,从而避免信息丢失,还能够为后续的调用作准备。
在另一些可独立的设计思路下,在将各待处理OCR扫描文本信息及其判别观点进行关联存储之后,所述方法还包括:响应于远程教育服务器针对关联存储对象的调取请求,在判断出所述远程教育服务器通过安全校验的前提下,将所述关联存储对象下发给所述远程教育服务器;其中,所述关联存储对象包括至少一个待处理OCR扫描文本信息及其对应的判别观点。
应用该设计思路,在进行关联存储对象下发之前,能够实现远程教育服务器的安全校验,从而保障关联存储对象的数据信息安全性。
在另一些可独立的设计思路下,所述远程教育服务器的安全校验步骤包括:获取针对远程教育服务器的安全风险检测报告集合,所述安全风险检测报告集合包括至少两个安全风险检测报告;获得所述安全风险检测报告集合中的各个安全风险检测报告与所述远程教育服务器之间的联系评分;根据所述各个安全风险检测报告对应的联系评分,以及所述各个安全风险检测报告的类别向量,对所述各个安全风险检测报告进行整理,得到相应的安全风险检测报告序列;基于所述安全风险检测报告序列生成针对所述远程教育服务器的安全校验结果。
应用该设计思路,能够利用远程教育服务器的不同安全风险检测报告进行联系评分和类别向量维度的综合分析,从而确保安全校验结果的准确性和可信度。
综上,在对各待处理OCR扫描文本信息进行判别分析时,能够提升在待处理OCR扫描文本信息所对应的文本质量语义矩前提下所实现的判别分析的精度和可解释性。且牵涉联系表征用于表征各待处理OCR扫描文本信息各自包括的各视觉文本识别单元之间的题目知识点联系特征,判别观点包括相应待处理OCR扫描文本信息所对应的知识点掌握量化评价,在此基础上,可以对学习APP场景下的知识掌握情况进行辅助评价分析。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的题目知识点关联方法,其特征在于,应用于人工智能决策系统,所述方法包括:
获得各待处理OCR扫描文本信息各自包括的各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,其中,所述各待处理OCR扫描文本信息包含各原始OCR扫描文本信息以及所述各原始OCR扫描文本信息完成文本纠错后生成的各OCR纠错文本信息;
利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本;
基于预调试的深度语义模型,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩;
利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点。
2.根据权利要求1所述的方法,其特征在于,所述牵涉联系表征用于表征所述各待处理OCR扫描文本信息各自包括的各视觉文本识别单元之间的题目知识点联系特征;所述判别观点包括相应待处理OCR扫描文本信息所对应的知识点掌握量化评价。
3.根据权利要求1所述的方法,其特征在于,利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:
对于各所述待处理OCR扫描文本信息,将所述待处理OCR扫描文本信息所包括的各视觉文本识别单元分别确定为相应的AI知识要素;
利用所述待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各所述AI知识要素之间的牵涉联系表征;
依据各所述AI知识要素以及各所述AI知识要素之间的牵涉联系表征,将所述待处理OCR扫描文本信息表示为对应的所述关系型输出文本。
4.根据权利要求1所述的方法,其特征在于,利用所述各视觉文本识别单元以及所述各视觉文本识别单元之间的牵涉联系表征,将所述各待处理OCR扫描文本信息分别转换成对应的关系型输出文本,包括:
对于各所述待处理OCR扫描文本信息,识别所述待处理OCR扫描文本信息所包括的各视觉文本识别单元簇;
将所述各视觉文本识别单元簇以及所述待处理OCR扫描文本信息中除所述各视觉文本识别单元簇以外的各视觉文本识别单元分别确定为相应的AI知识要素;
利用所述待处理OCR扫描文本信息所包括的各视觉文本识别单元之间的牵涉联系表征,确定各所述AI知识要素之间的牵涉联系表征;
依据各所述AI知识要素以及各所述AI知识要素之间的牵涉联系表征,将所述待处理OCR扫描文本信息表示为所述关系型输出文本。
5.根据权利要求1所述的方法,其特征在于,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:
对于各所述待处理OCR扫描文本信息,通过所述深度语义模型挖掘所述待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;
通过所述深度语义模型对所述各AI知识要素的局部文本质量语义矩进行聚合,得到所述待处理OCR扫描文本信息的文本质量语义矩。
6.根据权利要求1所述的方法,其特征在于,所述深度语义模型中包含有特征关注子模型,从各所述关系型输出文本中分别挖掘所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,包括:
对于各所述待处理OCR扫描文本信息,通过所述深度语义模型挖掘所述待处理OCR扫描文本信息所对应的关系型输出文本中各AI知识要素的局部文本质量语义矩;
通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子;
通过所述深度语义模型根据各所述语义强化因子对所述各AI知识要素的局部文本质量语义矩进行聚合,得到所述待处理OCR扫描文本信息的文本质量语义矩;
其中,通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子,包括:通过所述特征关注子模型确定所述各AI知识要素的局部文本质量语义矩各自对应的语义特征规模变量;根据所述语义特征规模变量确定所述各AI知识要素的局部文本质量语义矩各自对应的语义强化因子。
7.根据权利要求1所述的方法,其特征在于,利用所述各待处理OCR扫描文本信息各自对应的文本质量语义矩,确定所述各待处理OCR扫描文本信息的判别观点,包括:基于预调试的观点判别网络,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点;
其中,所述方法还包括:当进行预调试时,以所述深度语义模型的生成结果作为所述观点判别网络的传入信息得到所述观点判别网络的输出结果,并以所述观点判别网络的输出结果为指导对所述深度语义模型以及所述观点判别网络进行优化;
其中,以所述深度语义模型的生成结果作为所述观点判别网络的传入信息得到所述观点判别网络的输出结果,包括:将事先获取的各已认证OCR扫描文本信息分别转换成对应的关系型输出文本,其中,所述各已认证OCR扫描文本信息包含各原始OCR扫描文本信息以及所述各原始OCR扫描文本信息完成基于第一判别观点的文本纠错后生成的各OCR纠错文本信息;基于所述深度语义模型,从各所述已认证OCR扫描文本信息的关系型输出文本中分别挖掘所述各已认证OCR扫描文本信息各自对应的文本质量语义矩;基于所述观点判别网络,从所述各已认证OCR扫描文本信息的文本质量语义矩中推理得到所述已认证OCR扫描文本信息的第二判别观点;以所述观点判别网络的输出结果为指导对所述深度语义模型以及所述观点判别网络进行优化,包括:确定所述第一判别观点与所述第二判别观点之间的区别;利用所述区别对所述深度语义模型以及所述观点判别网络进行优化;
其中,确定所述第一判别观点与所述第二判别观点之间的区别,包括:确定所述第一判别观点在观点特征金字塔之中的第一金字塔分布标签以及所述第二判别观点在所述观点特征金字塔之中的第二金字塔分布标签,其中,所述观点特征金字塔为将全部候选判别观点按照上下游特征进行整理得到的金字塔模型;利用所述第一金字塔分布标签与所述第二金字塔分布标签,确定所述第一判别观点与所述第二判别观点之间的区别。
8.根据权利要求7所述的方法,其特征在于,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点,包括:
对所述各原始OCR扫描文本信息各自对应的文本质量语义矩进行均值化处理,得到全局原始文本质量语义矩;
对所述各OCR纠错文本信息各自对应的文本质量语义矩进行均值化处理,得到全局纠错文本质量语义矩;
通过所述观点判别网络根据所述全局原始文本质量语义矩以及所述全局纠错文本质量语义矩确定所述各待处理OCR扫描文本信息的判别观点。
9.根据权利要求7所述的方法,其特征在于,从所述各待处理OCR扫描文本信息的文本质量语义矩中确定所述各待处理OCR扫描文本信息的判别观点,包括:
通过预调试的特征聚焦模型对所述各原始OCR扫描文本信息各自对应的文本质量语义矩进行处理,得到所述各原始OCR扫描文本信息各自对应的第一语义强化因子;
通过所述特征聚焦模型对所述各OCR纠错文本信息各自对应的文本质量语义矩进行处理,得到所述各OCR纠错文本信息各自对应的第二语义强化因子;
利用所述第一语义强化因子对所述各原始OCR扫描文本信息的文本质量语义矩进行处理,得到全局原始文本质量语义矩;
利用所述第二语义强化因子对所述各OCR纠错文本信息的文本质量语义矩进行处理,得到全局纠错文本质量语义矩;
通过所述观点判别网络根据所述全局原始文本质量语义矩以及所述全局纠错文本质量语义矩确定所述各待处理OCR扫描文本信息的判别观点。
10.一种人工智能决策系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
CN202310863259.8A 2023-07-14 2023-07-14 基于人工智能的题目知识点关联方法及系统 Active CN116597461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310863259.8A CN116597461B (zh) 2023-07-14 2023-07-14 基于人工智能的题目知识点关联方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310863259.8A CN116597461B (zh) 2023-07-14 2023-07-14 基于人工智能的题目知识点关联方法及系统

Publications (2)

Publication Number Publication Date
CN116597461A true CN116597461A (zh) 2023-08-15
CN116597461B CN116597461B (zh) 2023-09-22

Family

ID=87601197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310863259.8A Active CN116597461B (zh) 2023-07-14 2023-07-14 基于人工智能的题目知识点关联方法及系统

Country Status (1)

Country Link
CN (1) CN116597461B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474014A (zh) * 2023-12-27 2024-01-30 广东信聚丰科技股份有限公司 基于大数据分析的知识点拆解方法及系统
CN117557425A (zh) * 2023-12-08 2024-02-13 广州市小马知学技术有限公司 基于智慧题库系统的题库数据优化方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138306A (ja) * 2009-12-28 2011-07-14 National Institute Of Information & Communication Technology 文書要約装置、文書処理装置、文書要約方法、文書処理方法、及びプログラム
CN103886302A (zh) * 2014-03-28 2014-06-25 上海携培信息科技有限公司 试卷识别分析实现方法及装置
CN112612909A (zh) * 2021-01-06 2021-04-06 杭州恒生数字设备科技有限公司 一种基于知识图谱的智能试卷质量评测方法
CN113052316A (zh) * 2021-03-01 2021-06-29 浙江师范大学 基于因果推理的知识追踪方法、系统、设备及存储介质
CN113761217A (zh) * 2021-04-20 2021-12-07 腾讯科技(深圳)有限公司 基于人工智能的题目集数据处理方法、装置和计算机设备
CN114255623A (zh) * 2021-11-19 2022-03-29 创泽智能机器人集团股份有限公司 一种基于机器人的教学方法及系统
CN115455186A (zh) * 2022-09-16 2022-12-09 北京师范大学 一种基于多模型的学情分析方法
CN115564267A (zh) * 2022-10-18 2023-01-03 读书郎教育科技有限公司 一种知识点掌握程度识别方法、存储介质及设备
CN115908065A (zh) * 2022-11-09 2023-04-04 北京乐柏信息咨询有限公司 知识掌握度的评估方法、装置、设备及介质
CN116029306A (zh) * 2023-03-30 2023-04-28 中南民族大学 一种限定域文科简答题自动评分方法
US20230134101A1 (en) * 2020-07-06 2023-05-04 Beijing Century Tal Education Technology Co., Ltd. Sentence type recognition method and apparatus, electronic device, and storage medium

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138306A (ja) * 2009-12-28 2011-07-14 National Institute Of Information & Communication Technology 文書要約装置、文書処理装置、文書要約方法、文書処理方法、及びプログラム
CN103886302A (zh) * 2014-03-28 2014-06-25 上海携培信息科技有限公司 试卷识别分析实现方法及装置
US20230134101A1 (en) * 2020-07-06 2023-05-04 Beijing Century Tal Education Technology Co., Ltd. Sentence type recognition method and apparatus, electronic device, and storage medium
CN112612909A (zh) * 2021-01-06 2021-04-06 杭州恒生数字设备科技有限公司 一种基于知识图谱的智能试卷质量评测方法
CN113052316A (zh) * 2021-03-01 2021-06-29 浙江师范大学 基于因果推理的知识追踪方法、系统、设备及存储介质
CN113761217A (zh) * 2021-04-20 2021-12-07 腾讯科技(深圳)有限公司 基于人工智能的题目集数据处理方法、装置和计算机设备
CN114255623A (zh) * 2021-11-19 2022-03-29 创泽智能机器人集团股份有限公司 一种基于机器人的教学方法及系统
CN115455186A (zh) * 2022-09-16 2022-12-09 北京师范大学 一种基于多模型的学情分析方法
CN115564267A (zh) * 2022-10-18 2023-01-03 读书郎教育科技有限公司 一种知识点掌握程度识别方法、存储介质及设备
CN115908065A (zh) * 2022-11-09 2023-04-04 北京乐柏信息咨询有限公司 知识掌握度的评估方法、装置、设备及介质
CN116029306A (zh) * 2023-03-30 2023-04-28 中南民族大学 一种限定域文科简答题自动评分方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZENGZHEN SHAO 等: "An Optimized Mining Algorithm for Analyzing Students\' Learning Degree Based on Dynamic Data", 《IEEE ACCESS》, pages 113543 - 113556 *
汪颖: "新高考背景下主观题智能阅卷的问题研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》, pages 18 *
袁玉林: "高中数学主观题自动评阅研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》, pages 391 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557425A (zh) * 2023-12-08 2024-02-13 广州市小马知学技术有限公司 基于智慧题库系统的题库数据优化方法及系统
CN117557425B (zh) * 2023-12-08 2024-04-16 广州市小马知学技术有限公司 基于智慧题库系统的题库数据优化方法及系统
CN117474014A (zh) * 2023-12-27 2024-01-30 广东信聚丰科技股份有限公司 基于大数据分析的知识点拆解方法及系统
CN117474014B (zh) * 2023-12-27 2024-03-08 广东信聚丰科技股份有限公司 基于大数据分析的知识点拆解方法及系统

Also Published As

Publication number Publication date
CN116597461B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN116597461B (zh) 基于人工智能的题目知识点关联方法及系统
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
CN109635108B (zh) 一种基于人机交互的远程监督实体关系抽取方法
CN110457689B (zh) 语义处理方法及相关装置
CN112364150A (zh) 一种结合检索与生成的智能问答方法和系统
CN111858877A (zh) 多类型问题智能问答方法、系统、设备及可读存储介质
CN108121702B (zh) 数学主观题评阅方法及系统
CN109033390B (zh) 自动生成相似问句的方法和装置
CN104463101A (zh) 用于文字性试题的答案识别方法及系统
CN111914550B (zh) 一种面向限定领域的知识图谱更新方法及系统
CN114092742B (zh) 一种基于多角度的小样本图像分类装置和方法
CN111368096A (zh) 基于知识图谱的信息分析方法、装置、设备和存储介质
CN105930490A (zh) 一种教学资源智能甄选系统
CN111444341A (zh) 用户画像构建方法、装置、设备及可读存储介质
CN110909224A (zh) 一种基于人工智能的敏感数据自动分类识别方法及系统
CN114297987A (zh) 基于文本分类和阅读理解的文档信息抽取方法及系统
CN110516240B (zh) 一种基于Transformer的语义相似度计算模型DSSM技术
CN117473034A (zh) 交互文本处理方法、装置、电子设备及存储介质
CN117592563A (zh) 一种领域知识增强的电力大模型训调方法
CN115438152B (zh) 一种基于多神经网络与知识图谱的简答题评分方法及系统
CN116992880A (zh) 建筑物名称的识别方法、装置、电子设备和存储介质
CN116644167A (zh) 目标答案的生成方法和装置、存储介质及电子装置
CN112927109B (zh) 一种智能辅助实践实训课程类别的教学系统
CN114842301A (zh) 一种图像注释模型的半监督训练方法
CN114281966A (zh) 问题模板生成方法、问答方法、装置与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant