CN115205879B - 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质 - Google Patents

一种基于人工智能的学生教材内容审核评价方法、系统及存储介质 Download PDF

Info

Publication number
CN115205879B
CN115205879B CN202210728919.7A CN202210728919A CN115205879B CN 115205879 B CN115205879 B CN 115205879B CN 202210728919 A CN202210728919 A CN 202210728919A CN 115205879 B CN115205879 B CN 115205879B
Authority
CN
China
Prior art keywords
compliance
page
picture
auditing
teaching material
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210728919.7A
Other languages
English (en)
Other versions
CN115205879A (zh
Inventor
熊飘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Imagination Education Technology Co ltd
Original Assignee
Imagination Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Imagination Education Technology Co ltd filed Critical Imagination Education Technology Co ltd
Priority to CN202210728919.7A priority Critical patent/CN115205879B/zh
Publication of CN115205879A publication Critical patent/CN115205879A/zh
Application granted granted Critical
Publication of CN115205879B publication Critical patent/CN115205879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于人工智能的学生教材内容审核评价方法、系统及存储介质,通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部门进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,为后续学生教材的可读性改进提供有效的依据,同时在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,进而在一定程度上提高了审核结果的可靠度,有利于提高学生教材的权威性。

Description

一种基于人工智能的学生教材内容审核评价方法、系统及存储介质
技术领域
本发明属于学生教材审核评价技术领域,具体而言是一种基于人工智能的学生教材内容审核评价方法、系统及存储介质。
背景技术
教材作为开展教学活动,体现教学内容的知识载体,其不仅是教师讲课的主要依据,也是学生获得知识的主要源泉,因此教材的质量直接关系到教学质量,在这种情况下,对学生教材内容进行合规审核显得尤为重要。
在实现本申请的过程中,发明人发现现有对学生教材内容的审核评价方式至少存在如下问题:
1.当前对学生教材内容的审核方向偏重于文本部分,对其中的插画往往存在一定忽略,特别是插画的观看质量合规审核,这是由于有些插画制作者在进行插画制作时过于随性,导致制作出来的插画容易存在一些不足,例如画面不够清晰、线条不够流畅等,进而影响学生的观看体验感,降低了教材的可读性;
2.当前在对学生教材的文本部分进行审核时,只是单纯对文本的用词敏感性进行审核,例如审核文本中是否存在一些违禁词、低俗词等,审核指标过于单一,导致文本中的一些其他缺陷无法得到审核,如格式缺陷、史事表述错误等,进而影响审核结果的可靠度,且一旦存在文本缺陷的教材得到正式使用,也会影响教材的权威性;
3.当前在对学生教材内容进行合规审核过程中采用的审核方式大多为人工肉眼审核,一方面降低了审核速度,另一方面容易造成遗漏审核和审核错误,在一定程度上影响了审核精准度,导致审核效果不佳。
发明内容
基于此,有必要针对现有对学生教材内容审核评价方式的缺陷,提供一种审核方向全面、审核指标多样化、审核效率高的基于人工智能的学生教材内容审核评价方法、系统及存储介质。
第一方面,本发明提供一种基于人工智能的学生教材内容审核评价方法,包括以下步骤:
S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
S5:对各页面对应的插画部分进行观看质量合规审核;
S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。
在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行格式合规审核对应的具体审核过程如下:
A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
A2:分别提取各文字对应的字体和字号;
A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式
Figure BDA0003712046960000031
计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。
在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
B1:对各页面对应的文本部分进行分句划分,得到若干分句;
B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
B3:从各页面对应各分句存在的若干词组中提取出关键词组;
B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为
Figure BDA0003712046960000051
ηi表示为第i个页面对应的史事表述合规度,ri表示为第i个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数。
在本发明第一方面的一种能够实现的方式中,所述要素参数包括发生时间、发生地点、人物、背景和过程。
在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为
Figure BDA0003712046960000052
ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量。
在本发明第一方面的一种能够实现的方式中,所述目标教材对应的文本合规指数评价公式为
Figure BDA0003712046960000061
Figure BDA0003712046960000062
表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1。
在本发明第一方面的一种能够实现的方式中,所述S5中对各页面对应的插画部分进行观看质量合规审核对应的具体审核过程如下:
D1:对各页面对应的插画进行分辨率检测;
D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
D3:对各页面中各插画主体的边缘轮廓线进行流畅度检测;
D4:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
D5:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式
Figure BDA0003712046960000063
由此计算各页面中各插画主体对应的颜色填充符合度。
在本发明第一方面的一种能够实现的方式中,所述评价目标教材对应的插画合规指数具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为
Figure BDA0003712046960000071
ψ表示为目标教材对应的插画合规指数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1。
第二方面,本发明提供一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
页面信息提取模块,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
文本合规审核模块,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
文本合规指数评价模块,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
插画观看质量合规审核模块,用于对各页面对应的插画部分进行观看质量合规审核;
插画合规指数评价模块,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
目标教材审核判断模块,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
第三方面,本发明提供一种基于人工智能的学生教材内容审核评价存储介质,所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种基于人工智能的学生教材内容审核评价方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
(1)本发明通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部分进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,能够从观看体验感出发及时审核出学生教材内容中插画的观看质量不足,为后续学生教材的可读性改进提供有效的依据。
(2)本发明在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,有效弥补了现有技术中文本部分审核指标单一造成的对文本中的一些其他缺陷无法得到审核的问题,进而在一定程度上提高了审核结果的可靠度,同时有利于提高学生教材的权威性。
(3)本发明在对学生教材内容进行合规审核过程中采用智能化的审核方式,其相比较人工肉眼审核,不仅能够大大提高审核速度,还避免了遗漏审核,降低了审核错误的发生率,与此同时还减少了人工审核成本,最大程度上保障了审核精准度,进而有利于提高审核效果,具有较大的实用性。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的方法实施步骤流程图;
图2为本发明的系统模块连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1所示,本发明提供一种基于人工智能的学生教材内容审核评价方法,包括以下步骤:
S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
上述中对各页面对应的文本部分进行格式合规审核,其具体审核过程如下:
A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
A2:分别提取各文字对应的字体和字号;
A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
在一个具体实施例中,解析各符合文字对应的符合类型,其具体解析方式为若某文字对应的字体和字号与学生教材文本对应的合规字体和合规字号均匹配成功,则该文字对应的符合类型为双重符合,若某文字只有字体匹配成功,则该文字对应的符合类型为字体符合,若某文字只有字号匹配成功,则该文字对应的符合类型为字号符合;
A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式
Figure BDA0003712046960000111
计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。
上述格式合规度计算公式中符合文字对应的符合因子越大,符合文字数量越多,格式合规度越大;
需要说明的是,上述中对目标教材的文本部分进行格式合规审核,其目的在于学生教材中文字的字体和字号直接影响学生对文字的辨认能力,例如有些字体由于笔画过于特殊,导致无法直观辨认文字,有些字号由于过小也无法直观辨认文字,如果忽略对文本的格式合规审核,就容易出现一些文字采用不合格的字体和字号进行显示,进而由于文字无法直观辨认,不仅影响学生的理解力,还影响学生的视力。
上述中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
B1:对各页面对应的文本部分进行分句划分,得到若干分句;
B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
B3:从各页面对应各分句存在的若干词组中提取出关键词组;
B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,其中要素参数包括发生时间、发生地点、人物、背景和过程,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为
Figure BDA0003712046960000121
ηi表示为第i个页面对应的史事表述合规度,ri表示为第i个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数;
上述史事表述合规度计算公式中,匹配成功的史事关联分句数量越多,各匹配成功的史事关联分句对应的合规权重值越大,史事表述合规度越大;
需要说明的是,对目标教材的文本部分进行史事表述合规度审核的目的在于:学生教材中史事表述的真实性会教材的权威性,如果不对文本部分的史事表述进行审核,就难以发现史事表述中的错误部分,这样的教材一旦投入使用,会严重降低教材的权威性,进而给学生错误的引导。
上述中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
上述中审核数据库中存储的敏感词组集合包括违禁词、低俗词、违规词等;
C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为
Figure BDA0003712046960000131
ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量,其中各页面中存在的重点词组数量越少,该页面对应的用词合规度越大;
S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数,其评价公式为
Figure BDA0003712046960000141
Figure BDA0003712046960000142
表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1;
本发明实施例在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,有效弥补了现有技术中文本部分审核指标单一造成的对文本中的一些其他缺陷无法得到审核的问题,进而在一定程度上提高了审核结果的可靠度,同时有利于提高学生教材的权威性。
S5:对各页面对应的插画部分进行观看质量合规审核,其具体审核过程如下:
D1:对各页面对应的插画进行分辨率检测;
D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
需要说明的是,上述提到的插画主体是指插画中存在的人或物;
D3:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
D4:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式
Figure BDA0003712046960000151
由此计算各页面中各插画主体对应的颜色填充符合度;
需要说明的是,本发明对目标教材中各页面的插画进行分辨率检测的目的在于插画的分辨率直接影响插画的清晰度,插画一旦出现清晰度不过关,就会影响观看效果,对各页面的插画进行颜色填充符合度检测的目的在于插画的颜色填充符合度会影响插画的观看美感,插画一旦出现颜色填充符合度不过关,就会降低学生的观看兴趣,影响教材的可读性。
S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数,其具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为
Figure BDA0003712046960000152
ψ表示为目标教材对应的插画合规指数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1;
本发明实施例通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部分进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,能够从观看体验感出发及时审核出学生教材内容中插画的观看质量不足,为后续学生教材的可读性改进提供有效的依据。
S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。
本发明在对学生教材内容进行合规审核过程中采用智能化的审核方式,其相比较人工肉眼审核,不仅能够大大提高审核速度,还避免了遗漏审核,降低了审核错误的发生率,与此同时还减少了人工审核成本,最大程度上保障了审核精准度,进而有利于提高审核效果,具有较大的实用性。
实施例2
参照图2所示,本发明提供一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
页面信息提取模块,与目标教材页面统计模块连接,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
文本合规审核模块,分别与页面信息提取模块和审核数据库连接,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
文本合规指数评价模块,与文本合规审核模块连接,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
插画观看质量合规审核模块,与页面信息提取模块连接,用于对各页面对应的插画部分进行观看质量合规审核;
插画合规指数评价模块,与插画观看质量合规审核模块连接,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
目标教材审核判断模块,分别与文本合规指数评价模块和插画合规指数评价模块连接,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
实施例3
本发明提供一种基于人工智能的学生教材内容审核评价存储介质,所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种基于人工智能的学生教材内容审核评价方法。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (3)

1.一种基于人工智能的学生教材内容审核评价方法,其特征在于,包括以下步骤:
S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
S5:对各页面对应的插画部分进行观看质量合规审核;
S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过;
所述S3中对各页面对应的文本部分进行格式合规审核对应的具体审核过程如下:
A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
A2:分别提取各文字对应的字体和字号;
A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式
Figure FDA0004064923340000021
计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量;
所述S3中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
B1:对各页面对应的文本部分进行分句划分,得到若干分句;
B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
B3:从各页面对应各分句存在的若干词组中提取出关键词组;
B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为
Figure FDA0004064923340000031
ηi表示为第i个页面对应的史事表述合规度,ri表示为第i个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数;
所述要素参数包括发生时间、发生地点、人物、背景和过程;
所述S3中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为
Figure FDA0004064923340000041
ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量;
所述目标教材对应的文本合规指数评价公式为
Figure FDA0004064923340000042
Figure FDA0004064923340000043
表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1;
所述S5中对各页面对应的插画部分进行观看质量合规审核对应的具体审核过程如下:
D1:对各页面对应的插画进行分辨率检测;
D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
D3:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
D4:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式
Figure FDA0004064923340000051
由此计算各页面中各插画主体对应的颜色填充符合度;
所述评价目标教材对应的插画合规指数具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为
Figure FDA0004064923340000052
ψ表示为目标教材对应的插画合规指数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1。
2.根据权利要求1所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于,该方法在实施过程中需要用到一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
页面信息提取模块,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
文本合规审核模块,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
文本合规指数评价模块,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
插画观看质量合规审核模块,用于对各页面对应的插画部分进行观看质量合规审核;
插画合规指数评价模块,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
目标教材审核判断模块,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
3.一种基于人工智能的学生教材内容审核评价存储介质,其特征在于:所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1所述的方法。
CN202210728919.7A 2022-06-24 2022-06-24 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质 Active CN115205879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210728919.7A CN115205879B (zh) 2022-06-24 2022-06-24 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210728919.7A CN115205879B (zh) 2022-06-24 2022-06-24 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN115205879A CN115205879A (zh) 2022-10-18
CN115205879B true CN115205879B (zh) 2023-05-05

Family

ID=83578755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210728919.7A Active CN115205879B (zh) 2022-06-24 2022-06-24 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN115205879B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103237006A (zh) * 2013-03-21 2013-08-07 蓝盾信息安全技术股份有限公司 互联网出口检查系统中对图片中文字内容审计的方法
CN113254970A (zh) * 2021-06-08 2021-08-13 中教云智数字科技有限公司 一种数字教材审核及验证方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050521A (zh) * 2013-03-13 2014-09-17 上海斐讯数据通信技术有限公司 图书管理系统
CN111880924B (zh) * 2019-04-15 2023-03-31 北京智启蓝墨信息技术有限公司 一种智能教材生成系统及方法
CN110867237A (zh) * 2019-11-15 2020-03-06 曹庆恒 一种对合理及合规用药系统的规则库进行管理的方法、系统和设备
CN111814793A (zh) * 2020-09-09 2020-10-23 耀方信息技术(上海)有限公司 药品图文信息违规检测方法及系统
CN112163748A (zh) * 2020-09-18 2021-01-01 江苏现代职教图书发行有限公司 一种数据处理方法、装置及教材管理信息系统
CN112241875A (zh) * 2020-10-23 2021-01-19 成都进托邦互联网信息服务有限公司 基于人工智能技术的网络游戏内容审核方法
CN112651663A (zh) * 2021-01-13 2021-04-13 中教云智数字科技有限公司 一种数字教材审核系统
CN113704498A (zh) * 2021-09-01 2021-11-26 云知声(上海)智能科技有限公司 用于文档的智能审核方法及其系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103237006A (zh) * 2013-03-21 2013-08-07 蓝盾信息安全技术股份有限公司 互联网出口检查系统中对图片中文字内容审计的方法
CN113254970A (zh) * 2021-06-08 2021-08-13 中教云智数字科技有限公司 一种数字教材审核及验证方法

Also Published As

Publication number Publication date
CN115205879A (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
Jones et al. Accounting narratives: A review of empirical studies of content and readability
CN109598995B (zh) 基于贝叶斯知识跟踪模型的智能教学系统
Lee et al. Visual input enhancement and grammar learning: A meta-analytic review
CN103823794B (zh) 一种关于英语阅读理解测试疑问式简答题的自动化命题方法
CN108376151A (zh) 问题分类方法、装置、计算机设备和存储介质
CN112632989B (zh) 一种合同文本中风险信息的提示方法、装置及设备
CN113220768A (zh) 基于深度学习的简历信息结构化方法及系统
CN114860882A (zh) 一种基于文本分类模型的公平竞争审查辅助方法
CN112381099A (zh) 一种基于数字教育资源的录题系统
CN114048327A (zh) 一种基于知识图谱的主观题自动评分方法及系统
Imaniar Students' writing errors and what lies beyond them
CN116401343A (zh) 一种数据合规分析方法
CN111597305A (zh) 实体标记方法、装置、计算机设备和存储介质
CN110674722A (zh) 一种试卷拆分方法及其系统
CN115205879B (zh) 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质
CN103744840B (zh) 一种文档翻译难度的分析方法
CN110765107A (zh) 基于数字化编码的题型识别方法及其系统
CN111507534A (zh) 基于学生学习数据的知识点掌握情况的预测分析算法
CN116823045A (zh) 一种英文书写质量的自动评阅方法、系统、设备及介质
CN103699675B (zh) 一种译员分级索引的方法
CN116451646A (zh) 一种标准草案检测方法、系统、电子设备及存储介质
CN116306487A (zh) 高等院校学位论文格式智能检测系统及方法
CN115761741A (zh) 一种教育教学测评管理系统及方法
CN115599962A (zh) 基于教育领域的数据资源云存储共享方法
CN107436863A (zh) 英语语篇易读度的评测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230417

Address after: 3rd floor, No. 19 Building, 498 Guoshoujing Road, Pudong New Area Free Trade Pilot Area, Shanghai, 200120

Applicant after: Imagination Education Technology Co.,Ltd.

Address before: No. 12, Metallurgical Avenue, High tech Park, Qingshan District, Wuhan, Hubei 430080

Applicant before: Wuhan Zhuojiao Education Consulting Center

GR01 Patent grant
GR01 Patent grant