CN116306570A - 一种数字化教材三层结构化设计方法及装置 - Google Patents

一种数字化教材三层结构化设计方法及装置 Download PDF

Info

Publication number
CN116306570A
CN116306570A CN202310128894.1A CN202310128894A CN116306570A CN 116306570 A CN116306570 A CN 116306570A CN 202310128894 A CN202310128894 A CN 202310128894A CN 116306570 A CN116306570 A CN 116306570A
Authority
CN
China
Prior art keywords
target
paragraph
teaching material
teaching
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310128894.1A
Other languages
English (en)
Inventor
王俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pep Digital Publishing Corp ltd
Original Assignee
Pep Digital Publishing Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pep Digital Publishing Corp ltd filed Critical Pep Digital Publishing Corp ltd
Priority to CN202310128894.1A priority Critical patent/CN116306570A/zh
Publication of CN116306570A publication Critical patent/CN116306570A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请提供了一种数字化教材三层结构化设计方法及装置,涉及数据处理技术领域。本申请获取目标版本教材的目标段落;建立包括目标段落的段落内容以及目标段落的第一编码的第一段落数据;从预设的第二结构信息中查询得到与目标段落的内容匹配的目标识别信息;获取目标识别信息的目标教学资源;建立第一编码与目标识别信息的第一关联关系;根据第一段落数据、第一关联关系及目标教学资源生成目标段落的数字化内容。如此能够,在第二结构信息中根据目标段落的段落内容查找目标识别信息,通过目标识别信息调用目标教学资源,多个版本的教材中相同的段落可以通过第二结构信息直接调用目标教学资源,无需重复为不同版本中相同段落内容分别新建教学资源。

Description

一种数字化教材三层结构化设计方法及装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数字化教材三层结构化设计方法及装置。
背景技术
随着学生多终端学习的需要,教材在多媒体终端上的灵活展示的需求日益增加。当前,由于纸质教材基于出版格式,大部分教材进行数字化,配置多媒体教学资源,是以教材的出版格式的排版进行设置,而纸质教材为排版方便,可能会打乱文章本身的流式结构。且教材进行数字化时,常以章节为单元进行教学资源的配置,造成学生在利用多媒体教学资源掌握知识时,知识点不够细化。此外,由于相同或类似知识内容会出现在不同地区的教材上,且相同或类似知识内容分布在不同的章节年级册别不同,多媒体资源对应章节进行配置,不够细化,推送不灵活,需要各地不断重复的一而再、再而三的建设配套的多媒体资源,造成教材研发费用的增加。
发明内容
有鉴于此,本申请实施例提供了一种数字化教材三层结构化设计方法及装置,旨在实现降低为教材进行多媒体资源配置的次数,降低研发费用。
第一方面,本申请实施例提供了一种数字化教材三层结构化设计方法,所述方法包括:
获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的教材;
建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码;
从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于数字化教材三层结构中的文章结构内的信息数据;
获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于所述数字化教材三层结构中的信息化结构内的信息数据;
建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源;
根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于所述数字化教材三层结构中的出版结构内的信息数据。
可选的,所述方法还包括:
获取源版本教材内的每篇文章的第二结构信息,所述第二结构信息是基于源版本教材包括的文章生成,所述第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息;所述源版本教材包括所述目标版本教材包括的至少一篇文章。
可选的,所述目标版本教材还包括章节数据,所述目标段落为所述目标版本教材中包括的所有段落中的每一个段落,所述方法还包括:
根据所述章节数据生成所述目标版本教材的数字化版本的章节出版数据,所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系;
根据教材数据、章节出版数据以及目标版本教材中各个段落的数字化内容,生成所述目标版本教材的数字化版本,所述教材数据包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种。
可选的,所述数字化教材三层结构包括:
文章结构,用于存储源版本教材内每篇文章的第二结构信息,第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息,所述识别信息用于获取信息化结构中的教学资源;
出版结构,用于存储目标版本教材内的教材数据、章节出版数据、第一段落数据和第一关联关系,所述教材数据包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种;所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系;所述第一段落数据包括目标版本教材内的各个段落内容、每个所述段落内容对应的第一编码以及每个段落在所属的章节中的排列序号,所述第一关联关系是将目标版本教材的目标段落的第一编码与从文章结构中查询得到的与所述目标段落的段落内容匹配的目标识别信息建立的关联关系;
信息化结构,用于存储教学资源。
可选的,所述从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,包括:
从预设的第二结构信息中查询与所述目标段落的段落内容相关的文本段落,作为目标文本段落;
将所述目标文本段落的第二编码作为目标识别信息。
可选的,所述获取所述目标识别信息的目标教学资源,包括:
基于所述目标识别信息以及所述目标识别信息与目标教学资源预先建立的第二关联关系,获取所述目标教学资源。
可选的,所述目标识别信息是通过自然语言处理算法对文本段落进行语义识别获得的向量,所述文本段落的段落内容与所述目标段落的段落内容相关;所述目标段落的段落内容为文本内容;
所述从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,包括:
通过自然语言处理算法对所述目标段落的段落内容进行语义识别,得到语义向量;
将预设的所述第二结构信息中与所述语义向量相似度最高的文本段落的识别信息确定为目标识别信息。
可选的,所述获取所述目标识别信息的目标教学资源,包括:
将目标识别信息输入自然语言处理算法,得到所述自然语言处理算法输出的目标知识点;
获取所述目标知识点对应的目标教学资源。
可选的,所述第一段落数据还包括所述目标段落在所属的章节中的排列序号;
在所述生成所述目标段落的数字化内容之前,所述方法还包括:
响应于检测到所述排列序号的更新,获取所述目标段落在所属的章节中新的排列序号。
第二方面,本申请还提供了一种数字化教材三层结构化设计装置,所述装置包括:
第一获取模块,用于获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的教材;
第一建立模块,用于建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码;
查询模块,用于从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于所述数字化教材三层结构中的文章结构内的信息数据;
第二获取模块,用于获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于数字化教材三层结构中的信息化结构内的信息数据;
第二建立模块,用于建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源;
构建模块,用于根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于数字化教材三层结构中的出版结构内的信息数据。
本申请实施例提供了一种数字化教材三层结构化设计方法及装置。本申请获取目标版本教材的目标段落;建立第一段落数据,第一段落数据包括目标版本教材内的目标段落的段落内容以及目标段落的第一编码;从预设的第二结构信息中查询得到与目标段落的段落内容匹配的目标识别信息,第二结构信息是存储于数字化教材三层结构中的文章结构内的信息数据,文章结构中可以存储不重复的文章、文章的文本段落以及该文本段落的第二编码。当有新版本的教材需要寻找对应的教学资源时,即可到数字化教材三层结构中的文章结构内根据目标段落的段落内容匹配对应目标识别信息,并进一步获取目标识别信息的目标教学资源,该目标教学资源是预先存储于所述数字化教材三层结构中的信息化结构内的信息数据,目标识别信息根据文本段落的内容与目标教学资源对应。建立所述第一编码与所述目标识别信息的第一关联关系。根据第一段落数据、第一关联关系以及目标教学资源,生成所述目标段落的数字化内容。所述第一段落数据和所述第一关联关系是存储于所述数字化教材三层结构中的出版结构内的信息数据。如此能够,在需要获取目标段落的目标教学资源时,可以通过第一关联关系,在数字化教材三层结构的文章结构中确定对应的目标识别信息,根据目标识别信息,从数字化教材三层结构的信息化结构中获得对应的目标教学资源,获得该目标段落的数字化内容。多个版本的教材中相同的段落可以通过数字化教材三层结构中的文章结构和信息化结构,获取段落的目标教学资源,以段落为单元,不受章节的限制,也无需重复为不同版本中相同段落内容分别新建教学资源,降低教材研发成本。
附图说明
为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种教材的数字化内容构建方法的流程图;
图2为本申请实施例提供的一种数字化教材三层结构示意图;
图3为本申请实施例提供的另一种数字化教材三层结构示意图;
图4为本申请实施例提供的另一种教材的数字化版本构建方法的流程图;
图5为本申请实施例提供的一种教材的数字化内容构建装置的结构示意图。
具体实施方式
随着学生多终端学习的需要,教材在多媒体终端上的灵活展示的需求日益增加。当前,由于纸质教材基于出版格式,大部分教材进行数字化,配置多媒体教学资源,是以教材的出版格式的排版进行设置,而纸质教材为排版方便,可能会打乱文章本身的流式结构。且教材进行数字化时,常以章节为单元进行教学资源的配置,造成学生在利用多媒体教学资源掌握知识时,知识点不够细化。此外,且由于相同或类似知识内容会出现在不同地区的教材上,由于相同或类似知识内容分布在不同的章节年级册别不同,多媒体资源对应章节进行配置,不够细化,推送不灵活,需要各地不断重复的一而再、再而三的建设配套的多媒体资源,造成教材研发费用的增加。
当以教材章节为单元进行多媒体等信息化资源的推送,会造成推送不灵活,不够细化。且当以段落为准推送资源,由于纸质版教材排版页面需要,段落被拆分,无法建立完整段落的知识结构。
多地不同版本教材会涉及相同的段落内容,例如人教版和苏教版均涉及到《从百草园到三味书屋》相同的课文段落,例如,当根据人教版的《从百草园到三味书屋》的文本段落建立第二结构数据存储到文章结构中后,在后续苏教版中出现了该篇目的文章时,可以通过数字化教材的三层结构中的文章结构,获取苏教版中《从百草园到三味书屋》的各个目标段落,并到文章结构内查找对应的目标文本段落,从而根据目标文本段落获得目标识别数据,进而获得目标段落的目标教学资源,无需对每个版本的教材内相同的文章,重新进行多媒体资源建立配置,降低的研发成本。
显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种教材的数字化内容构建方法的流程图,参见图1,本申请实施例提供的一种教材的数字化内容构建方法,包括:
S101、获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的电子版教材。
所述目标版本教材可以是人教版本教材,也可以是苏教新版教材,当然也可以是其他地方版本的教材。
目标版本教材可以为审定通过的扫描纸质印刷版教材获得PDF电子版教材,也可以是审定通过用于印刷出版的电子版教材。
S102、建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码。
所述目标段落的第一段落数据可以为目标版本教材中的包含教学内容的文本类段落或非文本类段落,文本类段落可以是课文文本、数学公式等,非文本类段落可以是插图等。
第一编码是第一段落数据建立时,与该目标段落对应生成的。
S103、从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于数字化教材三层结构中的文章结构内的信息数据。
第二结构信息是基于源版本教材包括的文章生成,所述第二结构信息包括文章数据和第二段落数据;第二段落数据包括文章包括的文本段落以及文章包括的各个文本段落的识别信息;源版本教材包括目标版本教材包括的至少一篇文章。
从预设的第二结构信息中查询与目标段落的段落内容对应的文本段落的识别信息作为目标识别信息。
S104、获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于所述数字化教材三层结构中的信息化结构内的信息数据。
目标教学资源可以包括数字化资源(例如视频、音频、动画、图片、文本、教案、学案和习题等)和信息化工具(例如段落提问与解答、习题练习与作答、直播、录播、公式和实验等)。
根据目标识别信息的关联检索获得目标教学资源。
S105、建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源。
目标段落通过第一关联关系即可确定目标识别信息,通过目标识别信息即可确定目标教学资源。
S106、根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于所述数字化教材三层结构中的出版结构内的信息数据。
在一种可能的实现方式中,第一段落数据中的目标段落与通过第一关联关系引用目标教学资源共同展示,作为目标段落的数字化内容。
在另一种可能的实现方式中,第一段落数据中的目标段落作为第一数字化内容进行展示,响应于用户的第一操作,通过第一关联关系调用目标教学资源,将该目标教学资源作为,目标段落的数字化内容进行展示。
在一种可能的实现方式中,参见图2,一种数字化教材三层结构示意图,上述的数字化教材三层结构包括:
文章结构,用于存储源版本教材内每篇文章的第二结构信息,第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息,所述识别信息用于获取信息化结构中的教学资源;出版结构,用于存储目标版本教材内的教材数据、章节出版数据、第一段落数据和第一关联关系,所述教材数据包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种;所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系;所述第一段落数据包括目标版本教材内的各个段落内容、每个所述段落内容对应的第一编码以及每个段落在所属的章节中的排列序号,所述第一关联关系是将目标版本教材的目标段落的第一编码与从文章结构中查询得到的与所述目标段落的段落内容匹配的目标识别信息建立的关联关系;信息化结构,用于存储教学资源。
根据上述的步骤S101-S106可知,面对目标版本教材中的目标段落,可以从根据源版本教材建立的文章结构的第二结构信息中查找与目标段落内容相关的文本段落及该文本段落对应的目标识别信息,从而获取目标识别信息的教学资源,得到目标版本教材中目标段落的数字化内容。如此能够,当多地教材内相同知识的目标段落时,仅需扩充配置文章结构内的第二结构信息,即可使不同教材上相同的目标段落与第二结构信息的文本段落匹配,获得文本段落对应的目标识别信息,通过目标识别信息调用目标教学资源,无需每个版本的教材分别进行数字化的多媒体教学资源建立,降低教材研发成本。
在本申请实施例中,上述图1所述的步骤S103-S104存在多种可能的实现方式,下面分别进行介绍。需要说明的是,下文介绍中给出的实现方式仅作为示例性的说明,并不代表本申请实施例的全部实现方式。
在一种可能的实现方式中,从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,获取所述目标识别信息的目标教学资源,具体步骤包括:
A1、从预设的第二结构信息中查询与所述目标段落的段落内容相关的文本段落,作为目标文本段落。
第二结构信息是基于源版本教材包括的文章生成,第二结构信息包括文章数据(标题、作者、来源、发表年月和全文内容中的一种或几种)和第二段落数据(文本段落的段落内容、文本段落的第二编码和文本段落在该文章中的排列序号)。
A2、将所述目标文本段落的第二编码作为目标识别信息。
第二编码是第二结构信息建立时,与该目标文本段落对应生成的。
文本段落与文本段落的第二编码为一一对应关系。
目标文本段落第二编码与目标段落的第一编码建立第一关联关系,可参见图3所示的另一种数字化教材三层结构示意图。
A3、基于所述第二编码与目标教学资源的第二关联关系以及所述第二编码,获取所述目标教学资源。
所述目标教学资源可以包括数字化资源(例如视频、音频、动画、图片、文本、教案、学案和习题等)和信息化工具(例如段落提问与解答、习题练习与作答、直播、录播、公式和实验等)。
目标文本段落的第二编码与目标教学资源建立的第二关联关系可以包括第一分支关联关系和第二分支关联关系,第一分支关联关系可以是将目标文本段落的第二编码与目标教学资源中的数字化资源建立关联关系;第二分支关联关系可以是将目标文本段落的第二编码与目标教学资源中的信息化工具建立关联关系,可参见图3所示的另一种数字化教材三层结构示意图,可以根据对数字化资源的需求选择第一分支关联关系,调用对应的数字化资源;也可以根据需要选择第二分支关联关系,调用对应的信息化工具。第一分支关联关系和第二分支关联关系均可设置为一种用户可操作的按键,方便用户选择对应的教学资源,也可根据预设的配置输出对应的教学资源。
根据步骤A1-A3可知,目标识别信息为第二编码,获取目标教学资源是通过第二关联关系确定第二编码匹配的目标教学资源。当多个不同版本的教材中内的目标段落的段落内容与同一文本段落对应时间,即可通过文本段落的第二编码获得相同的目标教学资源,无需多次配置。
在另一种可能的实现方式中,目标识别信息是通过自然语言处理算法对文本段落进行语义识别获得的向量,所述文本段落的段落内容与所述目标段落的段落内容相关;目标段落的段落内容为文本内容。
因此,从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,获取所述目标识别信息的目标教学资源,具体包括:
B1、通过自然语言处理算法对所述目标段落的段落内容进行语义识别,得到语义向量。
B2、将预设的所述第二结构信息中与所述语义向量相似度最高的文本段落的识别信息确定为目标识别信息。
自然语言处理算法(Natura l Language Process i ng,NLP)可以获取待处理文本的向量,并对向量进行处理,本申请中确认与第二结构信息中与目标段的语义向量的相似度最该的文本段落。
B3、将目标识别信息输入自然语言处理算法,得到所述自然语言处理算法输出的目标知识点。
将目标识别信息输入自然语言处理算法,通过自然语言处理算法标引的知识点作为目标指示点。
B4、获取所述目标知识点对应的目标教学资源。
通过目标指示点可以在已有的教学资源数据库中进行检索,也可在互联网中进行检索获得目标教学资源。
根据步骤B1-B4可知,借助自然语言处理算法,拓宽数字化内容的获取范围。可以实现较为准确获得目标段落对应的知识点,并进行较为准确的信息推送。
在本申请实施例中,上述图1所述的方法还存在可能的实现方式,当目标版本教材还包括章节数据和段落数据,所述目标段落为所述目标版本教材中包括的所有段落中的每一个段落,下面具体进行介绍。需要说明的是,下文介绍中给出的实现方式仅作为示例性的说明,并不代表本申请实施例的全部实现方式。
图4为本申请实施例提供的一种教材的数字化版本构建方法的流程图,参见图4,根据上述一种教材的数字化内容构建方法的实施例,本实施例还进一步提供的另一种教材的数字化版本构建方法,包括:
S401、获取目标版本教材的第一结构数据,所述第一结构数据包括教材数据、章节数据以及所述目标版本教材中的每个段落的第一段落数据。
S402、根据所述章节数据生成所述目标版本教材的数字化版本的章节出版数据,所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系。
章节数据包括章节编码、章节标题、章节所属教材编码、章节所属上级章节编码、章节层级、同级排序号、开始页码和结束页码中的一种或多种。
数字化版本的章节出版数据根据章节数据确定目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系,还可以根据章节数据进行有选择的保存,以便后续展示。
S403、根据所述第一段落数据,将所述目标版本教材中的各个段落采用上述的一种教材的数字化内容构建方法,生成所述段落的数字化内容。
第一段落数据可以包括第一段落编码、段落所属章节编码、段落在章节中的排列序号、段落的页码和段落在页面中位置信息中的一种或多种。
数字化版本将目标版本教材中的段落采用上述的一种教材的数字化内容构建方法,生成各个段落的数字化内容。各个段落的数字化内容还可以根据第一段落数据对各个段落相关信息进行有选择的保存,以便后续展示。
S404、根据所述教材数据、章节出版数据以及目标版本教材中各个段落的数字化内容,生成所述目标版本教材的数字化版本。
教材数据可以包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种。数字化版本的教材信息可以根据教材数据进行有选择的保存,以便后续展示。
根据上述的步骤S401-S404可知,生成目标版本教材的数字化版本,可以根据目标版本教材的教材数据、章节数据以及通过教材的数字化内容构建方法获得各个段落的数字化内容进行生成并展示。例如鲁迅的《从百草园到三味书屋》原是人教版课文,此时因教材大纲相似,苏教新版教材也需要引入,但课文所在年级册别不和人教版一致。但其内容文章主体一致,将各个版本的目标段落与根据《从百草园到三味书屋》的文章建立的第二结构信息中的文本段落进行匹配,并通过文本段落的目标识别信息引用目标教学资源。因此一篇文章,仅需配置一次教学资源,从而减少重复建设资源。
在本申请实施例中,上述图1所述的步骤S403存在可能的实现方式,下面分别进行介绍。需要说明的是,下文介绍中给出的实现方式仅作为示例性的说明,并不代表本申请实施例的全部实现方式。
在一种可能的实现方式中,所述第一段落数据还包括所述目标段落在所属的章节中的排列序号。在所述生成所述目标段落的数字化内容之前,还包括:响应于检测到所述排列序号的更新,获取所述目标段落在所属的章节中新的排列序号。
目标段落所在的章节根据目标段落的新的排列序号,排布所述目标段落在所述的章节中的排列位置。还可以根据目标段落的结构进行样式的修改。
以上为本申请实施例提供方法的一些具体实现方式,基于此,本申请还提供了对应的装置。下面将从功能模块化的角度对本申请实施例提供的装置进行介绍。
图5为本申请实施例提供的一种教材的数字化内容构建装置的结构示意图,参见图5,本实施例提供的一种教材的数字化内容构建装置500,包括:
第一获取模块501,用于获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的教材。
第一建立模块502,用于建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码。
查询模块503,用于从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于所述数字化教材三层结构中的文章结构内的信息数据。
第二获取模块504,用于获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于数字化教材三层结构中的信息化结构内的信息数据。
第二建立模块505,用于建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源。
构建模块506,用于根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于数字化教材三层结构中的出版结构内的信息数据。
根据上述的一种教材的数字化内容构建装置可知,面对相同或类似知识的各地不同版本教材中相同的目标段落,都可以通过查询模块503从第二结构信息中查找段落内容相关的文本段落及该文本段落对应的目标识别信息,从而通过第二获取模块504获取目标识别信息的教学资源,进而通过构建模块505得到目标版本教材中目标段落的数字化内容。
在一种可能的实现方式中,第三获取模块,用于获取源版本教材内的每篇文章的第二结构信息,所述第二结构信息是基于源版本教材包括的文章生成,所述第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息;所述源版本教材包括所述目标版本教材包括的至少一篇文章。
在另一种可能的实现方式中,查询模块503,还用于从预设的第二结构信息中查询与所述目标段落的段落内容相关的文本段落,作为目标文本段落;将所述目标文本段落的第二编码作为目标识别信息;第二获取模块504,还用于基于所述目标识别信息以及所述目标识别信息与目标教学资源预先建立的第二关联关系,获取所述目标教学资源。
在又一种可能的实现方式中,所述目标识别信息是通过自然语言处理算法对文本段落进行语义识别获得的向量,所述文本段落的段落内容与所述目标段落的段落内容相关;所述目标段落的段落内容为文本内容;查询模块503,还用于通过自然语言处理算法对所述目标段落的段落内容进行语义识别,得到语义向量;将预设的所述第二结构信息中与所述语义向量相似度最高的文本段落的识别信息确定为目标识别信息。第二获取模块504,还用于将目标识别信息输入自然语言处理算法,得到所述自然语言处理算法输出的目标知识点;获取所述目标知识点对应的目标教学资源。
在再一种可能的实现方式中,所述目标版本教材还包括章节数据和段落数据,所述目标段落为所述目标版本教材中包括的所有段落中的一个段落。
所述第一段落数据还包括所述目标段落在所属的章节中的排列序号;所述构建模块,还用于响应于所述排列序号的更新,获取所述目标段落在所属的章节中新的排列序号。
本申请实施例还提供了对应的设备以及计算机存储介质,用于实现本申请实施例提供的方案。
其中,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行本申请任一实施例所述的一种教材的数字化内容构建方法。
所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现本申请任一实施例所述的一种教材的数字化内容构建方法。
本申请实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-on ly memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请示例性的实施方式,并非用于限定本申请的保护范围。

Claims (10)

1.一种数字化教材三层结构化设计方法,其特征在于,所述方法包括:
获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的教材;
建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码;
从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于数字化教材三层结构中的文章结构内的信息数据;
获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于所述数字化教材三层结构中的信息化结构内的信息数据;
建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源;
根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于所述数字化教材三层结构中的出版结构内的信息数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取源版本教材内的每篇文章的第二结构信息,所述第二结构信息是基于源版本教材包括的文章生成,所述第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息;所述源版本教材包括所述目标版本教材包括的至少一篇文章。
3.根据权利要求1所述的方法,其特征在于,所述目标版本教材还包括章节数据,所述目标段落为所述目标版本教材中包括的所有段落中的每一个段落,所述方法还包括:
根据所述章节数据生成所述目标版本教材的数字化版本的章节出版数据,所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系;
根据教材数据、章节出版数据以及目标版本教材中各个段落的数字化内容,生成所述目标版本教材的数字化版本,所述教材数据包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述数字化教材三层结构包括:
文章结构,用于存储源版本教材内每篇文章的第二结构信息,第二结构信息包括文章数据和第二段落数据;所述第二段落数据包括所述文章包括的文本段落以及所述文章包括的各个文本段落的识别信息,所述识别信息用于获取信息化结构中的教学资源;
出版结构,用于存储目标版本教材内的教材数据、章节出版数据、第一段落数据和第一关联关系,所述教材数据包括教材编码、教材标题、教材出版社、教材年份、教材版本信息、教材学段、教材学科、教材年级和教材册别中的一种或多种;所述章节出版数据包括所述目标版本教材中的章节的章节名称以及各个所述章节之间的从属关系;所述第一段落数据包括目标版本教材内的各个段落内容、每个所述段落内容对应的第一编码以及每个段落在所属的章节中的排列序号,所述第一关联关系是将目标版本教材的目标段落的第一编码与从文章结构中查询得到的与所述目标段落的段落内容匹配的目标识别信息建立的关联关系;
信息化结构,用于存储教学资源。
5.根据权利要求2所述的方法,其特征在于,所述从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,包括:
从预设的第二结构信息中查询与所述目标段落的段落内容相关的文本段落,作为目标文本段落;
将所述目标文本段落的第二编码作为目标识别信息。
6.根据权利要求5所述的方法,其特征在于,所述获取所述目标识别信息的目标教学资源,包括:
基于所述目标识别信息以及所述目标识别信息与目标教学资源预先建立的第二关联关系,获取所述目标教学资源。
7.根据权利要求2所述的方法,其特征在于,所述目标识别信息是通过自然语言处理算法对文本段落进行语义识别获得的向量,所述文本段落的段落内容与所述目标段落的段落内容相关;所述目标段落的段落内容为文本内容;
所述从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,包括:
通过自然语言处理算法对所述目标段落的段落内容进行语义识别,得到语义向量;
将预设的所述第二结构信息中与所述语义向量相似度最高的文本段落的识别信息确定为目标识别信息。
8.根据权利要求7所述的方法,其特征在于,所述获取所述目标识别信息的目标教学资源,包括:
将目标识别信息输入自然语言处理算法,得到所述自然语言处理算法输出的目标知识点;
获取所述目标知识点对应的目标教学资源。
9.根据权利要求1所述的方法,其特征在于,所述第一段落数据还包括所述目标段落在所属的章节中的排列序号;
在所述生成所述目标段落的数字化内容之前,所述方法还包括:
响应于检测到所述排列序号的更新,获取所述目标段落在所属的章节中新的排列序号。
10.一种数字化教材三层结构化设计装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标版本教材的目标段落,所述目标版本教材是用于印刷出版的教材;
第一建立模块,用于建立第一段落数据,所述第一段落数据包括目标版本教材内的所述目标段落的段落内容以及所述目标段落的第一编码;
查询模块,用于从预设的第二结构信息中查询得到与所述目标段落的段落内容匹配的目标识别信息,所述第二结构信息是存储于所述数字化教材三层结构中的文章结构内的信息数据;
第二获取模块,用于获取所述目标识别信息的目标教学资源,所述目标教学资源是存储于数字化教材三层结构中的信息化结构内的信息数据;
第二建立模块,用于建立所述第一编码与所述目标识别信息的第一关联关系,以便所述目标段落通过所述第一关联关系调取所述目标教学资源;
构建模块,用于根据所述第一段落数据、所述第一关联关系以及所述目标教学资源,生成所述目标段落的数字化内容,所述第一段落数据和所述第一关联关系是存储于数字化教材三层结构中的出版结构内的信息数据。
CN202310128894.1A 2023-02-03 2023-02-03 一种数字化教材三层结构化设计方法及装置 Pending CN116306570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310128894.1A CN116306570A (zh) 2023-02-03 2023-02-03 一种数字化教材三层结构化设计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310128894.1A CN116306570A (zh) 2023-02-03 2023-02-03 一种数字化教材三层结构化设计方法及装置

Publications (1)

Publication Number Publication Date
CN116306570A true CN116306570A (zh) 2023-06-23

Family

ID=86829751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310128894.1A Pending CN116306570A (zh) 2023-02-03 2023-02-03 一种数字化教材三层结构化设计方法及装置

Country Status (1)

Country Link
CN (1) CN116306570A (zh)

Similar Documents

Publication Publication Date Title
CN109614504B (zh) 一种互联网电子书的管理系统及方法
US20150024351A1 (en) System and Method for the Relevance-Based Categorizing and Near-Time Learning of Words
Gardner The electronic archive: Scientific publishing for the 1990s
EP2831775A1 (en) Information processing terminal and method, and information management apparatus and method
CN111881664A (zh) 一种结合rpa和ai的信息抽取方法、装置、设备及介质
Kwary A corpus platform of Indonesian academic language
CN114385924A (zh) 一种教师教研知识推荐方法及系统
CN109635125B (zh) 一种词汇图谱搭建方法及电子设备
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
CN110297965B (zh) 课件页面的显示及页面集的构造方法、装置、设备和介质
Balk et al. IMPACT: working together to address the challenges involving mass digitization of historical printed text
KR20160140527A (ko) 다국어 전자책 시스템 및 방법
CN116306570A (zh) 一种数字化教材三层结构化设计方法及装置
JP5877775B2 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
CN102262617B (zh) 一种书版小样处理方法及装置
KR101650141B1 (ko) 한자 학습 서비스 제공 방법 및 이에 포함된 학습 교재
CN114117015A (zh) 一种知识点溯源方法、装置、设备以及存储介质
CN114021004A (zh) 一种理科相似题推荐方法、装置、设备及可读存储介质
Hockey The rendering of humanities information in a digital context: Current trends and future developments
Brown Librarian's guide to online searching: cultivating database skills for research and instruction
CN110866084A (zh) 家谱人物的数据处理方法及装置、电子设备
KR20130083002A (ko) Xml 기반의 디지털 교육 콘텐츠 관리 장치 및 방법
CN118485149B (zh) 基于组合阅读实现知识库与任务对象精准区分比对的方法
CN111274352B (zh) 工具书中特征字的标注方法和设备
Soyusiawaty et al. Similarity detector on the student assignment document using Levenshtein distance method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination