CN112991122A - 汉字教学的规划方法和装置 - Google Patents

汉字教学的规划方法和装置 Download PDF

Info

Publication number
CN112991122A
CN112991122A CN202110502913.3A CN202110502913A CN112991122A CN 112991122 A CN112991122 A CN 112991122A CN 202110502913 A CN202110502913 A CN 202110502913A CN 112991122 A CN112991122 A CN 112991122A
Authority
CN
China
Prior art keywords
chinese character
chinese
teaching
score
difficulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110502913.3A
Other languages
English (en)
Inventor
陈沫
高悦
冯慎行
宋浩铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202110502913.3A priority Critical patent/CN112991122A/zh
Publication of CN112991122A publication Critical patent/CN112991122A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请提供一种汉字教学的规划方法和装置,方法包括:对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个所述数值型特征对应的转换数值得分;根据各个汉字的转换数值得分,计算得到难度得分;根据所述难度得分对所述汉字数据库中的汉字排序,得到排序序列;根据所述排序序列制定汉字教学规划。采用本申请实施例中提供的汉字教学的规划方法和装置,在教师根据教学思路选定汉字的数值型特征后,可以根据选定的数值型特征计算得到汉字数据库中汉字的难度得分,继而可以根据汉字难度得分对汉字进行排序,并基于排序结果制定教学规划;此方法可以使老师根据教学思路快速地制定教学规划,提升教师的备课效率。

Description

汉字教学的规划方法和装置
技术领域
本申请涉及汉字教学技术领域,具体涉及汉字教学的规划方法和装置。
背景技术
目前,在儿童启蒙教学、外国学员汉语入门教学等汉字教学中,需要基于教学对象、课程设计思路制定汉字教学规划或者汉字复习规划,以使得学员能够从不同的分类维度熟悉和理解汉字的字形、字义和字音。
现有技术中,已有根据字度原则、形音义代表字原则和自释原则确定汉字核心字表的方案,以及根据外国学员学习汉字的实验数据,确定影响汉字难度得分的方案。
但是这些方案要么是分类颗粒度大而无法快速地使得教师制定教学规划,要么是并没有考虑汉字的字形、语音、语义以及使用频度等直接影响课程设计思路的基本特征,使得前述方案并不能快速地方便地设计出汉字教学规划。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供一种汉字教学的规划方法和装置。
一方面,本申请提供一种汉字教学的规划方法,包括:
对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个所述数值型特征对应的转换数值得分;
根据各个汉字的转换数值得分,计算得到难度得分;
根据所述难度得分对所述汉字数据库中的汉字排序,得到排序序列;
根据所述排序序列制定汉字教学规划。
可选的,所述汉字教学的规划方法还包括:根据分类依据划分所述汉字数据库中的汉字,得到汉字字群;
根据所述难度对所述汉字数据库中的汉字进行排序,得到排序序列,包括:根据所述难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列;
根据所述排序序列制定汉字教学规划,包括:根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划。
可选的,所述分类依据包括汉字结构、部件或者汉字的语义相关性中的至少一种。
可选的,所述汉字教学的规划方法还包括:根据所述汉字字群中包含汉字的难度得分,计算各个所述汉字字群的字群难度;
根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划,包括:根据各个汉字字群对应的字群难度和字群排序序列,制定所述汉字教学规划。
可选地,所述数值型特征包括笔画数、构字数、部件数、形旁表义透明度、具体度、构词数和使用字频中的至少两个。
可选地,所述汉字教学的规划方法还包括:获取为各个所述数值型特征设定的权重;
根据各个汉字的转换数值得分,计算得到难度得分,包括:根据各个所述数值型特征对应的权重和转换数值得分,采用加权求和方式计算得到所述难度得分。
另一方面,本申请还提供一种汉字教学的规划装置,包括:
预处理单元,用于对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个所述数值型特征对应的转换数值得分;
难度计算单元,用于根据各个汉字的转换数值得分,计算得到难度得分;
排序单元,用于根据所述难度得分对所述汉字数据库中的汉字排序,得到排序序列;
规划制定单元,用于根据所述排序序列制定汉字教学规划。
可选的,所述汉字教学的规划装置还包括分组单元,用于根据分类依据划分所述汉字数据库中的汉字,得到汉字字群;
所述排序单元根据所述难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列;
所述规划制定单元根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划。
可选的,所述难度计算单元还用于根据各个所述汉字字群中包含汉字的难度得分,计算对应的字群难度;
所述规划制定单元根据各个汉字字群对应的字群难度和字群排序序列,制定所述汉字教学规划。
采用本申请提供的汉字教学的规划方法和装置,在教师根据教学思路选定汉字的数值型特征后,可以根据选定的数值型特征计算得到汉字数据库中汉字的难度得分,继而可以根据汉字难度得分对汉字进行排序,并基于排序结果制定教学规划;此方法可以使老师根据教学思路快速地制定教学规划,提升教师的备课效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1是本申请实施例提供的汉字教学的规划方法流程图;
图2是本申请实施例提供汉字教学的规划装置的结构示意图;
图3是本申请实施例提供的电子设备的结构示意图;
其中:11-预处理单元,12-难度计算单元,13-排序单元,14-规划制定单元,15-分组单元;21-处理器,22-存储器,23-通信接口,24-总线系统。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面将对本申请的方案进行进一步描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但本申请还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本申请的一部分实施例,而不是全部的实施例。
本申请实施例提供一种汉字教学课程的规划,以用于使教师根据教学场景、教学对象和自己设定的教学思路,快速制定汉字教学课程的规划;本申请实施例提供的方法可以应用在幼儿汉字启蒙教学,小学生熟悉一定汉字后根据字音、字形或者字义的扩展教学,以及外国学员汉语入门教学等场景中。
图1是本申请实施例提供的汉字教学的规划方法流程图,如图1所示,本申请实施例提供的汉字教学的规划方法包括步骤S101-S104。
S101:对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个数值型特征对应的转换数值得分。
本申请实施例中的汉字数据库是一个针对特定学员对象设定的数据库;如果学员是幼儿或者适龄儿童,汉字数据库可以是小学低年级需要掌握的所有汉字;如果学员是没有汉语基础的外国学员,则汉字数据库可以是3500个常用汉字的数据库。
汉字的数值型特征是可以采用数值形式表示的汉字属性特征;汉字的数值型特征可以包括汉字的笔画数、汉字的构字数、部件数、形旁表义透明度、具体度、构词数和使用字频的至少两种;下文对前述数值型特征的涵义做解释。
汉字的笔画数是组成汉字的基本笔画(例如横、撇、竖、捺、折弯钩、点等)的数量。
汉字的构字数是采用该汉字作为部件(也就是偏旁部首)组成的其他汉字的数量。
汉字的形旁表义透明度是表征汉字的形旁对此形声字意义贡献大小的数值,形旁对整字意义的贡献越大,则此汉字的形旁表义透明度越大。
具体度是汉字语义的具体程度,是表征在看到一个汉字后可联想到的具体事务的程度;具体度越大,汉字更具有实际意义。
构词数是采用此汉字能够组成的词语的个数。
使用字频是实际使用中,某一汉字出现的频率。实际应用中,针对不同的汉字数据库,汉字的使用字频统计对象可以不同;例如,针对学龄儿童的汉字数据库,对应字频可以统计诸如小学低年级教材中的汉字得到;针对外国学员的汉字数据库的字频可以对现代汉语书面语料统计得到。
本申请实施例中,因为汉字数据库中汉字的数值型特征可能不是同向变化的,例如某些汉字的笔画数较多,而对应的使用字频可能较少,所以需要对数字型特征进行同向化处理。
在一个具体应用中,对汉字的数值型特征做同向化处理具体如下。
1.笔画数可以采用
Figure 686138DEST_PATH_IMAGE001
计算得到对应的转换数值得分。其 中
Figure 665596DEST_PATH_IMAGE002
为某一汉字的笔画数,
Figure 789541DEST_PATH_IMAGE003
为汉字数据库中所有汉字笔画数的平均数,
Figure 653591DEST_PATH_IMAGE004
为汉字数 据库中所有汉字笔画数的方差,
Figure 61439DEST_PATH_IMAGE005
前述某一汉字笔画数对应的转换数值得分(此处可以 称为笔画得分)。
2.构字数可以采用
Figure 352743DEST_PATH_IMAGE006
计算得到对应的转换数值得分。其中
Figure 728098DEST_PATH_IMAGE007
为某一汉字的构字数,
Figure 395840DEST_PATH_IMAGE008
为汉字数据库中所以汉字构字数的平均数,
Figure 658194DEST_PATH_IMAGE009
为汉字数据 库中所有汉字构字数的方差,
Figure 120400DEST_PATH_IMAGE010
为某一汉字构字数对应的转换数值得分(此处可以称为构 字数分)。
3.形旁表义透明度可以采用
Figure 218937DEST_PATH_IMAGE011
计算得到 对应的转换数值得分。其中,
Figure 424790DEST_PATH_IMAGE012
为某一汉字的形旁表义透明度,其可能为null,也可能为 一数值;
Figure 541651DEST_PATH_IMAGE013
为汉字数据库中所有汉字的形旁表义透明度平均值,
Figure 440337DEST_PATH_IMAGE014
为汉字数据库中所有 汉字的形旁表义透明度的方差,
Figure 727967DEST_PATH_IMAGE015
为某一汉字的形旁表义透明度对应的转换数值得分(此 处可以称为形旁表义透明度得分)。
4.具体度可以直接将其原数值作为转换数值得分。
5.构词数可以采用
Figure 596566DEST_PATH_IMAGE016
计算得到对应的转换数 值得分。其中,
Figure 708879DEST_PATH_IMAGE017
为某一汉字的构词数,
Figure 388253DEST_PATH_IMAGE018
为汉字数据库中所有汉字构词数的平均值,
Figure 851595DEST_PATH_IMAGE019
为汉字数据库中所有汉字构词数的方差,
Figure 523885DEST_PATH_IMAGE020
为某一汉字的构词数对应的转换数值得 分(此处可以称为构词数得分)。
6.使用字频可以采用
Figure 490704DEST_PATH_IMAGE021
计算得到对应的转换数字特征。其中,
Figure 105094DEST_PATH_IMAGE022
为某一汉字的使用字频,
Figure 524574DEST_PATH_IMAGE023
为汉字数据库中所有汉字使用字频的平均值,
Figure 555DEST_PATH_IMAGE024
为汉字 数据库中所有汉字使用字频的方差,
Figure 821880DEST_PATH_IMAGE025
为某一汉字使用字频对应的转换数值得分(此处 可以称为使用字频得分)。
应当注意的是,实际应用中可以采用前述的所有的数值型特征,也可以根据教师的教学思路选择部分数值型特征;在其他一些应用中国,还可以采用其他能够用数值方式表示的其他的数值型特征。
S102:根据各个汉字的转换数值得分,计算得到难度得分。
本申请实施例中,根据各个汉字的转换数值得分计算得到难度得分,可以采用加权求和的方式得到难度得分。
具体的,在执行步骤S102时,可以首先获取为各个数值型特征设定的权重。各个数值型特征对应的权重系数可以由教师根据教学对象、教学目的确定;例如如果教学对象为儿童,需要更多关注的是笔画数,因此可以为笔画数设定较高的权重,而对其他数值型特征设置较小的权重;再如,如果教学对象而非汉语母语的外国成年学员,可以为使用字频、构词数等设置较高的权重,而为其他数值型特征设置较小的权重。
根据前文叙述中各个转换数值得分的计算方法可知,在本申请实施例中,在对一些数值型特征进行同向化处理的同时,采用标准差而计算标准分数,使得各个数值型特征的转换分数大体在一个区间范围内。如此,在步骤S102实施中,教师可以方便地根据自己的需求设定各个转换数值得分对应的权重,不必过多关心各个数值型特征的转换数值得分的大小。
S103:根据难度得分对汉字数据库中的汉字排序,得到排序序列。
在确定难度得分后,可以按照难度得分的大小顺序对对应的汉字进行排序,而得到排序序列。例如,在一个应用中,可以按照得分从大到小的顺序进行排序。
S104:根据排序序列制定汉字教学规划。
在确定了排序顺序后,教师可以根据排序顺序,依次地确定各节课程讲解的汉字。
根据步骤S101-S104的叙述可知,采用本申请实施例中提供的汉字教学的规划方法,在教师根据教学思路选定汉字的数值型特征后,可以根据选定的数值型特征计算得到汉字数据库中汉字的难度得分,继而可以根据汉字难度得分对汉字进行排序,并基于排序结果制定教学规划;此方法可以使老师根据教学思路快速地制定教学规划,提升教师的备课效率。
在本申请实施例的一个具体应用中,汉字教学的规划方法还可以步骤S105:根据分类依据划分汉字数据库中的汉字,得到汉字字群。
本申请实施例中,分类依据可以是汉字结构、部件或者汉字的语义相关性中的至少一种,以下对前述的分类依据做解释。
汉字结构是偏旁部首的排列方式;具体可以分为单体结构、单一结构、左右结构、左中右结构、上下结构、上中下结构、上包围结构、下包围结构、左包围结构、左上包围结构、右上包围结构、半包围结构、全包围结构、品字结构、嵌套结构。
汉字的部件是组成汉字的组件,常用的汉字部件可以包括形旁、声旁;形旁是汉字对事物进行归类的表义的偏旁部首,例如“艹”、“钅”、“亻”等;声旁是汉字中表示读音的偏旁部首,例如“踮”中的“店”、“轮”中的“仑”。当然,除了前述的形旁和声旁外,还有其他一些没有表义或表音功能的部件,例如“朝”中的左边部分的“龺”。
汉字的语义相关性是表征汉字涵义之家关系的特征;具体应用中,汉字的语义相关性可以采用两个汉字对应的词向量的欧式距离。例如,在一个具体应用中,可以将汉字语义相关性的阈值设置为3,如果两个汉字词向量的欧氏距离小于3,则二者具有语义相关性。
在具有前述步骤S105的基础上,步骤S103被细化为:根据难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列。也就是说,如果汉字数据库中的汉字被分为多个汉字字群,可以对各个汉字字群中的汉字分别进行排序。
对应的,步骤S104则细化为:根据各个汉字字群对应的字群排序序列,制定汉字教学规划。
例如,可以根据各个汉字字群中的字群排序,分别从各个汉字字群中提取一部分汉字组成一节课程的内容,而得到各个课程内容的汉字教学规划。
在前述步骤S105的基础上,本申请实施例提供的基于汉字字群制定汉字教学规划的方法,可以使得教师采用分类划分的思想将汉字划分成各个子类别,并在各个子类别基础上选择对应汉字组成教学计划,如此可以使得学生更好地基于分类类别熟悉汉字,提高了识记汉字的效率。
在本申请实施例的一些应用中,采用步骤S105将汉字数据库中的汉字分类到各个汉字字群的情况下,进一步地还可以包括步骤S106:根据汉字字群中包含汉字的难度得分,计算汉字字群的字群难度。
计算汉字字群的字群难度,可以是将汉字字群中所有汉字的难度得分求取平均值,并将平均值作为字群难度得分。
在计算汉字字群的字群难度的基础上,步骤S104进一步地可以细化为:根据各个汉字字群对应的字群难度和字群排列顺序,制定汉字教学规划。
在一个应用中,可以首先根据各个汉字字群的字群难度进行字群排序,制定字群的先后讲解规划;在确定字群的先后讲解规划后,再针对各个字群中的汉字排序,制定更为细致的教学规划。
除了提供前述的汉字教学的规划方法外,本申请实施例还提供一种与前述汉字教学的规划方法具有相同发明构思的汉字教学的规划装置。
图2是本申请实施例提供汉字教学的规划装置的结构示意图。如图2所示,本申请实施例提供的用于汉字教学的规划装置包括预处理单元11、难度计算单元12、排序单元13和规划制定单元14。
预处理单元11用于对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个数值型特征对应的转换数值得分。
本申请实施例中的汉字数据库是一个针对特定学员对象设定的数据库;如果学员是幼儿或者适龄儿童,汉字数据库可以是小学低年级需要掌握的所有汉字;如果学员是没有汉语基础的外国学员,则汉字数据库可以是3500个常用汉字的数据库。
汉字的数值型特征是可以采用数值形式表示的汉字属性特征;汉字的数值型特征可以包括汉字的笔画数、汉字的构字数、部件数、形旁表义透明度、具体度、构词数和使用字频中的至少两种;下文对前述数值型特征的涵义做解释。
汉字的笔画数是组成汉字的基本笔画(例如横、撇、竖、捺、折弯钩、点等)的数量。
汉字的构字数是采用该汉字作为部件(也就是偏旁部首)组成的其他汉字的数量。
汉字的形旁表义透明度是表征汉字的形旁对此形声字意义贡献大小的数值,形旁对整字意义的贡献越大,则此汉字的形旁表义透明度越大。
具体度是汉字语义的具体程度,是表征在看到一个汉字后可联想到的具体事务的程度;具体度越大,汉字更具有实际意义。
构词数是采用此汉字能够组成的词语的个数。
使用字频是实际使用中,某一汉字出现的频率。实际应用中,针对不同的汉字数据库,汉字的使用字频统计对象可以不同;例如,针对学龄儿童的汉字数据库,对应字频可以采用统计诸如小学低年级教材中的汉字得到;针对外国学员的汉字数据库的字频可以通过对现代汉语书面语料统计得到。
本申请实施例中,因为汉字数据库中汉字的数值型特征可能不是同向变化的,例如某些汉字的笔画数较多,而对应的使用字频可能较少,所以需要对数字型特征进行同向化处理。
在一个具体应用中,对汉字的数值型特征做同向化处理具体如下。
1.笔画数可以采用
Figure 108636DEST_PATH_IMAGE026
计算得到对应的转换数值得分。其 中
Figure 15412DEST_PATH_IMAGE027
为某一汉字的笔画数,
Figure 29505DEST_PATH_IMAGE028
为汉字数据库中所有汉字笔画数的平均数,
Figure 548079DEST_PATH_IMAGE029
为汉字数 据库中所有汉字笔画数的方差,
Figure 130370DEST_PATH_IMAGE030
前述某一汉字笔画数对应的转换数值得分(此处可以 称为笔画得分)。
2.构字数可以采用
Figure 649077DEST_PATH_IMAGE031
计算得到对应的转换数值得分。其中
Figure 342226DEST_PATH_IMAGE032
为某一汉字的构字数,
Figure 747931DEST_PATH_IMAGE033
为汉字数据库中所以汉字构字数的平均数,
Figure 501123DEST_PATH_IMAGE009
为汉字数据 库中所有汉字构字数的方差,
Figure 772704DEST_PATH_IMAGE034
为某一汉字构字数对应的转换数值得分(此处可以称为构 字数分)。
3.针对形旁表义透明度,可以采用
Figure 269545DEST_PATH_IMAGE035
计 算得到对应的转换数值得分。其中,
Figure 293870DEST_PATH_IMAGE036
为某一汉字的形旁表义透明度,其可能为null,也 可能为一数值;
Figure 952385DEST_PATH_IMAGE037
为汉字数据库中所有汉字的形旁表义透明度平均值,
Figure 445683DEST_PATH_IMAGE038
为汉字数据库 中所有汉字的形旁表义透明度的方差,
Figure 480635DEST_PATH_IMAGE039
为某一汉字的形旁表义透明度对应的转换数值 得分(此处可以称为形旁表义透明度得分)。
4.具体度可以直接将其原数值作为转换数值得分。
5.构词数可以采用
Figure 126511DEST_PATH_IMAGE040
计算得到对应的转换数值 得分。其中,
Figure 283823DEST_PATH_IMAGE041
为某一汉字的构词数,
Figure 139784DEST_PATH_IMAGE042
为汉字数据库中所有汉字构词数的平均值,
Figure 375766DEST_PATH_IMAGE043
为汉字数据库中所有汉字构词数的方差,
Figure 735203DEST_PATH_IMAGE044
为某一汉字的构词数对应的转换数值 得分(此处可以称为构词数得分)。
6.使用字频可以采用
Figure 125733DEST_PATH_IMAGE045
计算得到对应的转换数字特征。其中,
Figure 468989DEST_PATH_IMAGE046
为某一汉字的使用字频,
Figure 986690DEST_PATH_IMAGE047
为汉字数据库中所有汉字使用字频的平均值,
Figure 466212DEST_PATH_IMAGE048
为汉字 数据库中所有汉字使用字频的方差,
Figure 27644DEST_PATH_IMAGE049
为某一汉字使用字频对应的转换数值得分(此处可 以称为使用字频得分)。
应当注意的是,实际应用中可以采用前述的所有的数值型特征,也可以根据教师的教学思路选择部分数值型特征;在其他一些应用中国,还可以采用其他能够用数值方式表示的其他的数值型特征。
难度计算单元12用于根据各个汉字的转换数值得分,计算得到难度得分。本申请实施例中,根据各个汉字的转换数值得分计算得到难度得分,可以采用加权求和的方式得到难度得分。
具体应用中,难度计算单元12可以首先获取为各个数值型特征设定的权重。各个数值型特征对应的权重系数可以由教师根据教学对象、教学目的确定;例如如果教学对象为儿童,需要更多关注的是笔画数,因此可以为笔画数设定较高的权重,而对其他数值型特征设置较小的权重;再如,如果教学对象而非汉语母语的外国成年学员,可以为使用字频、构词数等设置较高的权重,而为其他数值型特征设置较小的权重。
根据前文叙述中各个转换数值得分的计算方法可知,在本申请实施例中,在对一些数值型特征进行同向化处理的同时,采用标准差而计算标准分数,使得各个数值型特征的转换分数大体在一个区间范围内。如此,教师可以方便地根据自己的需求设定各个转换数值得分对应的权重,不必过多关心各个数值型特征的转换数值得分的大小。。
排序单元13用于根据难度得分对汉字数据库中的汉字排序,得到排序序列。在确定难度得分后,可以按照难度得分的大小顺序对对应的汉字进行排序,而得到排序序列。例如,在一个应用中,可以按照得分从大到小的顺序进行排序。
规划制定单元14用于根据排序序列制定汉字教学规划。在确定了排序顺序后,教师可以根据排序顺序,依次地确定各节课程讲解的汉字。
采用本申请实施例中提供的汉字教学的规划装置,在教师根据教学思路选定汉字的数值型特征后,可以根据选定的数值型特征计算得到汉字数据库中汉字的难度得分,继而可以根据汉字难度得分对汉字进行排序,并基于排序结果制定教学规划;此方法可以使老师根据教学思路快速地制定教学规划,提升教师的备课效率。
在本申请实施例的一个具体应用中,汉字教学的规划装置还可以包括分组单元15,分组单元15用于根据分类依据划分汉字数据库中的汉字,得到汉字字群。
本申请实施例中,分类依据可以是汉字结构、部件或者汉字的语义相关性中的至少一种,以下对前述的分类依据做解释。
汉字结构是偏旁、部首的排列方式;具体可以分为单体结构、单一结构、左右结构、左中右结构、上下结构、上中下结构、上包围结构、下包围结构、左包围结构、左上包围结构、右上包围结构、半包围结构、全包围结构、品字结构、嵌套结构。
汉字的部件是组成汉字的组件,常用的汉字部件可以包括形旁、声旁;形旁是汉字对事物进行归类的表义的偏旁部首,例如“艹”、“钅”、“亻”等;声旁是汉字中表示读音的偏旁部首,例如“踮”中的“店”、“轮”中的“仑”。当然,除了前述的形旁和声旁外,还有其他一些没有表义或表音功能的部件,例如“朝”中的左边部分的“龺”。
汉字的语义相关性是表征汉字涵义之家关系的特征;具体应用中,汉字的语义相关性可以采用计算两个汉字对应的词向量的欧式距离得到。例如,在一个具体应用中,可以将汉字语义相关性的阈值设置为3,如果两个汉字词向量的欧氏距离小于3,则二者具有语义相关性。
在设置分组单元15的情况下,排序单元13可以根据难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列。也就是说,如果汉字数据库中的汉字被分为多个汉字字群,可以对各个汉字字群中的汉字分别进行排序。
对应的,规划制定单元14根据各个汉字字群对应的字群排序序列,制定汉字教学规划。例如,可以根据各个汉字字群中的字群排序,分别从各个汉字字群中提取一部分汉字组成一节课程的内容,而得到各个课程内容的汉字教学规划。
在设置分组单元15的基础上,本申请实施例提供的基于汉字字群制定汉字教学规划的方法,可以使得教师采用分类划分的思想将汉字划分成各个子类别,并在各个子类别基础上选择对应汉字组成教学计划,如此可以使得学生更好地基于分类类别熟悉汉字,提高了识记汉字的效率。
本申请实施例的一些应用中,在设置分组单元15的前提下,难度计算单元12还可以用于根据各个汉字字群中包含汉字的难度得分,计算对应的字群难度。计算汉字字群的字群难度,可以是将汉字字群中所有汉字的难度得分求取平均值,并将平均值作为字群难度得分。
对应的,规划制定单元14根据各个汉字字群对应的字群难度和字群排序序列,制定汉字教学规划。在一个应用中,可以首先根据各个汉字字群的字群难度进行字群排序,制定字群的先后讲解规划;在确定字群的先后讲解规划后,再针对各个字群中的汉字排序,制定更为细致的教学规划。
基于前述的发明构思,本申请还提供一种电子设备。图3是本申请实施例提供的电子设备的结构示意图。如图3所示,电子设备包括至少一个处理器21、至少一个存储器22和至少一个通信接口23。通信接口23,用于与外部设备之间的信息传输。
电子设备中的各个组件通过总线系统24耦合在一起。可理解地,总线系统24用于实现这些组件之间的连接通信。总线系统24除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但为了清楚说明起见,在图3中将各种总线都标为总线系统24。
可以理解,本实施例中的存储器22可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。在一些实施方式中,存储器22存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础任务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用任务。实现本公开实施例提供的汉字教学的规划方法的程序可以包含在应用程序中,例如可以以一种采用浏览器呈现网页的形式实现。
在本公开实施例中,处理器21通过调用存储器22存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器21用于执行本公开实施例提供的汉字教学的规划方法的各个步骤。
本公开实施例提供的汉字教学的规划方法可以应用于处理器21中,或者由处理器21实现。处理器21可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器21中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器21可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本公开实施例提供的汉字教学的规划方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器22,处理器21读取存储器22中的信息,结合其硬件完成方法的步骤。
本公开实施例还提出一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储程序或指令,程序或指令使计算机执行汉字教学的规划方法的步骤各实施例的步骤,为避免重复描述,在此不再赘述。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种汉字教学的规划方法,其特征在于,包括:
对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个所述数值型特征对应的转换数值得分;
根据各个汉字的转换数值得分,计算得到难度得分;
根据所述难度得分对所述汉字数据库中的汉字排序,得到排序序列;
根据所述排序序列制定汉字教学规划。
2.根据权利要求1所述汉字教学的规划方法,其特征在于,
还包括:根据分类依据划分所述汉字数据库中的汉字,得到汉字字群;
根据所述难度得分对所述汉字数据库中的汉字进行排序,得到排序序列,包括:根据所述难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列;
根据所述排序序列制定汉字教学规划,包括:根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划。
3.根据权利要求2所述汉字教学的规划方法,其特征在于,
所述分类依据包括汉字结构、部件或者汉字的语义相关性中的至少一种。
4.根据权利要求2所述汉字教学的规划方法,其特征在于,还包括:
根据所述汉字字群中包含汉字的难度得分,计算各个所述汉字字群的字群难度;
根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划,包括:根据各个汉字字群对应的字群难度和字群排序序列,制定所述汉字教学规划。
5.根据权利要求1-4任一项所述汉字教学的规划方法,其特征在于,所述数值型特征包括笔画数、构字数、部件数、形旁表义透明度、具体度、构词数和使用字频中的至少两个。
6.根据权利要求1-4任一项所述汉字教学的规划方法,其特征在于,
还包括:获取为各个所述数值型特征设定的权重;
根据各个汉字的转换数值得分,计算得到难度得分,包括:根据各个所述数值型特征对应的权重和转换数值得分,采用加权求和方式计算得到所述难度得分。
7.一种汉字教学的规划装置,其特征在于,包括:
预处理单元,用于对汉字数据库中每个汉字的数值型特征进行同向化处理,得到各个所述数值型特征对应的转换数值得分;
难度计算单元,用于根据各个汉字的转换数值得分,计算得到难度得分;
排序单元,用于根据所述难度得分对所述汉字数据库中的汉字排序,得到排序序列;
规划制定单元,用于根据所述排序序列制定汉字教学规划。
8.根据权利要求7所述汉字教学的规划装置,其特征在于,
还包括分组单元,用于根据分类依据划分所述汉字数据库中的汉字,得到汉字字群;
所述排序单元根据所述难度得分,分别对各个汉字字群中的汉字排序,得到对应的字群排序序列;
所述规划制定单元根据各个汉字字群对应的字群排序序列,制定所述汉字教学规划。
9.一种电子设备,其特征在于,包括处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至6任一项所述汉字教学的规划方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至6任一项所述汉字教学的规划方法的步骤。
CN202110502913.3A 2021-05-10 2021-05-10 汉字教学的规划方法和装置 Pending CN112991122A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110502913.3A CN112991122A (zh) 2021-05-10 2021-05-10 汉字教学的规划方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110502913.3A CN112991122A (zh) 2021-05-10 2021-05-10 汉字教学的规划方法和装置

Publications (1)

Publication Number Publication Date
CN112991122A true CN112991122A (zh) 2021-06-18

Family

ID=76337369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110502913.3A Pending CN112991122A (zh) 2021-05-10 2021-05-10 汉字教学的规划方法和装置

Country Status (1)

Country Link
CN (1) CN112991122A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625598A (zh) * 2008-07-08 2010-01-13 谢振斌 一种符合文字理据的汉字编码及键盘输入技术
CN101952790A (zh) * 2008-06-02 2011-01-19 北京友爱五洲教育科技有限公司 适用于中文教学的汉字输入方法
US20200126274A1 (en) * 2013-02-12 2020-04-23 Guangsheng LIN Chinese character information recording method
CN111508289A (zh) * 2020-04-14 2020-08-07 上海句石智能科技有限公司 基于字词使用频率的语言学习系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101952790A (zh) * 2008-06-02 2011-01-19 北京友爱五洲教育科技有限公司 适用于中文教学的汉字输入方法
CN101625598A (zh) * 2008-07-08 2010-01-13 谢振斌 一种符合文字理据的汉字编码及键盘输入技术
US20200126274A1 (en) * 2013-02-12 2020-04-23 Guangsheng LIN Chinese character information recording method
CN111508289A (zh) * 2020-04-14 2020-08-07 上海句石智能科技有限公司 基于字词使用频率的语言学习系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEE KUEN CHIN: "从新加坡学生日常使用汉字字频谈新加坡华文课程与教学规划", 《HAN-CHARACTER AND CLASSICAL WRITTEN LANGUAGE EDUCATION》 *
章夏芬等: "自适应书法字图像匹配和检索", 《浙江大学学报》 *

Similar Documents

Publication Publication Date Title
US10409854B2 (en) Image selection based on text topic and image explanatory value
CN109885688B (zh) 文本分类方法、装置、计算机可读存储介质和电子设备
CN112084299A (zh) 一种基于bert语义表示的阅读理解自动问答方法
CN111242816A (zh) 基于人工智能的多媒体教案制作方法和系统
CN115455181A (zh) 一种提示学习的小样本文本分类方法
CN110597960B (zh) 一种个性化在线课程与职业双向推荐方法及系统
KR102393912B1 (ko) 유사 의미 어간을 이용한 한국어 학습 도구
CN112991122A (zh) 汉字教学的规划方法和装置
CN112632956A (zh) 文本匹配方法、装置、终端和存储介质
CN111915463A (zh) 试题知识点的管理方法
CN109473007B (zh) 一种音素结合声旁的英语自然拼读教学方法及系统
CN111368093A (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
US20170193620A1 (en) Associate a learner and learning content
Bear Two methods of teaching phonics: A longitudinal study
Edtstadler et al. Improved German spelling acquisition through learning analytics
Prasetyo et al. Implementation of K-Means Clustering for Analysis Students English Proficiency
US20230245582A1 (en) Vocabulary size estimation apparatus, vocabulary size estimation method, and program
WO2021260763A1 (ja) 語彙数推定装置、語彙数推定方法、およびプログラム
CN112182210A (zh) 基于作文论据特征分类器的语言生成模型及写作支持方法
CN113742459B (zh) 词汇展示方法、装置、电子设备及存储介质
Bahodirovich Approaches of the formation of grammar skills in methodology
Ban et al. Metrical feature extraction of English picture books
CN110727781B (zh) 一种电力多源知识检索结果融合方法及装置
US20230281388A1 (en) A Method and System for Analyzing a Piece of Text Comprising Chinese Characters
Pérez et al. A corpus-based proposal for the grading of vocabulary teaching materials for the Legal English class

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210618