CN113516879B - 小学生识字量测验方法及装置 - Google Patents

小学生识字量测验方法及装置 Download PDF

Info

Publication number
CN113516879B
CN113516879B CN202010274576.2A CN202010274576A CN113516879B CN 113516879 B CN113516879 B CN 113516879B CN 202010274576 A CN202010274576 A CN 202010274576A CN 113516879 B CN113516879 B CN 113516879B
Authority
CN
China
Prior art keywords
chinese
test
characters
word
students
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010274576.2A
Other languages
English (en)
Other versions
CN113516879A (zh
Inventor
光明明
许金徽
刘嘉堃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yiyi Education Information Consulting Co ltd
Original Assignee
Beijing Yiyi Education Information Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yiyi Education Information Consulting Co ltd filed Critical Beijing Yiyi Education Information Consulting Co ltd
Priority to CN202010274576.2A priority Critical patent/CN113516879B/zh
Publication of CN113516879A publication Critical patent/CN113516879A/zh
Application granted granted Critical
Publication of CN113516879B publication Critical patent/CN113516879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种小学生识字量测验方法及装置,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。

Description

小学生识字量测验方法及装置
技术领域
本发明涉及数据处理技术领域,具体为一种小学生识字量测验方法及装置。
背景技术
识字量,即为识字的数量。识字对于学生个体的发展具有重要作用,识字阅读是学生认识世界的重要途径之一。识字量测验是考查学生识字数量的基本方法,是筛查学生是否具有阅读障碍的重要指标,同时也是分级阅读的基本途径。
现有的识字量测验主要分为两种,一种从基于综合语料库形成的字频表中选取一定数量的字作为测试字库,另一种采用中小语文教材生字表作为测试字库。采用上述两种测试字库测查学生的识字量各有优势,也各有不足:前者能反映一般社会用字情况,较多地考虑了学生在社会情境识字的实际,后者能贴近学生在学习情境中识字的实际,但随着互联网和智能移动终端技术的发展,中小学生接触外部信息的频度、渠道和便利度等与过往相比发生了较大的变化,其识字途径、范围等也随之而变,现有的两种识字量测验都与现今中小学生的语言实际存在不小的偏差,得到的识字量测验结果不准确。
发明内容
本发明提供了一种小学生识字量测验方法及装置,可以解决现有技术中由于目前的识字量测验采用的字表与现今中小学生的语言实际存在不小的偏差,导致得到的识字量测验结果不准确的问题。
为达到上述目的,本发明提供了如下技术方案:
一种小学生识字量测验方法,包括:
从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;
根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
根据所述测验结果,计算学生的识字量。
可选的,所述预设的测试字库的生成过程,包括:
将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
可选的,若测试目标为1-2年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
可选的,若测试目标为3-5年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
可选的,所述根据所述测验结果,计算学生的识字量,包括:
若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
一种小学生识字量测验装置,包括:
抽取单元,用于从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;
测验单元,用于根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
计算单元,用于根据所述测验结果,计算学生的识字量。
可选的,所述小学生识字量测验装置,还包括:
选取单元,用于将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
比对单元,用于将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
聚类单元,用于将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
可选的,若测试目标为1-2年级的学生,所述抽取单元,用于从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
可选的,若测试目标为3-5年级的学生,所述所述抽取单元,用于从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
可选的,所述计算单元,用于若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
若测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
经由上述技术方案可知,本发明公开了一种小学生识字量测验方法及装置,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种小学生识字量测验方法的流程图;
图2为本发明实施例公开的测试字库分组结果及抽样字数表;
图3为本发明实施例公开的一种小学生识字量测验装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由背景技术可知,现有的识字量测验主要分为两种,一种从基于综合语料库形成的字频表中选取一定数量的字作为测试字库,另一种采用中小语文教材生字表作为测试字库。采用上述两种测试字库测查学生的识字量各有优势,也各有不足:前者能反映一般社会用字情况,较多地考虑了学生在社会情境识字的实际,后者能贴近学生在学习情境中识字的实际,但随着互联网和智能移动终端技术的发展,中小学生接触外部信息的频度、渠道和便利度等与过往相比发生了较大的变化,其识字途径、范围等也随之而变,现有的两种识字量测验都与现今中小学生的语言实际存在不小的偏差,得到的识字量测验结果不准确。
有鉴于此,本发明提供了一种小学生识字量测验方法及装置,可以解决现有技术中由于目前的识字量测验采用的字表与现今中小学生的语言实际存在不小的偏差,导致得到的识字量测验结果不准确的问题。
如图1所示,本发明实施例公开了一种小学生识字量测验方法,包括以下步骤:
S101、从预设的测试字库中进行分组随机抽样,抽取测试用字。
其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库。
可选的,所述预设的测试字库的生成过程,包括:
将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表。
需要说明的是,语文课程标准将小学段的识字量目标定为3000字,初中段的目标是3500字。并附了3500字标作为教学参考。我们选择3719字已经超出了初中段的识字量目标。2.从现有的识字量测试公布的学生识字量常模来看,小学毕业生的识字量均未超过3200字。所以,3719字是足够用来测试小学生的识字量的。
进一步需要说明的是,“柒捌玖”因为字频太低,未能进入语委发布的5708字频表中。2.字频数据系指某个字在语料库中出现出现频次、频率两个数值。3.没有字频数据,那么就无法定义该字的难度值。另这三个字一般不会出现在小学语文教材并要求认读,故舍弃这三个字对识字量的测试结果影响可以忽略。
将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值。
具体的,以汉字“电”为例,在人教版教材中出现在2年级上册,在北师版出现在1年级下册,出现在语文S版的1年级上册,对于苏教版出现在1年级上册,那么也就可以得到四个册次值,那么我们可以得到的4个册次值分别为:3,2,1,1。其中,某套教材中,“电”字只会在某一册要求认识。后面不会再作这个要求,默认学生已认识。
需要说明的是,由于每个汉字在不同版本的教材中出现的册次不同,为得到每个汉字所对应的最终较为合理的册次值,我们将汉字在4个版本的教材所对应的册次值按如下规则进行处理:当一个汉字的某个册次值和其他三个册次值的均值相差大于等于3时,该册次值作废,然后取剩余册次值的均值作为该汉字的最终册次值。
将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
需要说明的是,聚类分析的目的在于使同一组中的汉字的同质性最大化,不同组之间的汉字的异质性最大化。其主要依据是聚到同一个组中的汉字应该彼此相似,而属于不同组的汉字应该足够不相似。针对本研究,我们聚类分析的方法会综合每一个汉字的字频以及最终册次值,按二者的相似程度将不同的汉字划分为不同的组,使得同一组中的汉字之间的相似性比其它组中汉字相似性更强,即同一组的汉字难度最为相似,不同组汉字的难度具有明显差异。
具体的,为了使字频和最终册次值处于相似的维度上,因此我们对数据预处理环节所得到的字频以及最终册次值进行对数转换,得到字频对数值=ln(字频)和册次对数值=ln(最终册次值)。
将字频对数值和册次对数值作为数值输入,将用字范围中的汉字通过KMeans聚类的方法聚成8组,使得每组中的字都具有相似的字频和册次值,保证分组抽样的准确性。同时通过计算各组的平均字频排序作为每组的难度等级,并得到最终的测试字库。
可选的,若测试目标为1-2年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
如图2所示,为测试字库分组结果及抽样字数表。
可选的,若测试目标为3-5年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
S102、根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果。
具体的,命题方式借鉴了以往研究中给出字形要求辨别学生字音、字义的方式。题型均为选择填空。每道题的第一空,以要求学生选出测试用字的同音字或拼音的方式考查字音,第二空以要求学生选出可与测试用字组词的字,或选出测试用字的反义词,或选出由该测试用字组成的词语的意思这三种方式考查字义。每道题选项数量5—7个。
例题如下:
“武”的读音和“()”字相同,“武”可以和“()”字组成词。
A.五 B.公 C.术 D.目 E.不知道
需要说明的是,命题时还需采用多种办法,尽可能地降低答题时的干扰因素所带来的测验误差,具体包括以下方式:
a.鉴于低年级学生对拼音可能存在辨认困难,故1—2年级试卷中以辨认字音为考查目的的选项,尽量避免出现拼音。
b.为避免学生在辨认选项中的汉字时发生困难,选项所测试用字的字频顺序均明显低于该题的测试用字。
c.如果测试用字为形声字,为避免可能发生的猜测误差,设置了干扰选项。
d.每道题均设置了“不知道”选项,以降低猜测误差。
S103、根据所述测验结果,计算学生的识字量。
可选的,所述根据所述测验结果,计算学生的识字量,包括:
若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量。
需要说明的是,每一道题有2个空,学生全部答对才视为认识该题的测试用字。如图2所示,1-2年级的测试字库为第1至第6组,共2744字。整体上按98:1的比例抽取出28个测试用字。各组按98:1的比例以四舍五入取整(第2组舍去小数)确定各自的测试用字数量。每个测试用字用一道包含两个空的选择题进行考查。用学生作答某组题目时的正确率乘以该组字数,即为学生在该组汉字中的识字量,最终将学生各组识字数量相加,即为该生的最终识字量。
测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
需要说明的是,每一道题有2个空,学生全部答对才视为认识该题的测试用字。如图2所示,3-6年级的测试字库为3719字,但第1组272字比较简单,默认全部认识,故考查时只用第1至第7组,共3447字。各组按86.17的比例以四舍五入取整(第5组舍去小数)确定各自的测试用字数量。每个测试用字用一道包含两个空的选择题进行考查。用学生作答某组题目时的正确率乘以该组字数,即为学生在某组汉字中的识字量,在各组识字数量之和的基础上再加上第1组的272字,即为该生的最终识字量。
本实施例公开的小学生识字量测验方法,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
基于上述本发明实施例公开的小学生识字量测验方法,图3具体公开了应用该方法的小学生识字量测验装置。
如图3所示,本发明另一实施例公开了一种小学生识字量测验装置,该装置包括:
抽取单元301,用于从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;
测验单元302,用于根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
计算单元303,用于根据所述测验结果,计算学生的识字量。
可选的,所述小学生识字量测验装置,还包括:
选取单元,用于将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
比对单元,用于将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
聚类单元,用于将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
可选的,若测试目标为1-2年级的学生,所述抽取单元301,用于从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
可选的,若测试目标为3-5年级的学生,所述所述抽取单元301,用于从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
可选的,所述计算单元303,用于若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
若测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
以上本发明实施例公开的小学生识字量测验装置中的抽取单元301、测验单元302和计算单元303的具体工作过程,可参见本发明上述实施例公开的小学生识字量测验方法中的对应内容,这里不再进行赘述。
本实施例公开的小学生识字量测验装置,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (4)

1.一种小学生识字量测验方法,其特征在于,包括:
从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;若测试目标为1-2年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字;若测试目标为3-5年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字;
根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;在识字量测试过程中,不设置干扰选项;
根据所述测验结果,计算学生的识字量;
其中,所述预设的测试字库的生成过程,包括:
将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
2.根据权利要求1所述的小学生识字量测验方法,其特征在于,所述根据所述测验结果,计算学生的识字量,包括:
若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
3.一种小学生识字量测验装置,其特征在于,包括:
抽取单元,用于从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表生成的测试字库;若测试目标为1-2年级的学生,所述抽取单元,用于从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字;若测试目标为3-5年级的学生,所述抽取单元,用于从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字;
测验单元,用于根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;在识字量测试过程中,不设置干扰选项;
计算单元,用于根据所述测验结果,计算学生的识字量;
选取单元,用于将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
比对单元,用于将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文S版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
聚类单元,用于将每个汉字的字频的对数值和册次值的对数值作为输入,通过KMeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
4.根据权利要求3所述的小学生识字量测验装置,其特征在于,所述计算单元,用于若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
若测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
CN202010274576.2A 2020-04-09 2020-04-09 小学生识字量测验方法及装置 Active CN113516879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010274576.2A CN113516879B (zh) 2020-04-09 2020-04-09 小学生识字量测验方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010274576.2A CN113516879B (zh) 2020-04-09 2020-04-09 小学生识字量测验方法及装置

Publications (2)

Publication Number Publication Date
CN113516879A CN113516879A (zh) 2021-10-19
CN113516879B true CN113516879B (zh) 2023-03-31

Family

ID=78060314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010274576.2A Active CN113516879B (zh) 2020-04-09 2020-04-09 小学生识字量测验方法及装置

Country Status (1)

Country Link
CN (1) CN113516879B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339300A (ja) * 1999-05-28 2000-12-08 Niisu:Kk 学年別教育漢字の発生方法および装置、並びに学年別教育漢字の発生方法が記憶されている記憶媒体
CN103065626B (zh) * 2012-12-20 2015-03-11 中国科学院声学研究所 英语口语考试系统中的朗读题自动评分方法和设备
CN105513450B (zh) * 2016-02-02 2018-11-13 豆朋教育科技(上海)有限公司 一种语音测评用户识字量的方法与设备
CN105894417A (zh) * 2016-06-12 2016-08-24 深圳市悦好教育科技有限公司 一种基于课标字占比进行小学低年级阅读图书分级的方法
CN110110225B (zh) * 2019-04-17 2020-08-07 重庆第二师范学院 基于用户行为数据分析的在线教育推荐模型及构建方法
CN110516232B (zh) * 2019-07-22 2021-06-22 北京师范大学 一种用于汉语评测的自动命题方法和系统

Also Published As

Publication number Publication date
CN113516879A (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
CN110443427B (zh) 基于认知知识谱的成绩预测方法及其系统
Drouin et al. Alphabet knowledge in preschool: A Rasch model analysis
Mercer What is a racially and culturally nondiscriminatory test? A sociological and pluralistic perspective
KR20050042743A (ko) 테스트시스템 및 그 제어방법
Waldis et al. Material-based and open-ended writing tasks for assessing narrative competence among students
KR102484007B1 (ko) 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템
Reynolds et al. Modeling Taiwanese adolescent learners' English vocabulary acquisition and retention: The washback effect of the College entrance examination center's reference word list
Yang A readability formula for Chinese language
CN111597305A (zh) 实体标记方法、装置、计算机设备和存储介质
CN114897077A (zh) 一种基于机器学习的英语阅读素养评价方法
Loiseau et al. A, B and C decoded: understanding interpreters’ language combinations in terms of language proficiency
CN113516879B (zh) 小学生识字量测验方法及装置
Lee et al. Readability measurement of Japanese texts based on levelled corpora
Chen et al. Cross-cultural validity of the TIMSS-1999 mathematics test: Verification of a cognitive model
KR20020082161A (ko) 독서능력지수를 이용한 독서능력 관리방법 및 시스템
Islam Investigating correlation between reading strategies and reading achievement across learning styles
Kim et al. Learning without awareness by academic and nonacademic samples: An individual differences study
Otsuka et al. The unique contribution of handwriting accuracy to literacy skills in Japanese adolescents
CN112164262A (zh) 一种智能阅卷辅导系统
Jelita SQ4R (survey, question, read, recite, review, and reflect) and students’ reading attitude toward their reading comprehension
JP2021162732A (ja) 課題レコメンドシステム
Peksoy The corpus-based analysis of authenticity of elt course books used in high schools in Turkey
Manda et al. The Effect Of Random Word Games In Improving English Vocabulary Students At Seventh Grade Of SMP Negeri 2 Pancarijang
Kankhar et al. Word level similarity auto-evaluation for an online question answering system
Rahman et al. Perceived Difficulties and Use of Online Reading Strategies: A Study among Undergraduates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant