CN113569556A - 基于罗斯模型的儿童阅读测试文本难度的分级方法 - Google Patents

基于罗斯模型的儿童阅读测试文本难度的分级方法 Download PDF

Info

Publication number
CN113569556A
CN113569556A CN202110856241.6A CN202110856241A CN113569556A CN 113569556 A CN113569556 A CN 113569556A CN 202110856241 A CN202110856241 A CN 202110856241A CN 113569556 A CN113569556 A CN 113569556A
Authority
CN
China
Prior art keywords
text
reading
difficulty
value
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110856241.6A
Other languages
English (en)
Other versions
CN113569556B (zh
Inventor
罗德红
龚婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaihua University
Original Assignee
Huaihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaihua University filed Critical Huaihua University
Priority to CN202110856241.6A priority Critical patent/CN113569556B/zh
Publication of CN113569556A publication Critical patent/CN113569556A/zh
Application granted granted Critical
Publication of CN113569556B publication Critical patent/CN113569556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了基于罗斯模型的儿童阅读测试文本难度的分级方法,包括如下步骤:在文本中找到阅读理解问题的答案所涉及的文本片段;计算这些文本片段的语言变量,作为自变量;将阅读理解得分转化为Logit值,再转化为200‑1500区间的文本难度值,作为因变量;采用皮尔逊积差相关系数筛选出与因变量相关系数高的自变量;采用最小二乘法确定预测因变量的最佳语言变量,导出最佳匹配函数。本发明采用罗斯模型及其分值转换方法用200‑1500任一数字对文本进行难度级别分析,拟合优度高,符合汉语的语言特点。学生阅读文本和完成文本对应的3‑4道阅读理解题目,即可以测算出阅读文本的难度级别,计算简单快速,具有良好的适用性和推广性。

Description

基于罗斯模型的儿童阅读测试文本难度的分级方法
技术领域
本发明涉及教育技术领域,特别涉及基于罗斯模型的儿童阅读测试文本难度的分级方法。
背景技术
阅读是积极理解书面材料和获取意义的思维活动,是非物质的内隐过程,判断阅读理解能力水平应找到具有客观性质的指代物。这种指代物就是阅读文本中的语言变量。在英语国家,对文本难度进行划分的经典技术是构建可读性公式,技术成熟,其具体的方法是对学生进行阅读理解测试,将阅读理解得分作为因变量,将阅读理解测试文本中的语言变量作为自变量,采用皮尔逊积差相关系数和最小二乘法计算和筛选拟合优度最佳的语言变量,阅读测试文本难度是最佳语言变量的函数。
一般来讲,分级公式中的文本难度的数字得分用1-12表示,指代的是适合年级水平的文本难度;1996年诞生了以200-1500区间任一数字指代文本难度的技术。然而,对应年级水平的文本难度的数字指代技术忽略了同一年级不同儿童阅读理解能力差异,正如10岁儿童所穿鞋子的尺码不同一样;而以 200-1500区间任一数字指代文本难度的技术忽略了个体的选择性注意机制。当前普遍的观点是,人类的行为由目的或者任务所驱动,倾向于忽视与任务无关的刺激。在进行阅读理解测试时,我们遇到的语言特征如果是与回答阅读理解问题高度相关的,必定会对其进行认知加工,由此这些语言特征成为影响我们得分的显著性因素。然而,如果这些语言特征出现在与阅读理解问题无关的文本中时,我们倾向于跳过这些语言特征,它们就极有可能不会对我们的理解产生显著性影响。换言之,学生的阅读理解得分受到阅读理解问题的影响,即相同的文本,不同的题目,学生的得分可能完全不同,但是国内外分级阅读研究者并没有计算阅读理解问题是如何影响阅读理解得分的,这种忽略很可能使得阅读理解得分难以真实的反映阅读文本的难度。
发明内容
本发明的目的在于提供基于罗斯模型的儿童阅读测试文本难度的分级方法,将采用数学中的罗斯模型用200-1500区间任一数字指代阅读文本的难度,解决同一年级儿童之间不同水平阅读理解能力的指代问题,解决阅读理解问题影响儿童对文本语言变量的难度感知,从而影响文本难度的问题,从而解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
基于罗斯模型的儿童阅读测试文本难度的分级方法,包括如下步骤:
步骤1:在文本中找到阅读理解问题的答案所涉及的文本片段;
步骤2:计算这些文本片段的语言变量,作为自变量;
步骤3:借助罗斯模型软件将阅读理解得分转化为Logit值,再转化为 200-1500区间的文本难度值,作为因变量;
步骤4:采用皮尔逊积差相关系数筛选出与因变量相关系数高的自变量;
步骤5:采用最小二乘法确定预测因变量的最佳语言变量,导出最佳匹配函数,该函数就是分级公式;
进一步地,所述步骤2中的自变量有6类,该6类自变量分别为字、词、句、段落、篇章和词语联结;所述自变量的计算方法为:采用汉语词频工具计算词的重复次数,采用Chinese Text Analyzer软件和《现代汉语语料库词频表》计算熟词,采用文本可读性指标自动化分析系统分别计算词语联结和笔画数。
进一步地,所述步骤3的因变量采用200-1500文本难度值,所述文本难度值的获得方式如下:首先批阅被试的试卷,获得每道阅读理解问题所有被试的原始分,将所述原始分导入罗斯模型,获得所述原始分的logit值,再根据转化公式将所述logit值转化为200-1500文本难度值;所述罗斯模型软件的原理是Loge(Pni1/(1-Pni1))=Bn-Di,计算被试对待特定项目的反应概率,即答题成功的可能性;答题成功的可能性越高,文本难度级别越低;答题成功的可能性越低,文本难度级别越高,答题成功的可能性间接反映了阅读文本的难度。
进一步地,所述步骤4皮尔逊积差相关系数的计算公式如下:
Figure BDA0003184066830000031
进一步地,所述步骤5导出最佳匹配函数的具体方法是:
将步骤4所得的皮尔逊积差相关系数由高到低进行排序,筛选出排序在前5位的自变量,将筛选出的自变量和步骤3所述因变量输入Statistical Product and ServiceSolutions软件中进行最小二乘法多元线性回归分析,根据输出的多重判定系数R2检验拟合优度,输出最佳匹配函数是:
Yk=β01χ12χ23χ3
上式中,Yk为因变量,即以200-1500表述的文本难度级别;
X1,X2,X3:为预测阅读理解能力和文本难度的最佳自变量;
β123:为偏回归系数;
ε:随机误差。
与现有技术相比,本发明的有益效果是:
(1)在文本中找到阅读理解问题所对应的答案部分,确定承载这些答案的源文本中的最佳语言预测变量的备选类型。
(2)组织学生参加阅读理解测试,获取他们的阅读理解得分,该得分代表了他们的阅读理解能力,也代表了阅读理解文本的难度。
(3)采用罗斯模型对阅读理解得分重新赋值;通过解析文档的最佳语言变量,结合学生阅读理解得分,运用罗斯模型、分值转换公式和最小二乘法,有效对儿童汉语阅读文本进行分级,用200-1500区间之间的数值进行级别表示。
该方法顾及到了个体的选择性注意机制,解决了阅读理解问题影响儿童对文本语言变量的难度感知,从而影响文本难度的问题;该方法解决了传统分级公式用1-12(小学一年级到高中三年级)指代各年级学生所适合阅读的文本难度级别,从而解决了同一年级儿童之间不同水平阅读理解能力的指代问题。该技术投入使用后,学生阅读文本及其完成若干道阅读理解问题,通过其所阅读文本中语言变量的计算和答题得分就可以对文本难度进行分级。突破了现有研究只能对文本进行年级分级的现状,实现了对同一年级被试的阅读理解能力的分级。
本发明方法从信息加工心理学理论的视角,采用对阅读理解问题的答案源文本中语言变量进行分析的方法,采用罗斯模型及其分值转换方法用 200-1500数字进行文本难度级别分析,拟合优度高,符合汉语的语言特点。学生阅读文本和完成文本对应的3-4道阅读理解题目,即可以测算出阅读文本的难度级别,计算简单快速,具有良好的适用性和推广性。
附图说明
图1为本发明基于罗斯模型的儿童阅读测试文本难度的分级方法的技术框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
基于罗斯模型的儿童阅读测试文本难度的分级方法,包括如下步骤:
步骤1:在文本中找到阅读理解问题的答案所涉及的文本片段
阅读理解问题的类型为反映被试阅读理解心理的全部过程,包括感觉、知觉、记忆、思维和想象。
步骤2:计算这些文本片段的语言变量,作为自变量。
自变量有6类,该6类自变量分别为字、词、句、段落、篇章和词语联结;所述自变量的计算方法为:采用汉语词频工具计算词的重复次数,采用 Chinese Text Analyzer软件和《现代汉语语料库词频表》计算熟词,采用文本可读性指标自动化分析系统分别计算词语联结和笔画数。
步骤3:借助罗斯模型软件将阅读理解得分进行转换,视作文本难度的指代,作为因变量。
因变量采用200-1500文本难度分值。所述文本难度分值的数学原理和获得方法如下:
数学原理是罗斯模型,是Loge(Pni1/(1-Pni1))=Bn-Di,计算被试对待特定项目的反应概率,即答题成功的可能性,答题成功的可能性越高,文本难度级别越低;答题成功的可能性越低,文本难度级别越高,答题成功的可能性间接反映了阅读文本的难度。
所述罗斯模型原理中,Bn(ability)则代表编号为n的被试的能力水平, Di(difficult)代表阅读理解题目i的难度,能力Bn的被试n在难度Di的项目i上,计分为1的可能性为Pni1(possibility),计分为0的可能性为1-Pni1。等式两边的单位均为Logit,满足+5~-5之间,将被试能力与项目难度相比较。如果被试水平(Bn)与项目难度(Di)相等(Bn=Di),正确反应项目(正确解答阅读理解问题)的概率则为50%;如果被试能力显著大于项目难度(Bn>Di),正确反应的概率接近100%;相反,若个体能力小于项目难度(Bn<Di),正确反应(正确解答阅读理解问题)的概率接近0。模型中的B(被试的阅读理解能力)和D(题目的难度)是单独的参数,一组参数的估计不受另一组参数的影响。这种数学性质使得测量具有“测试独立性”和“考生独立性”的特性。这一特性意味着,表征阅读理解题目的参数不依赖于儿童阅读理解能力分布,表征儿童阅读理解能力的参数不依赖于阅读理解测试中的题目。
将阅读理解原始分数转化为200-1500的方法如下:
首先,批阅被试的试卷,获得每道阅读理解问题所有被试的原始分数,其次,所述原始分数导入罗斯模型软件,获得Logit值;
转化logit值为200-1500分值的方法是:
首先,选定难度差别被经验普遍公认的两个文本作为测量参照点,处于高难度的文本(Dh)和低难度的文本(Dl)。拟令高难度文本为《红与黑》,低难度文本为《卖火柴的小姑娘》。
其次,测算两个文本难度,假设Dh=+2.26,Dl=-3.3.
第三,确定单位大小,令单位为“孔子”,单位大小为1/1000。
第四,令Dl=200孔子,Dh=1500孔子。
第五,构想转换方程式,将理论难度转换为孔子分值。
(-3.3+3.3)+200=200孔子 (1)
[(2.26+3.3)*constant]+200=1200孔子 (2)
[(logit+3.3)*180]+200=文本难度分值 (3)
180是Dh的理论难度转换为1200孔子的结果。最后,由文本可读性公式所测试出的理论难度转换为孔子分值的转换公式如(3)。
步骤4:采用皮尔逊积差相关系数筛选出与因变量相关系数高的自变量。
皮尔逊积差相关系数的计算公式如下:
Figure BDA0003184066830000061
式中:
p=皮尔逊积差相关系数
m:阅读理解问题的数量
Yi:第i个阅读理解问题的文本难度分值;
Figure BDA0003184066830000071
m个阅读理解问题的文本难度分值的均值;
Xi:第i个阅读理解问题所对应的自变量;
Figure BDA0003184066830000072
m个自变量的均值。
步骤5:采用最小二乘法确定预测因变量的最佳语言变量,导出最佳匹配函数。
导出最佳匹配函数的具体方法是:
将步骤4所得的皮尔逊积差相关系数由高到低进行排序,筛选出排序在前 5位的自变量,将筛选出的自变量和步骤3所述因变量输入Statistical Product and ServiceSolutions软件中进行最小二乘法多元线性回归分析,根据输出的多重判定系数R2检验拟合优度,输出最佳匹配函数是:
Yk=β01χ12χ23χ3
上式中,Yk:为因变量,即以200-1500表述的文本难度级别;
X1,X2,X3:为预测阅读理解能力和文本难度的最佳自变量。
β123:为偏回归系数;
ε:随机误差;
上述最佳匹配函数就是分级公式。
图1所示是儿童汉语阅读文本难度分级的技术框架。实施方式的技术输入是在文本中找到阅读理解答案所对应的文本片段,即源文本,以及对这些文档中所包含的六大类170个语言变量进行计算,输出是目标文本的阅读级别。
1)确定被试:确定被试为初二年级的学生。根据《教育部义务教育语文课程标准》,该年级段的学生要求累计认识常用汉字3500个,累计覆盖《现代常用字表》的99.48%,具备了较好的测试基础;
2)对被试的语文课本题材进行整理:鉴于学生的阅读题材是影响阅读理解能力的因素,例如应用类题材普遍比文学类题材难度更大,根据语文课本中的题材分布挑选阅读理解测试的文本有利于反映学生阅读理解的真实水平,所以分析了人教版八年级和九年级语文课本中的题材;
3)根据整理的题材选取阅读测试材料:采用中小学生使用的标准化阅读 测试文本和阅读理解问题。
4)结合读者阅读认知心理过程确定阅读问题:阅读是对文本信息进行心理加工和处理的过程,先确定了信息加工心理学的视角,根据学生从低到高的思维过程(感觉、知觉、记忆、思维和想象)确定了三类阅读理解问题,即进入与提取、综合与阐释、反思与评价,全面考查被试的阅读理解能力,实现对阅读理解能力的分级。
5)基于阅读理解问题,整理文本自变量:
在阅读理解测试中,对被试构成难度的语言变量是那些影响他们解答阅读理解问题的部分。将文本中针对每道阅读理解问题之答案的文本片段进行确定,它们是分析文本语言自变量的源文本。
具体的6类语言变量如下:
篇章:源文本篇章中的段落数量;总字数和总词数;不重复的字数和不重复的词数。
段落:源文本段落中的段落数量,段落中的句子数量、重复和不重复词与字的数量。
句子:源文本句子中的复合句、简单句和子句的句子数量以及各自所占总数的百分比,三类句子中的重复和不重复词与字的数量。
非比对字频和词频(自有字频和自有词频):重复1-10次的自有字频和自有词频及其所占百分比。
比对的词频(熟词):比对的对象是《现代汉语常用词表》;首先分为词表词(N=14629)和非词表词;词表词又分为容易词(N=300)和难词 (N=11629);容易词中分为高频词(N=1000)、中频词(N=1001-2000)、低频词(N=2001-3000)。
词语联结:源文本中的词性,句法结构。
将源文本中的上述变量导入汉语语料库在线网站上的词频工具计算词的重复次数,导入Chinese Text Analyzer软件和《现代汉语语料库词频表》计算熟词,文本可读性指标自动化分析系统2.3计算词语联结和笔画数。
6)对被试进行阅读理解能力的测试:对被试进行标准化测试后,统一批阅试卷,保证评分者的信度和效度。将被试的阅读理解得分指代阅读理解能力,作为因变量。
7)对试卷进行信度、效度检验:试卷的整体信度0.9,结构效度超过0.8,符合要求,且达到较高的水准。
8)整理文本因变量:
因变量采用200-1500文本难度分值。将阅读理解原始分数转化为 200-1500文本难度分值的方法如下:
首先,批阅被试的试卷,获得每道阅读理解问题所有被试的原始分数,其次,将所述原始分数导入罗斯模型软件,获得Logit值;最后,转化logit 值为200-1500分值的公式是:
[(logit+3.3)*180]+200=文本难度分值
9)筛选自变量:
计算步骤5)计算的自变量和步骤8)处理的因变量之间的皮尔逊积差相关系数。
皮尔逊积差相关系数的计算公式是:
Figure BDA0003184066830000091
式中:
p=皮尔逊积差相关系数
Yi:第i个阅读理解问题的文本难度分值,
Figure BDA0003184066830000101
的均值,i=1···m;
Xi:第i个阅读理解问题所对应的自变量,
Figure BDA0003184066830000102
Xi的均值,i=1···m;
m=阅读理解问题的数量。
分别确定6类自变量中与因变量具有显著性相关关系,即P<0.05的自变量,按皮尔逊积差相关系数从高到低排序,从每个类型中筛选出相关系数值位列前5的自变量。
10)拟合最佳函数
将因变量和上述步骤9)筛选出的自变量输入Statistical Product and ServiceSolutions(SPSS)软件中,进行最小二乘法多元线性回归分析,根据输出的多重判定系数R2检验拟合优度:满足拟合优度R2接近1;满足方差膨胀因子VIF<10;满足回归系数的显著度P<0.05。确定输出最佳匹配函数是
Yk=β01χ12χ23χ3+ε ⑥
式中,Yk=为因变量,即以200-1500表述的文本难度级别,是自变量和因变量的数量关系结果。
X1,X2,X3为预测阅读理解能力和文本难度的最佳自变量。
β123为偏回归系数。
ε=随机误差。Yk
公式⑥就是分级公式,Yk是文本的难度分数。高阅读理解能力分数意味着文本难度级别低,低阅读理解能力意味着文本难度级别高。该公式的多重判定系数R2=0.94,拟合优度高,表明自变量可以解释阅读理解能力和文本难度的94%的变异。
本发明方法从信息加工心理学理论的视角,采用对阅读理解问题的答案源文本中语言变量进行分析的方法,采用罗斯模型及其分值转换方法用 200-1500数值对文本进行难度级别分析,拟合优度高,符合汉语的语言特点。学生阅读文本和完成文本对应的3-4道阅读理解题目,即可以测算出阅读文本的难度级别,复合相关系数0.97,拟合优度94%,计算简单快速,具有良好的适用性和推广性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.基于罗斯模型的儿童阅读测试文本难度的分级方法,其特征在于,包括如下步骤:
步骤1:在文本中找到阅读理解问题的答案所涉及的文本片段;
步骤2:计算这些文本片段的语言变量,作为自变量;
步骤3:借助罗斯模型软件将阅读理解得分转化为Logit值,再转化为200-1500区间的文本难度值,作为因变量;
步骤4:采用皮尔逊积差相关系数筛选出与因变量相关系数高的自变量;
步骤5:采用最小二乘法确定预测因变量的最佳语言变量,导出最佳匹配函数。
2.如权利要求1所述的基于罗斯模型的儿童阅读测试文本难度的分级方法,其特征在于,所述步骤2中的自变量有6类,该6类自变量分别为字、词、句、段落、篇章和词语联结;所述自变量的计算方法为:采用汉语词频工具计算词的重复次数,采用Chinese TextAnalyzer软件和《现代汉语语料库词频表》计算熟词,采用文本可读性指标自动化分析系统分别计算词语联结和笔画数。
3.如权利要求1所述的基于罗斯模型的儿童阅读测试文本难度的分级方法,其特征在于,所述步骤3的因变量采用200-1500文本难度值,所述文本难度值的获得方式如下:首先批阅被试的试卷,获得每道阅读理解问题所有被试的原始分,将所述原始分导入罗斯模型,获得所述原始分的logit值,再根据转化公式将所述logit值转化为200-1500文本难度值;所述罗斯模型软件的原理是Loge(Pni1/(1-Pni1))=Bn-Di,计算被试对待特定项目的反应概率,即答题成功的可能性;答题成功的可能性越高,文本难度级别越低;答题成功的可能性越低,文本难度级别越高,答题成功的可能性间接反映了阅读文本的难度。
4.如权利要求1所述的基于罗斯模型的儿童阅读测试文本难度的分级方法,其特征在于,所述步骤4皮尔逊积差相关系数的计算公式如下:
Figure FDA0003184066820000021
5.如权利要求1所述的基于罗斯模型的儿童阅读测试文本难度的分级方法,其特征在于,所述步骤5导出最佳匹配函数的具体方法是:
将步骤4所得的皮尔逊积差相关系数由高到低进行排序,筛选出排序在前5位的自变量,将筛选出的自变量和步骤3所述因变量输入Statistical Product and ServiceSolutions软件中进行最小二乘法多元线性回归分析,根据输出的多重判定系数R2检验拟合优度,输出最佳匹配函数是:
Yk=β01χ12χ23χ3
上式中,Yk:为因变量,即以200-1500表述的文本难度级别;
X1,X2,X3:为预测阅读理解能力和文本难度的最佳自变量;
β123:为偏回归系数;
ε:随机误差。
CN202110856241.6A 2021-07-28 2021-07-28 基于罗斯模型的儿童阅读测试文本难度的分级方法 Active CN113569556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110856241.6A CN113569556B (zh) 2021-07-28 2021-07-28 基于罗斯模型的儿童阅读测试文本难度的分级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110856241.6A CN113569556B (zh) 2021-07-28 2021-07-28 基于罗斯模型的儿童阅读测试文本难度的分级方法

Publications (2)

Publication Number Publication Date
CN113569556A true CN113569556A (zh) 2021-10-29
CN113569556B CN113569556B (zh) 2024-04-02

Family

ID=78168321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110856241.6A Active CN113569556B (zh) 2021-07-28 2021-07-28 基于罗斯模型的儿童阅读测试文本难度的分级方法

Country Status (1)

Country Link
CN (1) CN113569556B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113934850A (zh) * 2021-11-02 2022-01-14 北京语言大学 融合文本分布律特征的中文文本可读性评价方法及系统
CN117453896A (zh) * 2023-12-22 2024-01-26 江西拓世智能科技股份有限公司 针对儿童的陪伴ai数字人的管控方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100824322B1 (ko) * 2007-04-11 2008-04-22 아주대학교산학협력단 독서 능력 평가 시스템
CN106951406A (zh) * 2017-03-13 2017-07-14 广西大学 一种基于文本语言变量的汉语阅读能力的分级方法
CN107506346A (zh) * 2017-07-10 2017-12-22 北京享阅教育科技有限公司 一种基于机器学习的中文阅读难度分级方法及系统
CN109933668A (zh) * 2019-03-19 2019-06-25 北京师范大学 简体汉语文本可读性的分级评估建模方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100824322B1 (ko) * 2007-04-11 2008-04-22 아주대학교산학협력단 독서 능력 평가 시스템
CN106951406A (zh) * 2017-03-13 2017-07-14 广西大学 一种基于文本语言变量的汉语阅读能力的分级方法
CN107506346A (zh) * 2017-07-10 2017-12-22 北京享阅教育科技有限公司 一种基于机器学习的中文阅读难度分级方法及系统
CN109933668A (zh) * 2019-03-19 2019-06-25 北京师范大学 简体汉语文本可读性的分级评估建模方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗德红、龚婧: "Rasch模型在试卷质量分析中的应用——基于五六年级学生阅读素养前测试卷的质量分析", 教育测量与评价, no. 1, pages 18 - 22 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113934850A (zh) * 2021-11-02 2022-01-14 北京语言大学 融合文本分布律特征的中文文本可读性评价方法及系统
CN113934850B (zh) * 2021-11-02 2022-06-17 北京语言大学 融合文本分布律特征的中文文本可读性评价方法及系统
CN117453896A (zh) * 2023-12-22 2024-01-26 江西拓世智能科技股份有限公司 针对儿童的陪伴ai数字人的管控方法、装置及存储介质

Also Published As

Publication number Publication date
CN113569556B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
Guo et al. Predicting human judgments of essay quality in both integrated and independent second language writing samples: A comparison study
CN109785698B (zh) 用于口语水平评测的方法、装置、电子设备以及介质
CN106951406B (zh) 一种基于文本语言变量的汉语阅读能力的分级方法
Bondi Small corpora and language variation
Vajjala et al. Automatic CEFR level prediction for Estonian learner text
Xie Error analysis and diagnosis of ESL linguistic accuracy: Construct specification and empirical validation
Crossley Advancing research in second language writing through computational tools and machine learning techniques: A research agenda
CN113569556A (zh) 基于罗斯模型的儿童阅读测试文本难度的分级方法
CN112667776B (zh) 一种智能教学评估与分析方法
Byrnes et al. Social Psychological Correlates of Teachers' Language Attitudes 1
Schnur et al. Lexical complexity, writing proficiency and task effects in Spanish Dual Language Immersion
Solovyev et al. Sentiment in academic texts
Andersen et al. Benefits of Alternative Evaluation Methods for Automated Essay Scoring.
Riemenschneider et al. Linguistic complexity in teachers' assessment of German essays in high stakes testing
Arviyolla et al. The correlation between morphological awareness and vocabulary mastery of the fifth semester students of English department of FKIP Universitas Riau
Lee et al. Quantitative Analysis of JFL Learners' Writing Abilities and the Development of a Computational System to Estimate Writing Proficiency
Xue et al. Human ratings of writing quality capture features of syntactic variety and transformation in Chinese EFL learners’ argumentative writing
Wu et al. Examining the comparability of parallel English and Chinese elicited imitation tasks
Alahmed et al. The use of reporting verbs in l2 writing by Iraqi postgraduate students at Tikrit university
Imaki et al. Experimenting with a Japanese automated essay scoring system in the L2 Japanese environment
Chin et al. The data management of the language of trauma narrative communication
Le et al. Critical Reading Course: Problems and Reflections from Vietnamese English-Majored Students' Perspectives
Hafner et al. The Role of Errors in Validating a Large-Scale Assessment of Adolescent English Writing in Austria
Chen et al. The cause-effect relation of latent variables in scientific multi-text reading comprehension: Testing the sequential mediation model
Benhima et al. Critical Discourse Analysis of the World Bank’s Report on Teacher Status in Morocco

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Luo Dehong

Inventor after: Gong Jing

Inventor after: Long Zhou

Inventor after: Wu Shouwei

Inventor before: Luo Dehong

Inventor before: Gong Jing

GR01 Patent grant
GR01 Patent grant