CN101739849A - 计算机实现的词汇学习方法和装置 - Google Patents

计算机实现的词汇学习方法和装置 Download PDF

Info

Publication number
CN101739849A
CN101739849A CN200910225264A CN200910225264A CN101739849A CN 101739849 A CN101739849 A CN 101739849A CN 200910225264 A CN200910225264 A CN 200910225264A CN 200910225264 A CN200910225264 A CN 200910225264A CN 101739849 A CN101739849 A CN 101739849A
Authority
CN
China
Prior art keywords
word
learner
measurement standard
text
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910225264A
Other languages
English (en)
Inventor
帕特里克·雷内·却恩
菲利普·格勒尼·埃德蒙兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN101739849A publication Critical patent/CN101739849A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B17/00Teaching reading
    • G09B17/003Teaching reading electrically operated apparatus or devices
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

提供一种计算机实现的词汇学习方法。该方法包括在选择呈现给学习者的包括多个单词的文本后,对文本中的至少部分单词中的每一个(a)基于单词的第一测量标准、第二测量标准和第三测量标准对单词赋予状态,其中从多个预定状态中选择赋予的状态,每一状态与至少一个对应的要由学习者采取的推荐动作相关联,第一测量标准基于学习者,第二测量标准独立于文本,且第三测量标准基于文本的其他单词;以及(b)至少如果请求的话,对学习者显现赋予的状态。

Description

计算机实现的词汇学习方法和装置
技术领域
本发明涉及计算机实现的学习方法和装置。
背景技术
习得需要以外语或第二语言有效交流的词汇量,通常需要很多年且对于语言学习者来说是个重大的挑战。
泛读是通过大量阅读合适难度的真实文本来学习例如语法或词汇的语言技巧的方法。
以未知词汇的最小干扰进行阅读,估计语言学习者需要15000-20000的单词词汇(如2001年Cambridge University Press出版的由I.Nation在Learning Vocabulary in Another Language中所描述的)。
学习者专用于习得新词汇的时间是有限的。因此,理想的是尽可能的有效的使用可利用时间。
语言(或学科领域,例如物理)中的单词或短语的使用性(utility)相互不同。通常,高频率单词具有高使用性,而罕见的单词具有低使用性,但是使用性也可基于特定的学科领域和课程。
在本发明中,当使用术语“单词”时,其是指单词,短语,术语,或其他词汇单元。习得(学习)词汇是指人们学习词汇单元以及相关发音,书写形式,概念或其他关系的过程。因而,可参照为语言学习的标准任务或从语言材料(例如物理或地理教科书或视频)进行的更一般的教育任务的学习。
学习者不应该在掌握高使用性单词之前花费时间在学习低使用性单词上。例如,如果学习者缺乏一定基础单词的知识,由于学习者可能在理解出现有更高深的单词的语境中产生问题,所以习得更高深的单词就变得更困难。这样知识上的空白使得很难将新知识与已有知识连接起来,结果产生很高的认知负担且经常感到沮丧。
认知负担是心理学领域的术语,大体上参照为在执行例如语言学习或推论和解决问题的任务时对人类大脑的集合要求。如果认知负担过高,则变得很难甚至不可能全神贯注且执行任务。例如,试图在阅读时记住大量不熟悉的单词的含义可能过分苛求,以至文本变得不可理解。因而有益的是减小不必要的认知负担。
对于学习者来说很难判断一个特定单词具有高或低使用性。而且,一确定单词在当前语言材料中可具有相对高使用性,例如,因为该确定单词在语言材料中是关键单词,因此必须在理解语言材料之前理解该单词。因而,在某种程度上,使用性基于当前语言材料的语境。另外,学习者的当前知识随着学习的结果而持续改变。因此,单词的使用性可相对学习者和其他因素随着时间而变化。
习得词汇的理想系统因而可显示在语言材料的语境和学习者当前知识中的具有高使用性的单词,且以适时方式对学习者推荐可能的学习动作。
传统的,通过老师和课程或者学习者自身来管理习得词汇的过程。自身来管理任务明显是个负担。
当由老师或课程来管理过程时,诊断和校正个体的缺点方面具有受限的范围。学习者会具有知识空白,如果不解决的话,将会损害到将来的进程。
因为频率与使用性相关联,所以等级词汇列表是管理词汇习得的重要信息源。本领域中包括使用通过频率来分等级的词汇列表的系统(GB2352543A,US7108512,US20070269778A1,WO06121542A2,US20060063139A1,US6726486,JP2000047559A2)。一些系统(GB2352543A,US7108512,US20060063139A1,US6726486,JP2000047559A2)不包括阅读部件或任何语言材料,且完全基于闪光呈现卡机能或测验。
上述包括阅读部件和等级词汇列表的系统中,没有任一系统给出关于是否应该现在或留到后面学习特定单词的明确建议。
例如,US20070269778A1显示了学习者在阅读部件中选择的单词的难易程度和罕见程度,然而,并没有给出是否对于给定的个体学习者来说是学习特定单词的合适时间的实际的建议。
WO06121542A2创建了可由其他学习部件使用的优先目标词汇学习列表。WO06121542A2中描述的方法在创建优先目标词汇学习列表的时候没有分析学习者当前的阅读材料。WO06121542A2没有使用目标单词列表来对特定学习者给出关于是否应该学习特定单词的明确显示的推荐。
一些本领域的系统给出了明确的推荐,但是不是以语境关联的方式。
“Follow You!”(跟随你!)系统(Chi-Chiang Shei.FollowYou!Anautomatic language lesson generation system.CALL,14(2),2001)是基于分等级的词汇列表。学习者的知识由指向列表中的等级的指针代表。该系统假定学习者知道具有较高等级的所有单词。当学习者打开“Follow You!”中的文本时,系统选择在文本中出现的且具有比学习者当前知识等级要低的等级的多个单词作为学习单词。在选择学习单词时考虑到文本的唯一性质是该单词是否出现。“Follow You!”在选择学习单词时没有考虑导入文本的语境性质,例如局部频率,或语义域从属关系。在当前教科书材料中没有出现的且比最低实践等级单词的等级高的单词将在之后被假定为已知。该方法导致形成学习者的词汇知识的空白。“Follow You!”在其用户界面中以列表显示学习单词,尽管是以推荐的形式,但是如上所述并未考虑当前文本的语境性质。而且,不能以适时的方式,例如,马上在学习者表示知晓单词之后更新推荐。
REAP系统(Heilman,M.&Eskenazi,M.(2006).Language Learning:Challenges for Intelligent Tutoring Systems.Proceeding of the Workshop ofIntelligent Tutoring Systems for III-Defined Domains.8th InternationalConference on Intelligent Tutoring Systems)基于学习者表和课程表为单个学习者选择合适的阅读材料。课程表是分频率等级的词汇列表。学习者表通过记数学习者多长时间表示知晓特定单词和多长时间受特定单词影响,来留意主动和被动词汇。基于这两个表,REAP检索包含2-4个学习单词(即,学习者还没有掌握的单词)以及一定比例的系统认为学习者已经掌握的单词的短文(J.Brown and M.Eskenazi.(2005).Student,text andcurriculum modeling for reader-specific document retrieval.Proceedings of theIASTED International Conference on Human-Computer Interaction 2005.Phoenix,AZ.)。REAP没有采用使用性的语境关联测量标准;即,没有在检索的文本的基础上选择学习单词;而是预先进行选择。通过对学习者还没有表示充分知晓的给定课程表(分频率等级的词汇列表)中的最高频率和最低频率的单词赋予优先级,REAP从而选择学习单词。当检索文本呈现给学习者时,作为推荐的形式突出显示学习单词。由于只在学习者完成阅读检索文本且执行单词练习后更新该表,所以不能马上改变单词的状态(J.Brown and M.Eskenazi.(2004).Retrieval of authentic documents forreader-specific lexical practice.Proceedings of InSTIL/ICALL Symposium2004.Venice,Italy)。
因此,尽管“FollowYou!”系统和REAP系统考虑到学习者的当前知识状态(在第一次接触文本的时候),但不利用当前文本的语境来确定单词的使用性,也不能给出立即或适时的学习动作推荐来跟上学习者的持续变化的知识状态。
因而需要基于当前语言材料和学习者的当前和变化的知识状态来确定单词的当前使用性的方法。
发明内容
根据本发明的第一方面,提供一种计算机实现的词汇学习方法。该方法包括:在选择呈现给学习者的包括多个单词的文本后,对文本中的至少部分单词中的每一个(a)基于单词的第一测量标准、第二测量标准和第三测量标准对单词赋予状态,其中从多个预定状态中选择赋予的状态,每一状态与至少一个对应的要由学习者采取的推荐动作相关联,第一测量标准基于学习者,第二测量标准独立于文本,且第三测量标准基于文本的其他单词;以及(b)至少如果请求的话,对学习者显现赋予的状态。
步骤(a)可包括:基于第二测量标准和第三测量标准对单词确定语境关联使用性值;并基于语境关联使用性值赋予状态。
该方法可包括也基于第一测量标准确定语境关联使用性值。
该方法可包括对预定数目的具有最高语境关联使用性值的单词赋予“学习”状态,该“学习”状态表示推荐学习动作。
该方法可包括对具有高于预定阈值的语境关联使用性值的单词赋予“学习”状态,该“学习”状态表示推荐学习动作。
该方法可包括对未赋予“学习”状态的单词赋予“忽视”状态,该“忽视”状态表示还没有推荐学习动作。
第二测量标准可独立于学习者。
第二测量标准可以是单词的通用性值的函数。
单词的通用性值可基于单词频率、具体性、单词难度、单词域从属关系、个人学习列表从属关系、心像力、和对学科或课程的重要性中的一个或多个。
第二测量标准可对于非一特定类型(例如名词)的单词均为0,而第二测量标准对于该特定类型的单词为单词的通用性值。
第三测量标准可为文本的语境中单词的使用性值的函数。
可基于文本中单词的频率确定文本的语境中单词的使用性值。
可基于文本中单词与预定范围单词中的总频率相比的相对频率,确定文本的语境中单词的使用性值。该预定范围包括例如该文本语言的范例中的所有单词。可以选择该范例从而包含例如从字典中找到的该语言的大量代表性单词。
第三测量标准可以为文本中单词的局部重要性的函数。
每一单词可与一标签相关,该标签将该单词置于与共同概念相关的一组单词的部分,且第三测量标准为该文本中单词相关标签的频率的函数。
该方法可以以限制赋予“学习”状态的单词的数目和/或密度的方式赋予状态,该“学习”状态表示推荐学习动作。
第一测量标准可以为学习者现有单词知识的函数。
第一测量标准可以提供学习者已经掌握该单词的程度或深度的指示。
第一测量标准可以与学习者已经看过或阅读过该单词的次数相关。
第一测量标准可以有效应用分布(例如高斯分布)到学习者已经掌握该单词的程度或深度,该分布设置为集中学习单词的选择到可能有用单词的较窄范围内。
该方法可以包括从第一测量标准确定表示学习者是否已经掌握该单词的布尔值。
该方法可以包括对于文本中的至少部分单词(该部分单词由第一测量标准确定为置于预定单词种类内),基于第一测量标准而不基于第二或第三测量标准赋予状态。
预定单词种类可包括已看作学习者已学习的单词。
该方法可包括对确定为在预定单词种类内的单词赋予“掌握”状态,“掌握”状态表示不需要学习动作,或建议复习练习。
该方法可包括当以信号通知第一至第三测量标准中的一个或多个已经改变或可能已经改变时,对至少部分单词重新赋予状态。
将文本呈现给学习者可包括在显示器上显示文本,以打印形式提供文本,和/或播放文本的音频说明。
依照本发明的第二方面,提供有一种词汇学习装置。该词汇学习装置包括处理选择为呈现给学习者的文本中的至少部分单词中的每一个的单元,该单元(a)基于单词的第一测量标准、第二测量标准和第三测量标准对单词赋予状态,其中从多个预定状态中选择赋予的状态,每一状态与至少一个对应的要由学习者采取的推荐动作相关联,第一测量标准基于学习者,第二测量标准独立于文本,且第三测量标准基于文本的其他单词;以及(b)至少如果请求的话,对学习者呈现赋予的状态。
依照本发明的第三方面,提供有一种控制执行本发明的第一发明的方法的装置的程序。该程序导入到装置时,使得装置成为依照本发明的第二方面的装置。该程序可承载在承载媒介上。承载媒介可为存储介质。承载媒介可为传送介质。
依照本发明的第四方面,提供一种由本发明的第三方面的程序所编程的装置。
依照本发明的第五方面,提供一种含有本发明的第三方面的程序的存储介质。
本发明的一实施例提供一种学习系统,其可以基于学习系统中的任意变化,立即确定学习者当前所注意的语言材料中的单词的语境特定使用性,从而对学习者指示推荐的学习动作。
应注意的是,本发明中,当使用术语“单词”时,其是指单词,短语,术语或其他词汇单元。
在较佳实施例中,例如包括学习者模型和词汇模型的电子书阅读设备的语言学习设备(如GB0702298A0中揭示的方法和装置)被改进以实现本系统。
本系统组合来自学习者模型,词汇使用性模型和当前语言材料的分析的信息。本系统可以在学习者模型,词汇模型,或当前语言材料发生任何变化时,立即重新确定单词使用性。该变化可由学习者动作或内部系统处理产生。
本系统可基于单词的使用性,对学习者指示关于可能的学习动作的推荐,例如是否应该现在或之后学习特定单词。
本系统因为考虑当前正在学习的语言材料的特定性质和(估计的)学习者当前的知识状态,所以是语境敏感的系统。语言材料的性质包括但不限于局部单词频率,局部单词重要性,和语言材料中单词之间的语义关系。
对于特定学习者的学习者模型对于单词列表中的每一单词,跟踪学习者是否掌握特定单词,并且在每次学习者执行系统中的动作(例如阅读语境中的单词)时,进行更新。
词汇模型将每一单词与对于所有学习者的通用性相关联。
本发明的一实施例具有下述的一个或多个优势。
本系统的优势是减轻了认知负担且使得获知词汇更加有效和有力。
本系统的进一步优势是可以明确指示推荐,即对学习者明确的显示语言材料中的任一或每一单词的状态。
本发明的进一步优势是可以立即反映参考的知识源中的变化。特别的,可以立即考虑学习者模型的变化以适应于学习单词的选择(且一般的任意特定单词的状态)。
本发明的进一步优势是可以解决特定学习者的词汇知识的空白的问题。
本发明的进一步优势是本发明可工作于任意种类的语言材料(口头的或书写的)以及任意主题,例如物理或历史,或实际上包括学习者必须熟悉的词汇的任意领域。
附图说明
图1是较佳实施例的方框图;
图2是单词状态确定处理的流程图;
图3显示了文本阅读界面中显示的示例文本的页面;
图4是示例文本中单词频率的摘录;
图5是示例学习者模型;
图6是词汇模型的摘录;
图7是依照语境关联使用性的未掌握单词的等级的摘录;
图8显示了具有突出显示的学习单词的示例文本的页面;
图9显示了表示学习单词的替代方法;
图10显示了表示单词状态“忽视”的方法;
图11显示了表示单词状态“掌握”的方法;以及
图12显示了依照考虑语义域从属关系的语境关联使用性测量标准的未掌握单词的等级的摘录。
具体实施方式
本发明的较佳实施例提供了在语言学习且尤其是词汇学习的基于阅读的设备上的适时的单词状态确定和通知。
图1是较佳实施例的部件的方框图。
用于语言学习且尤其是词汇学习的设备具有文本阅读界面100。文本阅读界面100显示当前文本130。该设备包括存储特定学习者的词汇知识的学习者模型110。该设备包括将单词与通用性值相关联的词汇模型120。单词状态确定部件140可访问学习者模型110,词汇模型120,当前文本130,以及进一步的可选的信息源150。单词状态确定部件140确定且将单词状态报告给控制文本阅读界面100中的单词状态的表示的单词状态通知部件160。
本领域的普通技术人员应能意识到用于语言学习的设备可包括进一步的部件,且部件可以以图1中未明示的方式互相通信。本领域的普通技术人员应能意识到图1中所示的部件可实现为独立的部件或者其中几个或全部合并成单个部件。
图3显示了之前所参照的文本阅读界面100的示例。
下面将更具体的说明图1所示的部件的功能。
文本阅读界面100显示电子文本且提供各种可能用户动作的用户控制,其包括但不限于在页面之间移动和选择单词。当将文本导入文本阅读界面100时,可以信号触发事件。
学习者模型110存储学习者单词掌握程度的估计。在本领域中公知有学习者模型,且在较佳实施例中可采用任一合适的学习者模型。由于不能直接观察学习者对单词的实际掌握程度,传统的学习者模型基于与系统交互的学习者处获得的证据,估计特定单词的掌握度。在本较佳实施例中,学习者模型保持有特定学习者已经掌握特定单词的概率。可以应用阈值将例如概率的数值转换为布尔值(即True/False(真/假))。例如,大于0.8的概率值可转换为True(即,用户已掌握单词),且其他概率值转换为False。图5示出了由表格所代表的在一定时间点的学习者模型的示例。
学习者模型110可由单词状态确定部件140询问。对于给定的特定单词,学习者模型110将返回学习者的估计单词掌握度。在其内部状态的任何变化之上,可以信号触发事件。例如在学习者阅读当前文本的语境中的单词时,或在学习者通过在词汇测验中给出正确答案来明确表示知晓单词时,学习者模型的状态可改变。
学习者模型110返回的学习者的估计单词掌握度可以看作该单词的第一测量标准,至少可部分使用该测量标准来确定单词的状态(例如,“学习”,“忽视”,“掌握”)。由于受学习者对单词的掌握的影响,所以第一测量标准可基于学习者。
词汇模型120将单词与通用性的数值相关联。该模型可包括对学习有用处的任意单词的列表。在较佳实施例中,该模型只包括开放性单词,例如名词,动词和形容词。然而,该模型可被设计为支持特定语言课程,例如,学习动物和植物的单词的课程,在该情况下,只包括这一类的单词。或者,例如在学习物理学科领域时,该模型可包括与运动,重力等相关的术语。词汇模型120可通过参考分频率等级的词汇列表或按照单词频率、具体性(concreteness)、单词难度、单词域从属关系、个人学习列表从属关系、心像力(imageability,是否可以在脑海中容易的形象化单词的意思)、对学科或课程的重要性、或其他不限于此列表的其他因素的任意组合所分等级的词汇列表,来确定每一单词的通用性值。词汇模型120可从基于学习者的函数(例如感兴趣的领域或学习者参加的课程)的多个词汇模型中选择。
词汇模型120提供的单词的通用性可看作为该单词的第二测量标准,至少可部分使用该测量标准来确定单词的状态(例如,“学习”,“忽视”,“掌握”)。由于第二测量标准与更广泛的语境中而不是与所选的特定文本中的单词的通用性相关,所以第二测量标准可独立于文本。
单词状态确定部件140可以向词汇模型120问询任意单词的通用性值。在词汇模型120的内部状态的任意变化的基础上,可发出信号触发事件。例如如果老师改变模型所基于的课程,则状态会发生改变。图6示出了表格所代表的词汇模型的示例。
单词状态确定部件140可以可选的进一步参考信息源150而考虑例如语义域的因素,来增大通用性值。
通过执行利用学习者模型110,词汇模型120和当前文本130的分析的单词状态确定处理来确定文本130中的单词的状态,单词状态确定部件140确定单词状态。下面详细描述该处理。
用于确定文本130中的单词的状态的上述两个信息源(学习者模型110和词汇模型120)与上面描述的第一和第二测量标准分别相关。第三个信息源(当前文本130的分析)可看作为第三测量标准,至少可部分使用该测量标准来确定单词的状态(例如,“学习”,“忽视”,“掌握”)。因为第三测量标准基于剩余文本的全部或部分的分析,所以第三测量标准可基于文本的其他单词。
在较佳实施例中,单词状态值包括但不限于分别相应于学习者已经掌握,应该积极学习或应该忽视的单词的“掌握”,“学习”,“忽视”。进一步可能的状态值是“假定知晓”,其相应于假定学习者没有通过基于阅读的语言学习设备进行主动学习而已知道的单词。在确定单词状态后,单词状态确定部件140将状态报告给单词状态通知部件160。
单词状态通知部件160提供将文本阅读界面100中显示的单个单词的状态通知给学习者的方式,从而给出明确推荐。在较佳实施例中,具有状态“学习”的单词导致学习者应该现在学习该单词的推荐,并且通过任意视觉方式,例如使用反白显示,黑体字或不同的文本颜色,以突出显示单词进行显示。具有另一状态(“忽视”或“掌握”)的单词导致学习者不应该学习该单词的建议,并不以突出显示的方式显示。图8显示了具有视觉突出显示的文本阅读界面的示例页面。
其他类型的推荐学习动作可以包括复习单词,将单词放入之后学习或复习的列表上,将个人笔记或图画与单词相关联,且搜索关于单词的信息(例如定义或个人笔记)。
其他类型的显示包括跳出显示信息框(见后述变化例),声音(见后述变化例),鼠标指针形状的改变,和在屏幕上的指定区域中显示单词状态。
图2是单词状态确定部件140执行的单词状态确定处理的流程图。
当在步骤200中接收到事件时,触发单词状态确定处理。事件可为文本130导入到文本阅读界面,学习者模型110中发生变化,词汇模型120中发生变化,学习者在文本阅读界面100中选择了单词,或其他状态变化。本领域普通技术人员应意识到事件信号触发只是一种可能的开始处理的方法。其他方法可包括由其他部件或消息传递机制直接调用功能。
第二步骤210获取出现在当前文本130中的单词。
步骤220根据学习者模型110将状态“掌握”赋予学习者已经掌握的当前文本中的所有单词。
步骤225从当前文本130中获取单词信息。当前文本130中的单词频率可指示例如具有多少机会去学习一特定单词。该步骤可执行文本的语言学分析,以分割文本为例如单词的词汇单元(应注意这里的单词是指文本中的单词,短语,术语或其他词汇单元)。该步骤也可执行语言学分析,从而将文本中的单词转换为与词汇模型120和学习者模型110中使用的形式一致的标准化表现,例如词根形式或注音形式。语言学分析可包括词干(stemming),词性标记,命名实体识别,短语鉴定,或不限于此列表所限制的其他处理。最后,在较佳实施例中,通过计算每一独特的单词在文本中出现的次数,来执行频率分析。图4显示了从文本获得的单词频率的示例。可以收集其他类型的单词信息。例如,利用例如互信息或T评分(t-score)的公知统计学方式,可通过比较单词在文本中与其在一般语言中的频率相比的相对频率,计算当前文本中的单词的重要性。
步骤230按剩余单词的语境关联使用性值对剩余单词分等级,语境关联使用性值是作为至少其他两个值(通用性和文本130中的频率)的函数来进行计算。在较佳实施例中,该函数如下定义:
CSU(w)=k×GU(w)×Freq(w)
GU(w)是依照词汇模型120的单词w的通用性值,Freq(w)是步骤210中计算的该单词在文本130中的频率,且k是常数。图7是步骤230生成的等级表的示例。
更一般的,该函数如下定义:
CSU(w)=k×f(w)a×g(w)b×h(w)c
其中,f是学习者模型的函数(上述第一测量标准),g是通用性(通用性值)的函数(上述第二测量标准),h是当前文本分析的函数(上述第三测量标准)。a,b,c是常量加权因子,且k是归一化常量。例如,在一个变化例中,g可以对非名词的所有单词赋予零值,而对名词赋予通用性值。在一个变化例中,f可以返回学习者已掌握单词w的直接估计。在该情况下,语境关联使用性值考虑掌握的程度,而不是简单的布尔值的掌握/未掌握的区别。在另一个变化例中,f函数可以将分布例如高斯分布应用于掌握值。这可以具有将CSU值集中到较小范围的可能有用单词的效果。在另一变化例中,f函数可以包括学习者已经看过(或读过)该单词w的次数。在另一个变化例中,h函数可以返回单词在当前文本中的局部重要性。常量a,b,c和k由试验进行校准。
步骤240将状态“学习”赋予预定数目的等级列表中的最高等级的单词,或者具有比预定阈值高的语境关联使用性值的所有单词。
步骤250将状态“忽视”赋予等级列表中剩余部分单词。
步骤260最后将单词状态赋予状况报告给单词状态通知部件160。
下面通过示例说明单词状态确定处理。图3显示了在文本阅读界面100中显示的较长示例文本130的一页。图7是通过使用图3的示例文本,图5的示例学习者模型和图6的示例词汇模型,由步骤230生成的等级表示例。其中显示了最高的20个等级的单词。
图7显示了“say”是示例文本中具有最高语境关联使用性值的单词。“man”比例如“year”,“time”和“make”具有较低的通用性,但在文本130中出现更频繁,所以具有较高的语境关联使用性。
在较佳实施例中,在系统事件发生时,例如学习者选择文本阅读界面100中的单词时,或作为重新评估学习者已经掌握单词的结果更新学习者模型110时,再次执行单词状态确定处理,且因而可以立即且动态的改变文本阅读界面中的单词状态的显示。
本领域的普通技术人员应理解的是,较佳实施例的最佳方式可以例如只对学习者模型中估计掌握度已发生改变的单词重新计算语境关联使用性值,或者只对学习者在文本阅读界面中选择的单词计算语境关联使用性值。
可以具有较佳实施例的各种变化。
在较佳实施例的一个变化例中,步骤230中的语境关联使用性函数考虑文本130中的语义域从属关系。进一步的知识源(信息源)150对文本130中的每一单词分配语义标签。语义标签的示例包括“情绪”,“食物”,“家”,“金钱”,“体育”,“动作”,“数目”,“材料”,“交流”,“社交生活”,“时间”,“技术”和“身体部分”。然后步骤230中使用的语境关联使用性函数可考虑每一类型语义标签的频率。在本实施例中,上述h函数考虑当前文本130中的语义标签的频率。图12显示了依照语境关联使用性测量标准的未掌握单词的等级表摘录。
在较佳实施例的另一变化例中,在学习者选择文本阅读界面100中的单词时,通过跳出显示信息框的方式显示推荐。图9示出了跳出显示的示例,该示例显示单词“father”具有状态“学习”,且应该马上学习(在该示例中,跳出显示不仅包括建议“学习”,也包括单词的简要解释以提供紧接的学习机会;在其他示例中用户可与学习任务链接或导向一些其他的学习资源)。图10示出了跳出显示的示例,该示例显示单词“superior”具有状态“忽视”且应该在之后学习(这由跳出显示的建议“跳读”所指示)。图11示出了跳出显示的示例,该示例显示单词“be”具有状态“掌握”,且可以现在学习以恢复单词记忆(这由跳出显示的建议“回忆?”所指示)。通常,任意信息或推荐的学习动作可与这样的跳出显示或其他用户界面方式相关联。
在较佳实施例的另一变化例中,步骤220根据学习者模型110将状态“掌握”或状态“假定知晓”赋予当前文本中学习者已掌握的所有单词。状态“掌握”赋予学习者之前利用语言学习设备执行了学习动作的单词。如果学习者之前没有利用语言学习设备对该单词执行学习动作,赋予单词状态“假定知晓”。记录学习者对哪些单词执行了学习动作可以作为学习者模型110或系统其他部件的任务。
在较佳实施例的另一变化例中,学习者可以控制在步骤240中赋予状态“学习”的单词出现密度,而不是使用预定数目的单词。学习者可以通过例如利用滑动控制选择0%至100%之间的百分比来控制密度。
在较佳实施例的另一变化例中,语言材料是音频或视频材料。学习者可以定位材料并中断播放。这与在教科书材料中浏览并在文本阅读界面100中选择单词相似。当在音频或视频材料中选择单词时,依照单词状态确定部件140确定的单词状态推荐学习动作。单词状态通知部件160可以通过插入声音或视觉信号到音频或视频材料中来指示学习单词。
在较佳实施例的另一变化例中,要学习的主题不是语言本身。教科书材料是关于要学习的学科领域(例如物理,地理或历史)的教科书或百科全书条目。教科书材料可以是以学习者的第一语言的形式。词汇模型120相对学科领域对单词赋予通用性值,且可只包含与该学科领域相关的单词。语境关联使用性测量标准可以使用定义了词汇模型120中的单词之间的前提关系的进一步的信息源150。这使得单词状态确定部件140可以只将状态“学习”赋予单词(根据学习者模型110已经掌握了该单词的前提单词)。单词的通用性(上述第二测量标准)可独立于学习者,或者设置为对于相同的单词对于各个用户返回不同的通用性值。
如上所述,对单词确定第一,第二和第三测量标准,并且使用这三个测量标准来确定单词的状态,例如,“学习”,“忽视”或“掌握”。然而,在有些例子中,如果第一测量标准将这些单词置于预定种类的单词之内,则只参照第一测量标准就足够了。例如,如果单词的第一测量标准表示用户已经充分学习该单词,则可赋予单词状态“掌握”,而不需要参考单词的其他测量标准。不需要对被认为已掌握的单词计算第二和第三测量标准,这样可以节省一些处理。
应理解的是可以通过在设备或装置上操作的程序来控制上述部件的一个或多个的操作。这样的操作程序可以存储在计算机可读介质中,或者例如以从因特尔网站提供的可下载数据信号的信号形式实现。所附权利要求可以解释为同样包括操作程序本身,或载体上的记录,或信号,或其他任何形式。

Claims (31)

1.一种计算机实现的词汇学习方法,包括:
在选择呈现给学习者的包括多个单词的文本后,对文本中的至少部分单词中的每一个,
(a)基于单词的第一测量标准、第二测量标准和第三测量标准对单词赋予状态,其中从多个预定状态中选择赋予的状态,每一状态与至少一个对应的要由学习者采取的推荐动作相关联,第一测量标准基于学习者,第二测量标准独立于文本,且第三测量标准基于文本的其他单词;以及
(b)至少如果请求的话,对学习者显现赋予的状态。
2.根据权利要求1所述的方法,其中,
步骤(a)包括:基于第二测量标准和第三测量标准对单词确定语境关联使用性值;并基于语境关联使用性值赋予状态。
3.根据权利要求2所述的方法,包括:
进一步基于第一测量标准确定语境关联使用性值。
4.根据权利要求2所述的方法,包括:
对预定数目的具有最高语境关联使用性值的单词赋予“学习”状态,该“学习”状态表示推荐学习动作。
5.根据权利要求4所述的方法,包括:
对未赋予“学习”状态的单词赋予“忽视”状态,该“忽视”状态表示还没有推荐学习动作。
6.根据权利要求2所述的方法,包括:
对具有高于预定阈值的语境关联使用性值的单词赋予“学习”状态,该“学习”状态表示推荐学习动作。
7.根据权利要求6所述的方法,包括:
对未赋予“学习”状态的单词赋予“忽视”状态,该“忽视”状态表示还没有推荐学习动作。
8.根据权利要求1所述的方法,其中,
第二测量标准独立于学习者。
9.根据权利要求1所述的方法,其中,
第二测量标准是单词的通用性值的函数。
10.根据权利要求9所述的方法,其中,
单词的通用性值基于单词频率、具体性、单词难度、单词域从属关系、个人学习列表从属关系、心像力、和对学科或课程的重要性中的一个或多个。
11.根据权利要求9所述的方法,其中,
第二测量标准对于非一特定类型的单词均为0,而第二测量标准对于该特定类型的单词为单词的通用性值。
12.根据权利要求11所述的方法,其中,
该特定类型为名词。
13.根据权利要求1所述的方法,其中,
第三测量标准为文本的语境中单词的使用性值的函数。
14.根据权利要求13所述的方法,其中,
基于文本中单词的频率确定文本的语境中单词的使用性值。
15.根据权利要求13所述的方法,其中,
基于文本中的单词与预定范围单词中的总频率相比的相对频率,确定文本的语境中单词的使用性值。
16.根据权利要求15所述的方法,其中,
该预定范围包括该文本语言的所有单词,或者至少该文本语言的单词的预定范例。
17.根据权利要求13所述的方法,其中,
第三测量标准为文本中单词的局部重要性的函数。
18.根据权利要求1所述的方法,其中,
每一单词与一标签相关,该标签将该单词置于与共同概念相关的一组单词的部分,且第三测量标准为该文本中单词相关标签的频率的函数。
19.根据权利要求1所述的方法,包括:
以限制赋予“学习”状态的单词的数目和/或密度的方式赋予状态,该“学习”状态表示推荐学习动作。
20.根据权利要求1所述的方法,其中,
第一测量标准为学习者现有单词知识的函数。
21.根据权利要求20所述的方法,其中,
第一测量标准提供学习者已经掌握该单词的程度或深度的指示。
22.根据权利要求20所述的方法,其中,
第一测量标准与学习者已经看过或阅读过该单词的次数相关。
23.根据权利要求20所述的方法,其中,
第一测量标准有效应用分布到学习者已经掌握该单词的程度或深度,该分布设置为集中学习单词的选择到可能有用单词的较窄范围内。
24.根据权利要求23所述的方法,其中,
该分布为高斯分布。
25.根据权利要求20所述的方法,包括:
从第一测量标准确定表示学习者是否已经掌握该单词的布尔值。
26.根据权利要求1所述的方法,包括:
对于文本中的至少部分单词,该部分单词由第一测量标准确定为置于预定单词种类内,基于第一测量标准而不基于第二或第三测量标准赋予状态。
27.根据权利要求26所述的方法,其中,
第一测量标准是学习者现有单词知识的函数,且预定单词种类包括已看作为学习者已学习的单词。
28.根据权利要求27所述的方法,包括:
对确定为在预定单词种类内的单词赋予“掌握”状态,“掌握”状态表示不需要学习动作,或建议复习练习。
29.根据权利要求1所述的方法,包括:
当以信号通知第一至第三测量标准中的一个或多个已经改变或可能已经改变时,对至少部分单词重新赋予状态。
30.根据权利要求1所述的方法,其中,
将文本呈现给学习者包括在显示器上显示文本,以打印形式提供文本,和/或播放文本的音频说明。
31.一种词汇学习装置,包括:
处理选择为呈现给学习者的文本中的至少部分单词中的每一个的单元,该单元(a)基于单词的第一测量标准、第二测量标准和第三测量标准对单词赋予状态,其中从多个预定状态中选择赋予的状态,每一状态与至少一个对应的要由学习者采取的推荐动作相关联,第一测量标准基于学习者,第二测量标准独立于文本,且第三测量标准基于文本的其他单词;以及
(b)至少如果请求的话,对学习者显现赋予的状态。
CN200910225264A 2008-11-21 2009-11-18 计算机实现的词汇学习方法和装置 Pending CN101739849A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0821296A GB2465585A (en) 2008-11-21 2008-11-21 Method and system for vocabulary learning by study word selection
GB0821296.1 2008-11-21

Publications (1)

Publication Number Publication Date
CN101739849A true CN101739849A (zh) 2010-06-16

Family

ID=40230621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910225264A Pending CN101739849A (zh) 2008-11-21 2009-11-18 计算机实现的词汇学习方法和装置

Country Status (3)

Country Link
JP (1) JP5384298B2 (zh)
CN (1) CN101739849A (zh)
GB (1) GB2465585A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897950A (zh) * 2017-01-16 2017-06-27 北京师范大学 一种基于单词认知状态模型适应性学习系统及方法
CN107341984A (zh) * 2016-05-03 2017-11-10 刘国 问题分级排除学习系统
CN109155110A (zh) * 2016-05-19 2019-01-04 小岛章利 信息处理装置以及其控制方法、计算机程序

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021422A (ja) * 2012-07-23 2014-02-03 Univ Kanagawa 語句学習プログラム及び語句学習装置
US20160293045A1 (en) * 2015-03-31 2016-10-06 Fujitsu Limited Vocabulary learning support system
WO2020215128A1 (en) * 2019-04-24 2020-10-29 Aacapella Holdings Pty Ltd Augmentative and Alternative Communication (ACC) Reading System

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3820421B2 (ja) * 1995-10-03 2006-09-13 圭介 高森 学習装置
JP2002366018A (ja) * 2001-06-07 2002-12-20 Rising Inc 外国語学習システム
US7386453B2 (en) * 2001-11-14 2008-06-10 Fuji Xerox, Co., Ltd Dynamically changing the levels of reading assistance and instruction to support the needs of different individuals
US20030130836A1 (en) * 2002-01-07 2003-07-10 Inventec Corporation Evaluation system of vocabulary knowledge level and the method thereof
JP2004163520A (ja) * 2002-11-11 2004-06-10 Als:Kk 外国語単語学習システム
JP2005050156A (ja) * 2003-07-29 2005-02-24 Toshiyuki Tani コンテンツの置換方法及びシステム
JP2006017932A (ja) * 2004-06-30 2006-01-19 Sharp Corp 学習装置、携帯電話機、学習装置の制御方法、学習装置の制御プログラムおよび記録媒体
JP2006208684A (ja) * 2005-01-27 2006-08-10 Casio Comput Co Ltd 情報表示制御装置及びプログラム
JP4908495B2 (ja) * 2005-04-05 2012-04-04 エーアイ リミテッド 意味論的知識の評価と指導と習得とに関するシステムおよび方法
JP2008058687A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 情報表示装置及び情報表示プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341984A (zh) * 2016-05-03 2017-11-10 刘国 问题分级排除学习系统
CN109155110A (zh) * 2016-05-19 2019-01-04 小岛章利 信息处理装置以及其控制方法、计算机程序
CN109155110B (zh) * 2016-05-19 2020-11-06 小岛章利 信息处理装置以及其控制方法、计算机程序
CN106897950A (zh) * 2017-01-16 2017-06-27 北京师范大学 一种基于单词认知状态模型适应性学习系统及方法

Also Published As

Publication number Publication date
JP5384298B2 (ja) 2014-01-08
GB2465585A (en) 2010-05-26
JP2010122676A (ja) 2010-06-03
GB0821296D0 (en) 2008-12-31

Similar Documents

Publication Publication Date Title
Ngo The perception by university students of the use of ChatGPT in education
Stadtler et al. The content–source integration model: A taxonomic description of how readers comprehend conflicting scientific information
Fulcher Scoring performance tests
Kalyuga Informing: A cognitive load perspective
Littlejohn Why are English language teaching materials the way they are?
Ädel Remember that your reader cannot read your mind: Problem/solution-oriented metadiscourse in teacher feedback on student writing
Naumann et al. Time-on-task effects in digital reading are non-linear and moderated by persons' skills and tasks' demands
CN107851398A (zh) 用于自适应评估和训练的系统及方法
Luo et al. Qualitative methods to assess intercultural competence in higher education research: A systematic review with practical implications
Long et al. Linguistic correlates of second language proficiency: Proof of concept with ILR 2–3 in Russian
CN101739849A (zh) 计算机实现的词汇学习方法和装置
Moya et al. Academic integrity and artificial intelligence in higher education contexts: A rapid scoping review protocol
Dobbs et al. Using new vocabulary in writing: Exploring how word and learner characteristics relate to the likelihood that writers use newly taught vocabulary
Mu et al. Conceptualizing and measuring instructional quality in mathematics education: A systematic literature review
CN109859544A (zh) 一种智能学习方法、设备及存储介质
van Driel et al. A coding scheme to clarify teachers' interactive cognitions in noticed classroom management situations from an actor's perspective
Burstein et al. A left turn: Automated feedback & activity generation for student writers
Tenakwah et al. Generative AI and higher education assessments: A competency-based analysis
Mao et al. Written corrective feedback in second language writing: A synthesis of naturalistic classroom studies
Park et al. Interactional Metadiscourse in" English Teaching" Articles: A Diachronic Perspective (1980-2021).
Cer A comparison of mother-tongue curricula of successful countries in PISA and Turkey by higher-order thinking processes
Vögelin et al. Organisational quality of ESL argumentative essays and its influence on pre-service teachers’ judgments
CN110889570A (zh) 一种英语文本难度指数的计算方法
Monserrat et al. Investigating the use of Artificial intelligence (AI) in educational settings: A systematic review
Ingavélez-Guerra et al. RALO: Accessible Learning Objects Assessment Ecosystem based on metadata analysis, inter-rater agreement, and Borda voting schemes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100616