CN101587662A - 基于词频的单词表排序 - Google Patents
基于词频的单词表排序 Download PDFInfo
- Publication number
- CN101587662A CN101587662A CNA2009100008820A CN200910000882A CN101587662A CN 101587662 A CN101587662 A CN 101587662A CN A2009100008820 A CNA2009100008820 A CN A2009100008820A CN 200910000882 A CN200910000882 A CN 200910000882A CN 101587662 A CN101587662 A CN 101587662A
- Authority
- CN
- China
- Prior art keywords
- word
- frequency
- vocabulary
- word frequency
- frequency based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明以单词(词汇)的词频(即单词在某一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行记忆。基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。即是本发明的内容。
Description
技术领域
目前,基于字母的文字,如英文,俄文等,其单词(以下也称词汇)表的排序基本方法为顺字母序,也有逆序方法。不同的排序方法在辅助单词记忆,提高单词学习效果方面有不同用处。本发明以单词(词汇)的词频(即单词在某一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行记忆。
背景技术
目前的单词表,主要两个目的,一个是查询,一个是背诵记忆。现有的词汇表(单词表)的字母顺序排序方法,着眼点是单词本身的查询,如《快速突破英语专业八级词汇10000》(ISBN978-7-81111-449-2)。有的词汇表,着眼于单词本身的方便记忆,采用了其它排序方法,如字母逆序法来排序,如《最新GRE词汇逆序速记宝典》(ISBN:9787500070399)。但迄今为止,这些方法,无非是就单词考虑单词,见效慢。进行新的排序方法,是有必要的。
以下所有部分仅以英文单词举例,其它基于字母的文字如俄文法文等皆类同。
发明内容
本发明是为了解决学习词汇的问题。
一定文档中最常见的单词出现的频率近似服从指数分布,比如,1000个最常见的单词,在一篇文档中出现的概率大概是一半,5000个,则是97%左右。也可以用其它分布进行拟合单词出现的频率。总之,单词出现频率不等,是一个显然的事实。本发明的理论基础,只建立在各单词的词频不等上。
词频的统计范围,不限于全部单词,也可以只包含某一指定范围的单词如GRE单词,某专业领域内的单词,最常见的8000个单词,等。词汇也可以只统计原词,而将派生词排除在词频统计外,而采用其它方式排列,比如放在原词的条目下,如将派生词abbreviation放在原词abbreviate下面。
本方法造成的单词表,可以用于记忆单词,但着眼点不仅仅限于单词本身,而是放在整个单词的应用环境中,要考虑到方便阅读,方便写作,方便听力,方便交流等,因此,优先记忆阅读等过程中最常见的单词是必要的。所以,统计词频并按照其为依据进行一定的排序是必要的。
统计词频后,按照词频高低进行排序。比如,frost出现的频率比denim高,于是,单词表中先出现frost,后出现denim。也可以相反的词频顺序。也可以分类进行词频顺序排列,如先按照头1字母进行分类,然后再按词频排序。
基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。即是本发明的内容。
具体实施方式
其实施,首先是统计词频,仅仅这点不是本发明所要求的权利范围。所以,可以采取任何方式,比如,对于电子或软件产品而言,词频不仅可以是静态的,还可以是动态的采集而来,不赘述。
以词频为依据对单词(词汇)表进行排序,是具体实施步骤。也是本发明的权利范围。
最终单词(词汇)表的表现形式,不仅可以采用传统印刷品的方式,也可以采用电子或软件产品的方式。对于电子或软件产品而言,还可以自定义公式,实现个性化的词频排列顺序。
Claims (1)
1、一种单词(词汇)表的排序方法。其特征在于对字母类文字,如英语等,其排序依据(或依据之一)为词频的高低。其词频统计范围不限于全部单词,也可以只包含某一指定范围的单词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009100008820A CN101587662A (zh) | 2009-01-20 | 2009-01-20 | 基于词频的单词表排序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009100008820A CN101587662A (zh) | 2009-01-20 | 2009-01-20 | 基于词频的单词表排序 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101587662A true CN101587662A (zh) | 2009-11-25 |
Family
ID=41371895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2009100008820A Pending CN101587662A (zh) | 2009-01-20 | 2009-01-20 | 基于词频的单词表排序 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101587662A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104282193A (zh) * | 2013-07-11 | 2015-01-14 | 尤菊芳 | 客制化语言学习辅助卡的方法及选字方法 |
CN110321404A (zh) * | 2019-07-10 | 2019-10-11 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
CN110334215A (zh) * | 2019-07-10 | 2019-10-15 | 北京麒才教育科技有限公司 | 词汇学习框架的构建方法、装置、电子设备及存储介质 |
WO2022039214A1 (ja) * | 2020-08-21 | 2022-02-24 | 言語研究開発合同会社 | 言語学習支援装置、プログラム及び情報処理方法 |
-
2009
- 2009-01-20 CN CNA2009100008820A patent/CN101587662A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104282193A (zh) * | 2013-07-11 | 2015-01-14 | 尤菊芳 | 客制化语言学习辅助卡的方法及选字方法 |
CN104282193B (zh) * | 2013-07-11 | 2017-03-01 | 尤菊芳 | 客制化语言学习辅助卡的方法及选字方法 |
CN110321404A (zh) * | 2019-07-10 | 2019-10-11 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
CN110334215A (zh) * | 2019-07-10 | 2019-10-15 | 北京麒才教育科技有限公司 | 词汇学习框架的构建方法、装置、电子设备及存储介质 |
CN110321404B (zh) * | 2019-07-10 | 2021-08-10 | 北京麒才教育科技有限公司 | 词汇学习的词条选取方法、装置、电子设备及存储介质 |
WO2022039214A1 (ja) * | 2020-08-21 | 2022-02-24 | 言語研究開発合同会社 | 言語学習支援装置、プログラム及び情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101587662A (zh) | 基于词频的单词表排序 | |
CN103235789B (zh) | 一种汉字转换为拼音及首字母的方法 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
CN101882006B (zh) | 零记忆简单子字拆分输入法 | |
CN101739142A (zh) | 五笔输入系统及方法 | |
CN101576924A (zh) | 一种蒙古文检索方法 | |
CN100458668C (zh) | 首音汉字输入法 | |
CN101707020B (zh) | 汉字学习系统及其方法 | |
CN101458682A (zh) | 一种基于中文汉字和日文汉字的映射方法及其应用 | |
CN102368271A (zh) | 一种带有容错能力的中文内容拼写校正系统及方法 | |
CN201383228Y (zh) | 一种汉语拼音学习装置 | |
CN100399245C (zh) | 中文拼音声调笔划组合输入法 | |
Kiraz | Tūrrāṣ mamllā: a grammar of the Syriac language | |
CN103853479B (zh) | 结合手写输入法的双写式汉字音图识别装置及方法 | |
CN101488132A (zh) | 基于计算机网络的通过汉字谐音查询词汇的系统及其方法 | |
CN101833377B (zh) | 一种新颖的键盘输入拼音短代码 | |
CN101539428A (zh) | 导航系统中拼音加声调检索的方法及装置 | |
CN101901062B (zh) | 基于音素编码的计算机汉字信息处理方法 | |
CN103544274A (zh) | 一种韩语文章汉字显现系统及其方法 | |
CN101667203A (zh) | 一种数字化知识挖掘的方法 | |
Lee | Jeffrey N. Wasserstrom. Global Shanghai, 1850–2010. Abingdon, Oxon (UK): Routledge, 2009. xvi, 170 pp. ISBN 0-415-21328-8, $39.95 | |
CN101894101A (zh) | 拼音标注方法及其系统 | |
CN102402300B (zh) | 7键30字母键元及五或六笔画的中文输入法 | |
CN103810279A (zh) | 一种混合字段的排序方法及装置 | |
Cerbo II | American and Catholic: Stories of the People Who Built the Church |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20091125 |