CN101587662A - 基于词频的单词表排序 - Google Patents

基于词频的单词表排序 Download PDF

Info

Publication number
CN101587662A
CN101587662A CNA2009100008820A CN200910000882A CN101587662A CN 101587662 A CN101587662 A CN 101587662A CN A2009100008820 A CNA2009100008820 A CN A2009100008820A CN 200910000882 A CN200910000882 A CN 200910000882A CN 101587662 A CN101587662 A CN 101587662A
Authority
CN
China
Prior art keywords
word
frequency
vocabulary
word frequency
frequency based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009100008820A
Other languages
English (en)
Inventor
郭传喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2009100008820A priority Critical patent/CN101587662A/zh
Publication of CN101587662A publication Critical patent/CN101587662A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明以单词(词汇)的词频(即单词在某一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行记忆。基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。即是本发明的内容。

Description

基于词频的单词表排序
技术领域
目前,基于字母的文字,如英文,俄文等,其单词(以下也称词汇)表的排序基本方法为顺字母序,也有逆序方法。不同的排序方法在辅助单词记忆,提高单词学习效果方面有不同用处。本发明以单词(词汇)的词频(即单词在某一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行记忆。
背景技术
目前的单词表,主要两个目的,一个是查询,一个是背诵记忆。现有的词汇表(单词表)的字母顺序排序方法,着眼点是单词本身的查询,如《快速突破英语专业八级词汇10000》(ISBN978-7-81111-449-2)。有的词汇表,着眼于单词本身的方便记忆,采用了其它排序方法,如字母逆序法来排序,如《最新GRE词汇逆序速记宝典》(ISBN:9787500070399)。但迄今为止,这些方法,无非是就单词考虑单词,见效慢。进行新的排序方法,是有必要的。
以下所有部分仅以英文单词举例,其它基于字母的文字如俄文法文等皆类同。
发明内容
本发明是为了解决学习词汇的问题。
一定文档中最常见的单词出现的频率近似服从指数分布,比如,1000个最常见的单词,在一篇文档中出现的概率大概是一半,5000个,则是97%左右。也可以用其它分布进行拟合单词出现的频率。总之,单词出现频率不等,是一个显然的事实。本发明的理论基础,只建立在各单词的词频不等上。
词频的统计范围,不限于全部单词,也可以只包含某一指定范围的单词如GRE单词,某专业领域内的单词,最常见的8000个单词,等。词汇也可以只统计原词,而将派生词排除在词频统计外,而采用其它方式排列,比如放在原词的条目下,如将派生词abbreviation放在原词abbreviate下面。
本方法造成的单词表,可以用于记忆单词,但着眼点不仅仅限于单词本身,而是放在整个单词的应用环境中,要考虑到方便阅读,方便写作,方便听力,方便交流等,因此,优先记忆阅读等过程中最常见的单词是必要的。所以,统计词频并按照其为依据进行一定的排序是必要的。
统计词频后,按照词频高低进行排序。比如,frost出现的频率比denim高,于是,单词表中先出现frost,后出现denim。也可以相反的词频顺序。也可以分类进行词频顺序排列,如先按照头1字母进行分类,然后再按词频排序。
基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。即是本发明的内容。
具体实施方式
其实施,首先是统计词频,仅仅这点不是本发明所要求的权利范围。所以,可以采取任何方式,比如,对于电子或软件产品而言,词频不仅可以是静态的,还可以是动态的采集而来,不赘述。
以词频为依据对单词(词汇)表进行排序,是具体实施步骤。也是本发明的权利范围。
最终单词(词汇)表的表现形式,不仅可以采用传统印刷品的方式,也可以采用电子或软件产品的方式。对于电子或软件产品而言,还可以自定义公式,实现个性化的词频排列顺序。

Claims (1)

1、一种单词(词汇)表的排序方法。其特征在于对字母类文字,如英语等,其排序依据(或依据之一)为词频的高低。其词频统计范围不限于全部单词,也可以只包含某一指定范围的单词。
CNA2009100008820A 2009-01-20 2009-01-20 基于词频的单词表排序 Pending CN101587662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2009100008820A CN101587662A (zh) 2009-01-20 2009-01-20 基于词频的单词表排序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2009100008820A CN101587662A (zh) 2009-01-20 2009-01-20 基于词频的单词表排序

Publications (1)

Publication Number Publication Date
CN101587662A true CN101587662A (zh) 2009-11-25

Family

ID=41371895

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2009100008820A Pending CN101587662A (zh) 2009-01-20 2009-01-20 基于词频的单词表排序

Country Status (1)

Country Link
CN (1) CN101587662A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104282193A (zh) * 2013-07-11 2015-01-14 尤菊芳 客制化语言学习辅助卡的方法及选字方法
CN110321404A (zh) * 2019-07-10 2019-10-11 北京麒才教育科技有限公司 词汇学习的词条选取方法、装置、电子设备及存储介质
CN110334215A (zh) * 2019-07-10 2019-10-15 北京麒才教育科技有限公司 词汇学习框架的构建方法、装置、电子设备及存储介质
WO2022039214A1 (ja) * 2020-08-21 2022-02-24 言語研究開発合同会社 言語学習支援装置、プログラム及び情報処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104282193A (zh) * 2013-07-11 2015-01-14 尤菊芳 客制化语言学习辅助卡的方法及选字方法
CN104282193B (zh) * 2013-07-11 2017-03-01 尤菊芳 客制化语言学习辅助卡的方法及选字方法
CN110321404A (zh) * 2019-07-10 2019-10-11 北京麒才教育科技有限公司 词汇学习的词条选取方法、装置、电子设备及存储介质
CN110334215A (zh) * 2019-07-10 2019-10-15 北京麒才教育科技有限公司 词汇学习框架的构建方法、装置、电子设备及存储介质
CN110321404B (zh) * 2019-07-10 2021-08-10 北京麒才教育科技有限公司 词汇学习的词条选取方法、装置、电子设备及存储介质
WO2022039214A1 (ja) * 2020-08-21 2022-02-24 言語研究開発合同会社 言語学習支援装置、プログラム及び情報処理方法

Similar Documents

Publication Publication Date Title
CN101587662A (zh) 基于词频的单词表排序
CN103235789B (zh) 一种汉字转换为拼音及首字母的方法
CN100403239C (zh) 基于英文键盘的藏文输入法
CN101882006B (zh) 零记忆简单子字拆分输入法
CN101739142A (zh) 五笔输入系统及方法
CN101576924A (zh) 一种蒙古文检索方法
CN100458668C (zh) 首音汉字输入法
CN101707020B (zh) 汉字学习系统及其方法
CN101458682A (zh) 一种基于中文汉字和日文汉字的映射方法及其应用
CN102368271A (zh) 一种带有容错能力的中文内容拼写校正系统及方法
CN201383228Y (zh) 一种汉语拼音学习装置
CN100399245C (zh) 中文拼音声调笔划组合输入法
Kiraz Tūrrāṣ mamllā: a grammar of the Syriac language
CN103853479B (zh) 结合手写输入法的双写式汉字音图识别装置及方法
CN101488132A (zh) 基于计算机网络的通过汉字谐音查询词汇的系统及其方法
CN101833377B (zh) 一种新颖的键盘输入拼音短代码
CN101539428A (zh) 导航系统中拼音加声调检索的方法及装置
CN101901062B (zh) 基于音素编码的计算机汉字信息处理方法
CN103544274A (zh) 一种韩语文章汉字显现系统及其方法
CN101667203A (zh) 一种数字化知识挖掘的方法
Lee Jeffrey N. Wasserstrom. Global Shanghai, 1850–2010. Abingdon, Oxon (UK): Routledge, 2009. xvi, 170 pp. ISBN 0-415-21328-8, $39.95
CN101894101A (zh) 拼音标注方法及其系统
CN102402300B (zh) 7键30字母键元及五或六笔画的中文输入法
CN103810279A (zh) 一种混合字段的排序方法及装置
Cerbo II American and Catholic: Stories of the People Who Built the Church

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091125