CN101716861A - 汉英词典按首字韵母的第一个字母二次分类法 - Google Patents

汉英词典按首字韵母的第一个字母二次分类法 Download PDF

Info

Publication number
CN101716861A
CN101716861A CN200910140964A CN200910140964A CN101716861A CN 101716861 A CN101716861 A CN 101716861A CN 200910140964 A CN200910140964 A CN 200910140964A CN 200910140964 A CN200910140964 A CN 200910140964A CN 101716861 A CN101716861 A CN 101716861A
Authority
CN
China
Prior art keywords
chinese
letter
word
dictionary
secondary classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910140964A
Other languages
English (en)
Inventor
倪平涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRRC Qingdao Sifang Co Ltd
Original Assignee
CSR Qingdao Sifang Locomotive and Rolling Stock Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSR Qingdao Sifang Locomotive and Rolling Stock Co Ltd filed Critical CSR Qingdao Sifang Locomotive and Rolling Stock Co Ltd
Priority to CN200910140964A priority Critical patent/CN101716861A/zh
Publication of CN101716861A publication Critical patent/CN101716861A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了汉英词典按首字韵母的第一个字母二次分类法,技术领域属于汉英词典的索引方法。现在的汉英词典,一般只按中文词或词组首字拼音的第一个字母(A~Z)进行分类,当词典收录的词汇较多时,查字典时就会出现不易找到所要的词汇。为此,对具有声母的首字,可再按首字韵母的的第一字母(a、e、i、o、u,ü并入u)进行二次分类;同时,若中文词或词组的首字相同,大体按第2个汉字的拼音第一个字母先后顺序排列;另外,当中文词或词组首字的无声母时(如以a、o、e等开头),恰好这类词或词组不多,可不用二次分类,按第2个汉字拼音的第一个字母先后顺序可加快查找。对一般中国人的普通话水平,对单个汉字,其拼音声母的翘舌和非翘舌有时不易分清,但单个汉字声母的首个字母一般不会出错;对于单个汉字的韵母,有时如in、ing、ian等不易分清,但韵母中的首字母一般也不易出错。由于只采用的5个韵母(ü并入u),第2次分类一般为5组,这极大地提高了查找效率,总体上至少能够节省80%的查找时间。

Description

汉英词典按首字韵母的第一个字母二次分类法
技术领域:属于汉英词典的索引方法。
背景技术:现在的汉英词典,一般只采用按中文词或词组首字拼音的第一个字母(A~Z)进行分类。当词典收录的词汇较多时,查询字典时不易找到所要的词汇,费时且不方便。
发明内容:现在的汉英词典,一般只按中文词或词组首字拼音的第一个字母(A~Z)进行分类,当词典收录的词汇较多时,查字典时就会出现不易找到所要的词汇。经过认真研究,对汉英词典的索引方法,第一步可继续沿用按中文词或词组首字拼音第一个字母(A~Z)进行分类;而对具有声母的首字,可再按首字韵母的的第一字母(a、e、i、o、u,ü并入u)进行二次分类;同时,若中文词或词组的首字相同,大体按第2个汉字的拼音第一个字母先后顺序排列;另外,当中文词或词组首字的无声母时(如以a、o、e等开头),恰好这类词或词组不多,可不用二次分类,按第2个汉字拼音的第一个字母先后顺序可加快查找。对一般中国人的普通话水平,对单个汉字,其拼音声母的翘舌和不翘舌有时不易分清,但单个汉字声母的首个字母一般不会出错;对于单个汉字的韵母,有时如in、ing、ian等不易分清,但韵母中的首字母一般也不易出错。由于只采用的5个韵母(ü并入u),第2次分类一般只有5组,这极大地提高了查找效率,总体上至少能够节省80%的查找时间。
该方法特别适用于一级学科和二级学科的专业汉英词典,对于大型和特大型的汉英词典,则可先按行业分类后,在每一行业词汇内使用该方法。
具体实施方式:
本方法必须利用计算机才能很好地完成。通过既有的2000版以上的Excel软件,就可轻松地完成各项工作,但有些部分需要人工调整,这正是本方法的精髓所在,因为现有的软件还不能完成这些工作。这里以编纂一本汉英词典的正文为例,来说明全过程。
1、当英汉或汉英词典的初稿编纂完成后,将英文和中文对应在输入到Excel表中,各成一列。对英汉词典初稿,若英文单词对应几个中文意项,则拆分为几项;对汉英词典的初稿亦然。注意将中文的引号去掉、中文前面不要有空格;
2、点击中文最上方的列符,选中整列→点击标准工具栏上“数据”中“排序”→在出现的“排序警告”窗口中,点击“扩展选定区域”后选择“排序”,在“排序”窗口中,对“主要关键字”和“次要关键字”和“第三关键字”均选“升序”→在排序“选项”窗口中,“自定义排列次序”区选择“普通”、“方向”区选择“按列排序”;“方法”区选择“字母排序”,最后点击“确定”,出现电脑重新排序后的结果;
3、中文中首字为数字、英文字母的部分,如“1位端、T字钢”等将会排在最前面,这部分按先数字、后A~Z排序,组成1个部分,可剪切出来后形成另一个Excel文件,文件名可命名为“以数字和字母开头”;对于首字拼音以A~Z开头的,也同样剪切出来,形成26个Excel文件,文件名可分别命名为“A”、“B”……“Z”;
4、经过第2步重新排序后,对以中文开头的首字韵母第一个字母,大部分均已按a、e、i、o、u出现的先后顺序排列,同时,若中文词或词组的首字相同,大体按第2个汉字的拼音首字母先后顺序排列;但对词组中首字声母为C、S和Z开头的中文,由于出现了翘舌和非翘舌,首字韵母第一个字母产生了a、e,i,a、e,o、u的交替,这需要人工进行重排,使首字韵母的第一个字母按a、e、i、o、u排列;中文首字以无声母、以韵母a、e、i、o、u开头的,恰好其词汇量一般不大,无需进行第二次分类;以文件“B”为例,分成5个部分,前面加上B(a)、B(e)、B(i)、B(o)、B(u),对其他中文首字为声母的,相应分成5个部分,当某一部分的词汇较少时,可进行合并,如R(a,e);但对首字声母为J和Q时,只有j(i)、j(u),Q(i)、Q(u)部分;
5、对中文词组的首字为多音字时,由于计算机只按其常见的读音进行排序,如“弹、调”等,此时,应将中英文均人工调整到对应文件的相应位置,重新保存;
6、将由第3~5步形成的共(1+26)个Excel文件,将这部分中英文逐个逐个地通过复制到(1+26)Word文档中,在Excel为一行的在Word中仍为一行,但中文在前,英文在后,重新保存。其实,这样分成(1+26)个文件的目的只是为了多人可同时参与,提高效率;
7、将第6步形成的(1+26)个Word文档整合为一个Word文件,将以中文开头的词或词组按首字拼音A~Z进行排列,而以英文开头的如“T字钢”则可放在最后;
8、当一项中文对应两个或两个以上的英文时,进行合并,即一个中文和对应几个英文单词排在一行中,常用的英文排在前面;
9、对整个Word文档分成2栏,进行空格调整后,即可形成一本汉英词典的正文,在目录部分相应地出现如B(a)、B(e)、B(i)、B(o)、B(u)等的具体页码。
为更具体地说明,这里以铁道车辆汉英词典的B部的一部分来说明:
Figure G2009101409645D0000021
Figure G2009101409645D0000041

Claims (1)

1.对汉英词典,按中文词或词组首字拼音的第一个字母(A~Z)进行分类后,对具有声母的首字,再按首字韵母的第一字母(a、e、i、o、u,ü并入u)进行二次分类。
CN200910140964A 2009-05-13 2009-05-13 汉英词典按首字韵母的第一个字母二次分类法 Pending CN101716861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910140964A CN101716861A (zh) 2009-05-13 2009-05-13 汉英词典按首字韵母的第一个字母二次分类法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910140964A CN101716861A (zh) 2009-05-13 2009-05-13 汉英词典按首字韵母的第一个字母二次分类法

Publications (1)

Publication Number Publication Date
CN101716861A true CN101716861A (zh) 2010-06-02

Family

ID=42431533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910140964A Pending CN101716861A (zh) 2009-05-13 2009-05-13 汉英词典按首字韵母的第一个字母二次分类法

Country Status (1)

Country Link
CN (1) CN101716861A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110328984A (zh) * 2019-06-06 2019-10-15 孙宇鸽 一种新型两分笔画码汉语字典或字典页面

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110328984A (zh) * 2019-06-06 2019-10-15 孙宇鸽 一种新型两分笔画码汉语字典或字典页面

Similar Documents

Publication Publication Date Title
CN1135485C (zh) 利用计算机系统的日文文本字的识别
CN1143232C (zh) 正文的自动分割
US20050027534A1 (en) Phonetic and stroke input methods of Chinese characters and phrases
CN101556508A (zh) 一种输入法中候选词的生成方法、装置、系统及设备
CN101441527B (zh) 拼音输入中提示正确读音的方法及装置
KR102182672B1 (ko) 다국어 통합 자음 패턴 검색 방법 및 그 장치
CN102135956A (zh) 一种基于词位标注的藏文分词方法
Malmqvist Chinese linguistics
Ter Horst et al. Visual diamorphs: The importance of language neutrality in code-switching from medieval Ireland
CN1591414A (zh) 一种汉语到盲文的自动翻译转换方法
CN100403239C (zh) 基于英文键盘的藏文输入法
CN101882006B (zh) 零记忆简单子字拆分输入法
WO2005089215B1 (en) Phonetic and stroke input methods of chinese characters and phrases
Alghamdi et al. KACST Arabic diacritizer
CN101716861A (zh) 汉英词典按首字韵母的第一个字母二次分类法
JP7102710B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
Shah et al. Analysis and comparative study on phonetic matching techniques
CN104571593A (zh) 全部汉字汉词简易无重码统一输入法
CN1185567C (zh) 汉字拼音添尾编码输入法
CN101436205A (zh) 通过释义查询单字的方法与装置
CN103984420B (zh) 一种基于拼音的藏文智能输入法
CN106484768B (zh) 文本内容显著性区域的局部特征抽取方法及系统
CN100501648C (zh) 中文短语笔画以及语音化文字输入的使用者界面和数据库结构
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN103605755A (zh) 一种谚文数据库、构建方法及谚文数据库检索系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100602