CN101716861A - 汉英词典按首字韵母的第一个字母二次分类法 - Google Patents
汉英词典按首字韵母的第一个字母二次分类法 Download PDFInfo
- Publication number
- CN101716861A CN101716861A CN200910140964A CN200910140964A CN101716861A CN 101716861 A CN101716861 A CN 101716861A CN 200910140964 A CN200910140964 A CN 200910140964A CN 200910140964 A CN200910140964 A CN 200910140964A CN 101716861 A CN101716861 A CN 101716861A
- Authority
- CN
- China
- Prior art keywords
- chinese
- letter
- word
- dictionary
- secondary classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了汉英词典按首字韵母的第一个字母二次分类法,技术领域属于汉英词典的索引方法。现在的汉英词典,一般只按中文词或词组首字拼音的第一个字母(A~Z)进行分类,当词典收录的词汇较多时,查字典时就会出现不易找到所要的词汇。为此,对具有声母的首字,可再按首字韵母的的第一字母(a、e、i、o、u,ü并入u)进行二次分类;同时,若中文词或词组的首字相同,大体按第2个汉字的拼音第一个字母先后顺序排列;另外,当中文词或词组首字的无声母时(如以a、o、e等开头),恰好这类词或词组不多,可不用二次分类,按第2个汉字拼音的第一个字母先后顺序可加快查找。对一般中国人的普通话水平,对单个汉字,其拼音声母的翘舌和非翘舌有时不易分清,但单个汉字声母的首个字母一般不会出错;对于单个汉字的韵母,有时如in、ing、ian等不易分清,但韵母中的首字母一般也不易出错。由于只采用的5个韵母(ü并入u),第2次分类一般为5组,这极大地提高了查找效率,总体上至少能够节省80%的查找时间。
Description
技术领域:属于汉英词典的索引方法。
背景技术:现在的汉英词典,一般只采用按中文词或词组首字拼音的第一个字母(A~Z)进行分类。当词典收录的词汇较多时,查询字典时不易找到所要的词汇,费时且不方便。
发明内容:现在的汉英词典,一般只按中文词或词组首字拼音的第一个字母(A~Z)进行分类,当词典收录的词汇较多时,查字典时就会出现不易找到所要的词汇。经过认真研究,对汉英词典的索引方法,第一步可继续沿用按中文词或词组首字拼音第一个字母(A~Z)进行分类;而对具有声母的首字,可再按首字韵母的的第一字母(a、e、i、o、u,ü并入u)进行二次分类;同时,若中文词或词组的首字相同,大体按第2个汉字的拼音第一个字母先后顺序排列;另外,当中文词或词组首字的无声母时(如以a、o、e等开头),恰好这类词或词组不多,可不用二次分类,按第2个汉字拼音的第一个字母先后顺序可加快查找。对一般中国人的普通话水平,对单个汉字,其拼音声母的翘舌和不翘舌有时不易分清,但单个汉字声母的首个字母一般不会出错;对于单个汉字的韵母,有时如in、ing、ian等不易分清,但韵母中的首字母一般也不易出错。由于只采用的5个韵母(ü并入u),第2次分类一般只有5组,这极大地提高了查找效率,总体上至少能够节省80%的查找时间。
该方法特别适用于一级学科和二级学科的专业汉英词典,对于大型和特大型的汉英词典,则可先按行业分类后,在每一行业词汇内使用该方法。
具体实施方式:
本方法必须利用计算机才能很好地完成。通过既有的2000版以上的Excel软件,就可轻松地完成各项工作,但有些部分需要人工调整,这正是本方法的精髓所在,因为现有的软件还不能完成这些工作。这里以编纂一本汉英词典的正文为例,来说明全过程。
1、当英汉或汉英词典的初稿编纂完成后,将英文和中文对应在输入到Excel表中,各成一列。对英汉词典初稿,若英文单词对应几个中文意项,则拆分为几项;对汉英词典的初稿亦然。注意将中文的引号去掉、中文前面不要有空格;
2、点击中文最上方的列符,选中整列→点击标准工具栏上“数据”中“排序”→在出现的“排序警告”窗口中,点击“扩展选定区域”后选择“排序”,在“排序”窗口中,对“主要关键字”和“次要关键字”和“第三关键字”均选“升序”→在排序“选项”窗口中,“自定义排列次序”区选择“普通”、“方向”区选择“按列排序”;“方法”区选择“字母排序”,最后点击“确定”,出现电脑重新排序后的结果;
3、中文中首字为数字、英文字母的部分,如“1位端、T字钢”等将会排在最前面,这部分按先数字、后A~Z排序,组成1个部分,可剪切出来后形成另一个Excel文件,文件名可命名为“以数字和字母开头”;对于首字拼音以A~Z开头的,也同样剪切出来,形成26个Excel文件,文件名可分别命名为“A”、“B”……“Z”;
4、经过第2步重新排序后,对以中文开头的首字韵母第一个字母,大部分均已按a、e、i、o、u出现的先后顺序排列,同时,若中文词或词组的首字相同,大体按第2个汉字的拼音首字母先后顺序排列;但对词组中首字声母为C、S和Z开头的中文,由于出现了翘舌和非翘舌,首字韵母第一个字母产生了a、e,i,a、e,o、u的交替,这需要人工进行重排,使首字韵母的第一个字母按a、e、i、o、u排列;中文首字以无声母、以韵母a、e、i、o、u开头的,恰好其词汇量一般不大,无需进行第二次分类;以文件“B”为例,分成5个部分,前面加上B(a)、B(e)、B(i)、B(o)、B(u),对其他中文首字为声母的,相应分成5个部分,当某一部分的词汇较少时,可进行合并,如R(a,e);但对首字声母为J和Q时,只有j(i)、j(u),Q(i)、Q(u)部分;
5、对中文词组的首字为多音字时,由于计算机只按其常见的读音进行排序,如“弹、调”等,此时,应将中英文均人工调整到对应文件的相应位置,重新保存;
6、将由第3~5步形成的共(1+26)个Excel文件,将这部分中英文逐个逐个地通过复制到(1+26)Word文档中,在Excel为一行的在Word中仍为一行,但中文在前,英文在后,重新保存。其实,这样分成(1+26)个文件的目的只是为了多人可同时参与,提高效率;
7、将第6步形成的(1+26)个Word文档整合为一个Word文件,将以中文开头的词或词组按首字拼音A~Z进行排列,而以英文开头的如“T字钢”则可放在最后;
8、当一项中文对应两个或两个以上的英文时,进行合并,即一个中文和对应几个英文单词排在一行中,常用的英文排在前面;
9、对整个Word文档分成2栏,进行空格调整后,即可形成一本汉英词典的正文,在目录部分相应地出现如B(a)、B(e)、B(i)、B(o)、B(u)等的具体页码。
为更具体地说明,这里以铁道车辆汉英词典的B部的一部分来说明:
Claims (1)
1.对汉英词典,按中文词或词组首字拼音的第一个字母(A~Z)进行分类后,对具有声母的首字,再按首字韵母的第一字母(a、e、i、o、u,ü并入u)进行二次分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910140964A CN101716861A (zh) | 2009-05-13 | 2009-05-13 | 汉英词典按首字韵母的第一个字母二次分类法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910140964A CN101716861A (zh) | 2009-05-13 | 2009-05-13 | 汉英词典按首字韵母的第一个字母二次分类法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101716861A true CN101716861A (zh) | 2010-06-02 |
Family
ID=42431533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910140964A Pending CN101716861A (zh) | 2009-05-13 | 2009-05-13 | 汉英词典按首字韵母的第一个字母二次分类法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101716861A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110328984A (zh) * | 2019-06-06 | 2019-10-15 | 孙宇鸽 | 一种新型两分笔画码汉语字典或字典页面 |
-
2009
- 2009-05-13 CN CN200910140964A patent/CN101716861A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110328984A (zh) * | 2019-06-06 | 2019-10-15 | 孙宇鸽 | 一种新型两分笔画码汉语字典或字典页面 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1135485C (zh) | 利用计算机系统的日文文本字的识别 | |
CN1143232C (zh) | 正文的自动分割 | |
US20050027534A1 (en) | Phonetic and stroke input methods of Chinese characters and phrases | |
CN101556508A (zh) | 一种输入法中候选词的生成方法、装置、系统及设备 | |
CN101441527B (zh) | 拼音输入中提示正确读音的方法及装置 | |
KR102182672B1 (ko) | 다국어 통합 자음 패턴 검색 방법 및 그 장치 | |
CN102135956A (zh) | 一种基于词位标注的藏文分词方法 | |
Malmqvist | Chinese linguistics | |
Ter Horst et al. | Visual diamorphs: The importance of language neutrality in code-switching from medieval Ireland | |
CN1591414A (zh) | 一种汉语到盲文的自动翻译转换方法 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
CN101882006B (zh) | 零记忆简单子字拆分输入法 | |
WO2005089215B1 (en) | Phonetic and stroke input methods of chinese characters and phrases | |
Alghamdi et al. | KACST Arabic diacritizer | |
CN101716861A (zh) | 汉英词典按首字韵母的第一个字母二次分类法 | |
JP7102710B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
Shah et al. | Analysis and comparative study on phonetic matching techniques | |
CN104571593A (zh) | 全部汉字汉词简易无重码统一输入法 | |
CN1185567C (zh) | 汉字拼音添尾编码输入法 | |
CN101436205A (zh) | 通过释义查询单字的方法与装置 | |
CN103984420B (zh) | 一种基于拼音的藏文智能输入法 | |
CN106484768B (zh) | 文本内容显著性区域的局部特征抽取方法及系统 | |
CN100501648C (zh) | 中文短语笔画以及语音化文字输入的使用者界面和数据库结构 | |
CN1679023A (zh) | 创建和使用中文语言数据和用户自纠正数据的方法和系统 | |
CN103605755A (zh) | 一种谚文数据库、构建方法及谚文数据库检索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100602 |