CN1095578C - 一种多功能汉语电脑词典 - Google Patents
一种多功能汉语电脑词典 Download PDFInfo
- Publication number
- CN1095578C CN1095578C CN 99115128 CN99115128A CN1095578C CN 1095578 C CN1095578 C CN 1095578C CN 99115128 CN99115128 CN 99115128 CN 99115128 A CN99115128 A CN 99115128A CN 1095578 C CN1095578 C CN 1095578C
- Authority
- CN
- China
- Prior art keywords
- character
- information
- chinese
- dictionary
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是一种多功能汉语电脑词典。在电脑磁盘文件的单字条目信息库中存入词典单字条目具有的多种信息,如:汉字、部件、笔画、拼音、字义、频度,和在电脑磁盘多字条目信息库中存入词典多字条目具有的多种信息,如:汉字词语、拼音、字数、词性、释义、举例、类义词、词语语义分类路径,只要按规定,输入其中的任意一个查询信息,就能获得自己所需的与查询信息相关的信息。能使辞书解决相应问题的优点得到发扬、缺点得到克服,并使索解信息的范围与获得目的信息的范围都比辞书有扩大,比用辞书解决汉语语言文字规范化问题明显优越。
Description
本发明涉及计算机中文信息处理技术领域,特别是一种多功能汉语电脑词典。
计算机汉字输入技术的研究成功,使汉字打字与排版印刷工作发生了换代变化,从《中文信息》杂志的有关报导知,为了提高电脑用户的输字效率,多年来许多研究者都把注意力放到了编码方法的改进与寻找新的汉字输入方法(如语音输入与汉字识别等方法)上。随着计算机应用的普及,已有越来越多的人直接用电脑写文章,许多人写文章都离不开字词典,用电脑写文章,无电脑词典自然会给用户带来不便。因此,在电脑用户不断增加的情况下,研究提高用户输字效率的工作,已不应该单单局限在寻找好的汉字输入方法上了。
人们看书报写文章时,经常出现要查字词典解决的问题:如知道某字的写法,不知读音或确切释义;知道某字的拼音,不知道写法和确切释义;知道某字的偏旁部首或一部分不含偏旁部首的笔画集合,不知整字写法和释义;知道某词语的某个或某几个汉字的写法和大体意思,不知道整个词语的写法和确切释义……。这些问题涉及汉字和汉字词语的主要信息提供。辞书在信息提供上固有的缺点,使得人们很难通过一本辞书找到能使这些问题都得到圆满解决的办法。为使这些问题得到解决,语言文字学家除编纂了我们常见常用的,以词目首字为序的“正序词典”外,还编纂了词目尾字为序的“逆序词典”、以单字条目的汉字位于辞书所收相关词语中的任意一个位置的“辞通”、《常用构词字典》等辞书;在单字条目的排列上,有按音序排列、按部首排列和按编码排列(如四角号码辞典)等辞书;还有按某种属性进行归类的“同音词典”、“同义词典”、“反义词典”、“成语词典”、“诗韵词典”、“同根词典”、“简明汉语义类词典”、“现代汉语分类词典”等辞书。这些辞书的编纂出版,既给人们解决读写文章遇到的许多问题带来方便,也给人们解决与语言文字规范化有关的一些问题带来方便。但是除了比较大点的图书馆外,一般个人和小点的图书馆是不可能买齐上述辞书的。实际上,即使买齐了上述辞书,用辞书查检解决语言文字规范化问题遇到的汉字与汉字词语信息,也还存在着使用不方便,获取信息速度慢及一些重要信息没法获得解决办法的不足。
汉字处理系统功能的不断完善给人们直接用电脑写文章提供了越来越多、越来越好和越来越方便的条件。但是没有好的汉字输入法与没有功能较全和便于检索的电脑词典,用电脑写文章的人们就不能把用电脑写文章的速度和质量提高。
本发明的目的是提供一种含有汉字和汉字词语的多种信息的电脑词典,能给人们读、写文章查看生字生词的有关信息带来方便,给语言文字工作者解决某些语言文字规范化问题的工作带来方便的多功能汉语电脑词典。
本发明是这样实现的:在电脑磁盘文件的单字条目信息库中存入词典单字条目具有的多种信息,如:汉字、部件、笔画、拼音、释义、反义词、词语语义分类路径、频度,和在电脑词典磁盘文件的多字条目信息库中存入词典多字条目具有的多种信息,如:汉字词语、拼音、字数、词性、释义、举例、反义词、词语语义分类路径,只要按规定,输入其中的任意一个查询信息,就能通过电脑词典中的程序与指令获得自己所需的与查询信息相关的信息。
部件术语取自1992年山东教育出版社出版,高更生、谭德姿、王立廷主编《现代汉语知识大词典》。由此词典对部件所给释义知,部件术语原本用于汉字形码输入法,释义中没有对汉字如何拆为部件的问题进行规定。电脑词典的“单字条目信息库里,第i条记录中的部件,是用拆分不拆交,限定每字最多只拆4个部件和一般不拆孤立部件的汉字拆分基本规定拆第i条记录中的汉字所得全部表形部件按部件首笔依国家语委对相应汉字所作笔顺规范的规定排列而得”的汉字拆分办法,是我研究用每一汉字的全部表形部件给GB2312-80字符集中的汉字编码时,根据汉字结构特点与组成汉字的笔画与笔画间有相分、相连、相交三种基本关系,本着便于掌握应用的原则提出的。用计算机研究这种编码时,编码部件库是天然的汉字部件构字信息库,能顺利解决让计算机快速准确提供用书本字词典没法解决的汉字部件构字信息的提供问题。因为研究编码输入法和研究汉字与汉字词语信息提供问题的电脑词典同属中文信息技术领域,且二者还有内在联系,所以在本电脑词典的相关问题讨论中引用了部件术语。
国家语委对相应汉字所作笔顺规范的规定,指国家语言文字工作委员会、中华人民共和国新闻出版署1997年4月7日联合发布的《现代汉语通用字笔顺规范》与国家语言文字工作委员会1999年10月1日发布的《GB13000.1字符集汉字笔顺规范》对各相应汉字所作笔顺规范的规定。
汉字部件按部件首笔依国家语委对相应汉字所作笔顺规范的规定排列,指对能拆两个或两个以上部件的汉字,其部件排列的顺序是按各部件首笔在被拆汉字的笔顺规范中的先后进行排列。如:进、语、韶三字的部件排列情况依次为:井辶、讠五口、立日刀口;而:匣、可、式、或、圆五字的部件排列情况依次为:匚甲、丁口、弋工、戈口一、囗口贝。
“汉字部件构字信息”包含以下两个方面的内容:①按规定输入电脑词典汉字部件库中的任意一个部件或任意一个汉字所含的一至全部部件构成的部件串,部件串中可含通配符,电脑磁盘文件中的程序,能从电脑磁盘文件的单字条目信息库里迅速找出电脑词典所收各单字条目的部件中,在相应部位含指定部件或指定部件串的所有目标汉字。②对通过电脑词典提供的任何一种单字条目查询方式获得的满足查询条件的目标汉字,用户都可有选择的查看其中的任意一个至全部目标汉字的汉字拆分情况(即汉字部件构字情况)。
汉字词语语义分类路径信息指类义词书的词语语义分类情况(即将汉字词语按语义关系的亲疏进行分类的情况)。本电脑词典所述词语语义分类路径信息包含以下三个方面的内容:①通过电脑词典提供的菜单与选项查看电脑词典所含汉字词语语义分类路径的目录结构。②通过电脑词典提供的菜单与选项,使用含于电脑词典所收单字条目汉字与多字条目汉字词语具有的任意一个选定的词语语义分类路径,查看电脑词典所收全部单字条目的汉字与多字条目的汉字词语中,具有选定词语语义分类路径的所有汉字和汉字词语及这些汉字和汉字词语分别在相应信息库记录中存储着的各相关信息。③对通过电脑词典提供的任何一种单字条目查询方式获得的满足查询条件的任意一个目标汉字或通过电脑词典提供的任何一种多字条目查询方式获得的满足查询条件的任意一个目标汉字词语,都能通过电脑词典提供的菜单与选项,查看指定目标汉字或汉字词语在相应信息库中存储着的词语语义路径情况。
电脑词典还可根据服务对象的不同,在单字条目信息库与多字条目信息库中增加其它任意一个或数个信息。
汉字部件构字信息查询是指:按规定输入电脑词典汉字部件库中的任意一个部件或词典所收任意一个单字条目的汉字所含的一至全部部件构成的部件串(部件串中可含通配符),电脑磁盘文件中的程序,除能从电脑磁盘文件的单字条目信息库里迅速找出电脑词典所收各单字条目的汉字部件中,在相应部位含指定部件或指定部件串的所有目标汉字与单字条目信息库对每一目标汉字存储的各汉字信息外,还能根据所找到的各个目标汉字,从多字条目信息库中依次找出含每一目标汉字的所有汉字词语及多字条目信息库对每一相应汉字词语存储的各信息,并只将信息库中被用户选定要看的信息进行显示。
汉字拼音信息的查询是指,按规定输入词典所收任意一个单字条目的汉字拼音字符中的任意一个至全部拼音字符组成的拼音字符串,字符串中含拼音字符和通配符,电脑词典中的程序能从电脑磁盘文件中的单字条目信息库里迅速找出各单字条目的拼音字符中,在相应部位含有给定拼音字符串的所有目标汉字和目标汉字具有的全部信息,并能根据所找到的各个目标汉字,从多字条目信息库中找出含每一目标汉字的所有汉字词语及多字条目信息库对每一相应汉字词语所在多字条目中存储的各信息,只给用户显示单字条目信息库与多字条目信息库中用户预先选定要看的信息栏目中的信息。
汉字词语拼音信息查询是指按规定输入词典所收任意一个多字条目的词语拼音字符所含的一至多个拼音字符组成的拼音字符串,字符串中含拼音字符和通配符,电脑词典中的程序能从电脑磁盘文件中的多字条目信息库中迅速找出各多字条目的拼音字符中,在相应部位含有给定拼音字符串的所有目标汉字词语与信息库对各目标汉字词语存储的全部汉字词语信息,只显示用户指定要看的信息栏目中的信息。
汉字构词信息查询是指按规定输入词典所收单字条目中的任意一个汉字或一组字数不超过词典所收最长词目字数的汉字串,字串中可含通配符,电脑磁盘文件中的程序,能从多字条目信息库里找出各多字条目的汉字词语,在相应部位含有给定汉字或给定汉字串的所有目标汉字词语和信息库对各目标汉字词语存储的全部汉字词语信息,用户能通过选择,只将被选定的信息栏目中的信息进行显示。
电脑词典的汉字词语语义分类路径信息查询,能查看电脑词典所给汉字词语语义分类路径的目录结构,也能有选择的查看在某指定词语语义分类路径目录下所含汉字和汉字词语的情况。
汉字字音信息查询和汉字构词信息查询能结合起来用于语音矫正。
电脑词典提供的含一个指定部件的汉字部件构字信息查询、电脑磁盘文件信息库中存放的汉字部件及用汉字拆分基本规定拆任意汉字所得汉字部件都能用于汉字操作系统中的造字
本发明与现有技术比较具有以下积极效果:
1、本发明与辞书相比,至少在以下方面明显优于辞书。
(1).在解决问题的范围上,凡用辞书能解决的问题,用电脑词典都能解决,用辞书无法解决的一些问题,用电脑词典也能解决。
(2).在检索问题上,辞书信息印死在纸上,有信息提供不灵活且受条目排列方式制约的缺点。一般辞书都同时配有音序检字、部首检字与笔形检字等三种检字法。单字条目按音序排列的辞书,只方便拼音查找;单字条目按部首排列的辞书,只方便部首检字。设笔形检字是因有相当一部分汉字的部首很难确定,对不知拼音的汉字,单靠部首检索不仅难,有时还可能行不通。一般辞书的词目都是正序排列,为让读者也能查找所知汉字不为词目首字的词语,有的正序辞书还在单字条目的后边给出不以单字条目的汉字为词目首字的部分词语,为减少释文内容的重复,对单字条目的汉字不为词目首字的词语不给释文。这么做虽能增加查询功能,扩大辞书能解决问题的范围,但问题解决得并不理想。首先读者用扩充功能解决问题时手续多、解决问题的速度缓慢,其次扩充功能会造成词目的释文内容增多、辞书信息保存有重复、页码增加,给编辑印刷、携带保管及使用等多方面都造成不便。
电脑词典解决检索问题用程序和电脑具有的快速查找显示能力,对含于词典所收单字条目与多字条目信息库存储的任意一个信息栏目的信息,只要电脑词典磁盘文件的程序将其纳入词典给用户提供的查询信息,用户就能很方便的用其获得所需目标信息。用电脑词典解决汉字与汉字词语的查询问题,有手续简便、速度快、针对性强、解决问题范围宽、信息显示能按一定顺序集中起来依次进行,便于阅读对比等优点。能使辞书解决检索问题存在的各种缺点得到很好克服。
(3).在词典内容的保存、修改、充实、复制及词典功能的调整、添加等方面,电脑词典也有辞书无可比拟的优点。
本发明让电脑词典拥有汉字和汉字词语的多种信息提供,不仅能给人们看书报写文章(特别是用电脑写文章)查看生字生词的有关信息带来方便,还有利于语言文字学家用计算机研究汉字和汉字词语的工作;给大学中文系师生、中小学师生及语言文字工作者解决某些语言文字规范化问题的工作带来方便。
本发明电脑词典的特点是在磁盘文件的信息库中存入汉字与汉字词语在形、音、意等方面具有的各信息后,就能利用计算机具有的快速查找显示功能,编程序使词典所收条目的字与字、字与词、词与词在形、音、意等方面存在的每一相关信息都能方便地、快速高效地进行访问的优势,解决用户对信息库中所存信息的查询问题。能使辞书解决相应问题的优点得到发扬、缺点得到克服,并使索检信息的范围都比辞书有扩大,比用辞书解决汉语语言文字规范化问题明显优越。
下边分别对各主要信息的查询情况与主要用途进行说明。
一、汉字部件构字信息的查询与主要应用。
为叙述方便,在下边的讨论中,规定词典内提供汉字部件构字信息的汉字部件结构库,是用拆分不拆交限定每字最多能拆四个部件与孤立部件一般不拆的汉字拆分基本规定,拆每一规范汉字所得全部表形部件按规范字书写顺序安排得到的。对汉字部件结构库中的汉字部件,是用限定每字最多能拆部件数不为四个的情形或用其它方式得到的情形,其情况可以类推。下边先看汉字部件构字信息的查询方式。
一种方式是按规定输入词典内汉字部件库中的任意一个部件,都能得到词典内所收单字条目中含给定部件的所有汉字与电脑磁盘文件中存放着的每一相关汉字的各信息及词典所收多字条目中分别含各相应汉字的所有词语与电脑磁盘文件中存放着的每一相关词语的各信息。用户能用电脑词典配备的信息提供选择方式,让电脑词典从上述能提供的信息中,仅提供自己所需信息栏目的信息。
如:“人”是词典内汉字部件库中的一个部件,按规定输入部件“人”后,电脑词典磁盘文件中的程序除能让计算机迅速查出电脑词典所收单字条目中第一个部件、第二个部件、第三个部件、第四个部件分别是人的汉字各是哪些外,还能迅速查出在电脑词典的磁盘文件中所存储的有关这些单字条目的汉字具有的各信息、电脑词典所收多字条目中含有部件人的汉字的各词语与电脑词典所收多字条目中每一含有部件人的汉字词语在电脑磁盘文件中存储着的各信息。须对这些信息作全面了解的人员,可用电脑词典提供的菜单与选项,让这些信息可根据需要按某指定顺序(如汉字的频度大小或汉字的音序或汉字的区位码大小等顺序)依次显示;不需对这些信息作全面了解的用户,也可通过电脑词典提供的菜单与选项,让电脑词典只对自己关心的,含部件人的某一个或数个指定的汉字与汉字词语,仅显示自己需要的存储在电脑磁盘文件中的有关信息。
另一种方式是,按规定输入词典中汉字部件库中的任意一个部件或任意个数不超过四个的汉字部件构成的部件串(部件串可含通配符),电脑词典除能迅速查出词典所收单字条目在指定位置含给定部件串的所有汉字外,还能迅速查出电脑词典的磁盘文件中存储着的这些汉字的全部信息、电脑词典所收多字条目中分别含这些汉字的词语及这些词语的全部信息。无论用户是否须对这些信息作全面了解,都能用电脑词典提供的菜单与选项,让电脑词典只对自己关心的信息进行显示。
下边从四个方面看汉字部件构字信息提供的应用。
(1)有汉字部件构字信息提供的电脑词典,能帮助每一写文章的用户迅速方便的找到不知道正确拼音与确切释义,只知道汉字或汉字的一部分写法的汉字在电脑词典的磁盘文件中存储的与该汉字有关的各信息。
使用单字条目是按部首排列的辞书,查找不知道拼音,只知道部首的汉字,须通过以下三个步骤,才能找到自己要找的汉字。①确定部首的起笔笔形和笔画数,从部首表中找出含此部首的汉字在辞书中的页码。②打开辞书的相应页码,得到辞书所收单字条目中含指定部首的各汉字及每一相应汉字的释义。③根据辞书提供的相应单字条目的释义,确定自己要找的汉字。若所用辞书的单字条目是按音序排列或编码排列,则其查找手续会更麻烦。对知道部分所含部件没有被所用辞书列为部首的汉字,一般不能通过所用辞书找到。
使用具有汉字部件构字信息的电脑词典,寻找只记得一部分写法和释义的汉字,只要按规定输入记得部分所含的汉字部件,能立即得到含输入部件的各个汉字及每一汉字的释义。因此,就寻找只记得一部分写法和释义的汉字而言,和用辞书相比,用具有汉字部件构字信息的电脑词典,除有查找手续简单、获取信息速度快的优点外,还有查找能力强,能让用辞书无法解决的,所知部分不含汉字部首,只含汉字部件的汉字也找到解决办法。如:含“辶”的汉字,通常可查“辶”部,但“腿、煺、褪、缝、蓬、篷、糙、谜、涟、链、琏、裢、鲢、琏、笾、跹、鞑”等字都含部件“辶”,这些字在“辶”部是找不到的。对这些字,如果有谁忘了它们的拼音与整字写法,而记得的部分又不含它们的第一个部件,就很难用辞书找到它们的正确写法和释义。此外,还有一些不知道拼音的生字,因为部首很难确定,既不可通过音序查找,也很难通过部首查找,为帮助读者解决这些字的检索问题,《新华字典》、《现代汉语词典》等辞书除给出“音节索引表”与“部首检字表”外,还给出“难检字笔画索引”(笔形法)。用含汉字部件构字信息的电脑词典解决问题时,只要用户记得任意一个汉字的任何一个部件,无论所记得的汉字部件在汉字的什么部位,输入用户记得的部件后,立即得到词典所收含输入部件的汉字。辞书的汉字部首有200个左右,《新华字典》与《现代汉语词典》有部首210多个,即借助辞书解决查不知汉字拼音的生字释义与只知道一部分写法的汉字的可用信息不足250个,用拆分不拆交限定每字最多只拆四个部件的办法拆全部国标汉字所得部件约750个,是辞书所用部首的三倍多,所以使用有汉字部件构字信息的电脑词典解决问题,有解决问题手续简便、获取信息速度快、效率高、范围宽等优点。
由于这样的问题在每个用汉字写文章的人身上都会发生,所以电脑词典含汉字部件构字信息查询的功能,可以帮助用汉字写文章的人们把顺利写出所需汉字的问题解决得比用辞书好。
(2)有汉字部件构字信息提供的电脑词典,能给大中小学师生及其他人员迅速了解掌握汉字部件构字情况与迅速了解掌握含有某相同笔画结构的汉字信息等工作带来方便,有利教学质量的提高。据97年第2期《中文信息》杂志报道,四川省井县教育局推行“字族文识字法”可在两年内教会原来小学6年学的字。他们把“皮疲披坡破颇波菠婆”等字看成“皮字族”,规律地成批教字,大大提高了学生的识字效率。汉字部件构字信息的查询,能给开展“字族文识字法”的教学工作提供方便。
(3)含一个指定部件的汉字部件构字信息查询在改进汉字操作系统的造字功能上的应用。
汉字有数万,对大多数人而言,一般情况下,GB2312-80的6763个汉字已够用,若将所有汉字都纳入操作系统的显示字库与打印字库,不仅占用磁盘空间大,而且用户调用也不方便,因此一般汉字系统的字库只给出GB2132-80的汉字。当用户用到国标汉字外的字库中没有的汉字时,须用系统提供的造字功能造用。目前,汉字操作系统提供的造字功能因无含一个指定部件的汉字部件构字信息的提供,在选取参考字上给用户带来不便。在汉字操作系统的造字功能中,增加含一个指定部件的汉字部件构字信息的查询功能,能给选好参考字的工作变得简单容易,给用户利用操作系统提供的造字功能造出所须汉字的工作带来方便。特别,设A是一汉字集合,A中除含全部国标汉字外,还含若干国标汉字外的汉字。将用拆分不拆交,限定每字最多能拆部件数和一般不拆孤立部件的汉字拆分基本规定拆A中所有汉字得到的全部部件减去这些部件中属于国标汉字中的成字构成的集合记为B,在汉字操作系统的显示字库与打印字库中分别给出集合B中的每一部件,作为创建新字的“引用”部件,并给出用汉字部件所含两个指定笔画信息(如:部件的起笔笔形和笔画数、一二笔笔形或首尾笔笔形等信息中的一个信息)作为创建新字“引用”部件的检索办法后,能使用户把造汉字集合A中的非国标汉字的造字工作,变得像造全由系统中的字库提供的单部件字构成的汉字一样简单。此外,也可根据不同汉字操作系统提供的字库与造字功能,给出与指定汉字系统的字库和造字功能协调的,用拆分不拆交,限定每字最多只拆4个部件和一般不拆孤立部件的汉字拆分基本规定得到的,构成汉字集合A的汉字部件及用汉字部件笔画信息检索创建新字所须引用汉字部件的办法,开发出能让用户在指定操作系统下比较方便的造出所须汉字的造字软件,使造字工作的难度降低、速度加快、质量提高。
(4)汉字部件构字信息的快速准确提供在研究汉字形码上的应用。
汉字部件构字信息的快速准确提供,能让汉字形码研究者准确掌握汉字字形信息的变化情况,研究出能与汉字结构实际相符的汉字形码。
汉字形码用汉字字形信息给汉字编码,不能解决汉字部件构字信息的快速准确提供问题,编码研究者在研究编码的过程中就不可能及时获得研究汉字形码最重要的汉字字形信息,也不可能开发出能用计算机技术全面解决研究汉字形码所需各主要功能的计算机软件,面对字形结构复杂多变,部件构字规律紊乱难寻的众多汉字,没有能全面解决研究汉字形码所需主要功能的计算机软件去研究汉字形码,编码研究工作必然存在花时多、花费大、编码做法难与汉字结构实际相符(有盲目性)、编码质量难把握、难提高等问题;没有能全面解决研究汉字形码所需主要功能的计算机软件研究编码,不仅给编码研究者的研究工作带来很大困难,也使编码质量评测专家不能用编码研究软件开展编码质量评测工作,使编码质量评测工作的开展比研究编码还困难。从《中文信息》杂志对“五笔字型”、“认知码”、“规范X码”与“规范Y码”等著名编码研究时间的报道知,这些编码的研究都没有使用能全面解决研究汉字编码所需主要功能的计算机软件。
本发明所述汉字部件构字信息的产生办法,是我使用计算机研究用每一汉字的全部表形部件按规范汉字书写顺序一笔不变的给汉字编码的汉字形码时得到的。根据我研究汉字形码的实际需要,我和我校计算机教师陈春江讲师共同开发出了能让计算机快速准确提供汉字部件构字信息、拼音信息与反映编码质量统计数据信息的有全面解决研究汉字编码所须各主要功能的汉字编码研究软件,使五笔字型诞生以来,汉字编码研究中存在的汉字编码研究难和编码质量评测难的问题都明显变简单。
二、电脑词典对汉字构词信息的提供与主要应用。
人们写文章时,常常会遇到知道含于某词语中的某字或某几字的写法,不知道整个词语的写法和确切释义。以知道词语的一字情形讲,用辞书解决此问题时,当所知汉字是词语的首字时须用“正序词典”、当所知汉字是词语的尾字时须用“逆序词典”,当所知汉字既不为词语首字也不为尾字时,一般须有“辞通”或“常用构词字典”等辞书的配合使用才行。一般辞书(如《四角号码新词典》,中国社会科学院语言研究所编《现代汉语词典》等)的词目都按正序排列,逆序排列的辞书一般个人都没有。遇到所知汉字不为词语首字的问题时,对能找到有几种不同查询方式的辞书者,问题能解决,但手续麻烦、速度缓慢。对不能找到有几种查询方式的辞书者,问题就很难通过查找辞书来解决。
电脑词典具有汉字构词信息的提供,能使人们迅速方便的得到电脑词典所收多字条目信息库中,在指定部位含指定汉字或指定汉字字符串(汉字字符串可含通配符与逗号)的所有汉字词语及每一词语在多字条目中存储的其它信息。用电脑词典解决汉字构词信息的提供问题,无论所知汉字字数多少与所知汉字在词语的什么部位,除输查询信息有点不同外,获得目标信息都一样方便,且能把含指定汉字或指定汉字串的汉字词语汇集在一起与每一汉字词语具有的其它信息按一定可选择的顺序依次显示,便于读者查找比较。
为让用户更方便的找到自己所须词语,其信息提供还可分限定词语字数与不限定词语字数两种。如我们要找第二字是“好”的词语,当限定词语字数为2时,只把词典所收多字条目中第二字是“好” 的全部二字词找出;当限定词语字数大于2小于5时,就把词典所收多字条目中第二字是“好”的三字词与四字词找出;当不限定词语的字数时,就把词典所收多字条目中,第二字是“好”的全部词语都找出。与其它查询问题的解决一样,电脑词典解决汉字构词信息的提供,同样具有辞书不可比拟的优点。
电脑词典对汉字构词信息提供的应用,还体现在能与汉字拼音信息的查询及汉字词语拼音信息的查询结合起来用于语音矫正,这将在下边的讨论中作详细说明。
三、汉字拼音信息查询和汉字词语拼音信息查询的主要应用。
汉字拼音信息查询及汉字词语的拼音信息查询能给用户及时了解掌握同音字、同音词,在相同部位含有某任意一个至多个拼音字符的汉字或汉字词语等信息的工作带来方便。
任给含于某一汉字的一个拼音字符串,若此拼音字符串不含通配符,要查以此拼音字符串为开始的拼音字符的汉字与释义,用音序排列的字典还是比较方便,用部首排列的字典就很不方便。若所给拼音字符串含通配符且通配符不在拼音字符串的最后边,要查以此拼音字符串为开始的拼音字符的汉字与释义,即使是用音序排列的字典,也会因满足条件的汉字不能依次连续出现而给查找工作带来不便。以含一个通配符的拼音字符串为例,通配符在拼音字符串中的位置越在前时,查找难度越大。
如我们要查前三个拼音字符为“can” 的汉字与释义,在音序排列的字典中,满足条件的汉字依次连续排列在一起,所以查找是方便的。如果我们要查第一个拼音字符是c,第二个拼音字符任意,第三个拼音字符是n的汉字与释义,由于第二个拼音字符任意,满足条件的汉字被隔开,但因第一个拼音字符限定为c,满足条件的汉字依次连续出现在前三个拼音字符分别为can、cen、con、cun的四个片断,查找起来就不大方便。当我们要查找第一个拼音字符任意,第二、三两个拼音字符为an的汉字时,由于第一个拼音字符任意,在音序排列的字典中,满足条件的汉字依次连续出现在第一个拼音字符分别为b、c、d、f、g、h、k、l、m、n、p、r、s、t、w、y、z等17个字符中的一个字符,第二、三两个拼音字符同为an的17个片断中,加满足条件的汉字字数增多,此时用音序排列的字典查找满足条件的汉字就大不方便了。若要进一步解决统计、记录与某些比较工作,遇到的困难就会更大。此外,用手工操作去解决此类问题,稍不注意就会出错。用含对国标GB2312-80的汉字具有拼音信息提供功能的计算机软件可以很快知道,国标汉字中,前三个拼音字符为can的汉字有19个,累计使用频度为0.1075%;第一个拼音字符为c,第二个拼音字符任意,第三个拼音字符为n的国标汉字有41个,累计使用频度为0.4263%;第一个拼音字符任意,第二、三两个拼音字符为an的国标汉字有546个,累计使用频度为4.7939%。从这些数据可以想到用辞书解决一般的含指定拼音信息的汉字信息提供问题是比较困难的(汉字频度转引自山东教育出版社出版,高更生等主编《现代汉语知识大词典》附录八)。
当用辞书查找有某相同拼音信息的汉字词语时,因为每一汉字词语的拼音字符的数量都比汉字的拼音字符多,遇到的困难会更大。不仅查找速度慢,避免出错也困难,有的甚至无法解决。当用含拼音信息提供的电脑词典来解决这样的问题时,对用户而言,除了输查询信息的难度会有一点差别外,所需信息的得到都一样简单。可见,用含拼音信息提供的电脑词典解决汉字与汉字词语的拼音信息提供问题,具有简单、高效、准确等优点,并能使一些无论用多少时间与多少人力都难用辞书得到准确解决的拼音信息的提供问题也找到快速准确提供的办法。
电脑词典具有汉字拼音信息查询与汉字词语拼音信息查询功能的用途是:
(1)帮助用户顺利找到知道拼音,不知道写法或释义的字、词写法与释义。
(2)帮助用户掌握读书看报时遇到的生字生词的普通话发音及帮助用户(特别是学校的师生)正确掌握会写而不会读和读得不标准的汉字与汉字词语的普通话发音。
(3)中国的诗词很讲究韵律,辞书中有按韵排列字词以供读者用韵参考的“诗韵词典”。电脑词典有拼音信息的查询,能帮助写诗词的人员,比较方便的选取写诗用韵的字词。
(4)拼音信息的查询能与汉字构词信息的查询配合起来用于语音矫正。
国家语言文字工作委员会与国家教育委员会于1987年9月25日下发的“关于加强高等师范院校推广普通话工作的通知”中指出:“推广普通话是一件大事,它关系到社会主义两个文明建设,是国家统一、民族昌盛的需要。随着改革、开放的深入发展和语言信息处理的技术要求,推广普通话工作的迫切性更加突出。”《通知》要求:“各院校要充分认识推广普通话工作的重要性和迫切性,切实加强领导,认真抓好这项工作。”《通知》强调:“普通话是教师的职业语言,使用普通话教学是师范院校合格毕业生的必备条件”。就云南省的情况讲,师范院校(含中师)的学生都要参加省语委统一组织的普通话过级考试,过级考试不及格的学生不能领到毕业证书。此外,随着改革开放的深入,其它行业(如服务行业)的人员要把工作开展好,也须会讲普通话。
由戴梅芳主编,语文出版社出版的“普通话水平测试指南”一书知,说好普通话,语音练习是基础练习,语音练习中声、韵、调的选材内容,都是从方言与普通话的对比出发,选择针对性强的单字和词语通过听音、记音和辨音等多种方式练习,让应试者把普通话的单字和词语的语音读准。
要提高推广普通话的效率,必须根据每个地方的方言特点,从3500个常用汉字中找出针对性强的,能真正起到正音纠错作用的类推代表字、容易读错读混的特殊字和不好类推的个别字及由常用字组成的含这些字的常用词语给应试者作听音、记音和辨音等练习。
普通话水平测试中的读单字,考查应试者普通话声母、韵母、声调的发音是否正确,要从3500常用字中选能覆盖21个声母、38个韵母和四个声调的50个单字给应试者读(其中还应含10%的古入声字),读词语选以3500常用字为范围,当地人学普通话的难点音节为重点的40个双音词给应试者读。
汉字字数多,各地方言千变万化,差异很大,没有字音信息、汉字频度信息或区位码信息与汉字构词信息的自动提供,不仅给各地负责推广普通话工作的人员分别找到正音纠错好的单字与词语的工作带来很大困难;也给他们寻找供测试用的针对性强且满足测试要求的单字和词语的工作带来很大困难。
例如,用同一套录音带解决全省各地应试人员的听音、记音和辨音练习。不用说一个省,就是一个县的不同乡镇,也存在差别较大的方言。编写供全省学习的教材和制作供全省学习的录音带,不仅难度大且针对性不可能对多数地区都很强。
字音信息的查询,能使各地语文教师和推普工作者方便的找到当地方言发音不准的声、韵、调与相应的常用字;汉字构词信息的查询,能让人们方便的找到相应的常用字词语,让各地的语文教师或推普工作者都能方便地给应试人员编写出针对性强的、学习效率高的学习材料。
应用汉字字音信息、构词信息的自动提供和多媒体技术,可开发出输入某地方言和普通话中差别大的声、韵、调字符后,能让计算机自动找出针对性强的,能真正起到正音纠错作用的类推代表字、容易读错读混的特殊字和不好类推的个别字及由常用字组成的含这些字的常用词语,并能带着应试者依次作听音、记音和辨音等练习的计算机软件或专用的普通话语音练习设备。使推普工作的难度减小,效率提高。此外,此法也可用于语音输入的语音矫正。
四、电脑词典提供汉字词语语义分类路径信息的应用:
《作文词语分类手册》、《同义词词林》、《简明汉语义类词典》、《现代汉语分类词典》等辞书属类义辞书,这种辞书编纂难度较大,发行量较小,见得不多。由山东教育出版社1992年出版,高更生、谭德姿、王立廷主编《现代汉语知识大词典》知:类义词辞书是“将汉字词语按语义关系的亲疏分类编排的特种语文词典。”这种词典把所收词语按一定分类原则,“通过层层分类和技术处理来显示词语的范围层次和细微差异,一般不释义,或者只作简要注释。这种词典主要供人们在写作或翻译时挑选词语用,同时也为研究词汇提供了丰富的材料。……在我国,古代的《尔雅》及其后的一些雅书,已具类义词词典的某些特点;而现代意义的类义词词典,一般认为,则当推1983年出版的《同义词词林》(梅家驹、竺一鸣、高蕴琦、殷鸿翔合编)为最早。”汉语大词典出版社98年出版,董大年主编《现代汉语分类词典》给用户提供了“分类目录”和“词目音序索引”两种查找词目的办法。用“分类目录”查找词目,要求用户对所用辞书的词语分类情况有比较清楚的了解,这对一般用户是难以办到的;用“词目音序索引”查找词目,要求用户至少要知道所找词目首字的正确写法与拼音,否则没有其它辞书的配合就不行。该书的分类目录有50页,正文有1162页,词目音序索引有272页。词目音序索引所占的页码是正文页码的五分之一强,若再增一种查找办法(如正序排列的部首索引),则词目索引所占页码将接近正文页码的一半,且再增一种查找办法也不能彻底解决方便用户查阅的问题。类义辞书在检索问题上存在的不便比其它辞书还突出。查询上存在的严重不便与编纂工作上存在的巨大困难,使类义辞书具有的优越性的发挥受到了极大限制。
在人们用辞书解决的问题中,寻找自己不会写的字词的正确写法是第一需要,寻找自己不熟悉的字词的读音是第二需要,寻找自己不熟悉的字词的释义是第三需要,寻找写好文章的正确用词是第四需要。一般辞书的条目排列方式便于用户把前三个需要的问题解决好,类义辞书的条目排列方式便于用户把后一需要的问题解决好。前三需要是基础,且易同时配备音序查询与部首查询等容易被用户掌握的查询办法,查询较易实现,释义较详,受一般用户欢迎,用户多,发行量也大;后一需要是提高,但因辞书不能对义类辞书条目排列方式配备易被一般人掌握的有效查询办法,查询难实现且释义简单,不能满足一般用户需要,用户少,发行量也小。
类义词典“一般不释义,或者只作简要注释。”的做法,使它的词目按语义排列所能起到的作用受到了很大削弱。在写文章的人中,对很多词语都有深刻认识,只要经过简单提示,就能看出各词语间存在的差别,使正确用词问题得到解决的人并不占多数。释义太简单会给许多人产生“编写粗糙,没有把问题讲清楚”的感觉,不能达到帮助一般人员解决好写文章的正确用词问题,既影响辞书的销路,也使此种词目编排方式能产生的比其它词目编排方式好的作用无法得到应有发辉。如果类义词典词目的释文与一般词典相同,则它除能起到也可帮助一般人解决好写作时挑选词语的作用外,还能在帮助读者增加知识、丰富词汇方面起到明显超过其它词典的作用。多功能汉语电脑词典有词语语义路径提供的功能,既能使类义词典的释文与一般词典相同,又能使类义词典在检索上存在的极不方便的缺点得到很好克服,还能使用户对是否看词语的释义有选择,能满足不同用户的需要,让类义词典词目排列方式潜在的作用获得很好显现与发挥的条件。
给词语按语义分类是一比较复杂的问题,不同的辞书有不同分法。由山东教育出版社出版,高更生等主编《现代汉语知识大词典》知,上海辞书出版社83年出版,梅家驹、竺一呜、高蕴琦、殷鸿翔合编的《同义词词林》“全书收词语近7万,……将全部词语按语义分类编排,共得12大类、94中类、1428小类、3925个词群”。
类义辞书的词语分类情况有点像DOS的树状目录,取DOS对目录与路径的称呼,以分四级的情况讲,将大类叫词语语义分类的一级子目录,中类叫二级子目录,小类叫三级子目录,词群叫四级子目录,则词语语义分类路径就是指沿词语所在目录的路线上,由一级子目录开始的各级子目录与分隔符“\”所组成的字符串。如:汽车、轮船、飞机,它们首先是物、其次是交通工具,其语义路径依次为:物\交通工具\陆上、物\交通工具\水上、物\交通工具\空中。因陆上、水上、空中的交通工具分别有相同的语义路径,电脑词典有语义路径信息提供的功能,使我们能用汽车的语义路径得到陆地上行驶的其它交通工具名称的词语(含释义等信息),用轮船的语义路径得到行驶在江河、湖泊与海洋中的水上交通工具名称的词语(含释义等信息),用飞机的语义路径得到行驶在空中的飞行物名称的词语(含释义等信息)。
电脑词典具有汉字词语语义路径信息的提供功能,能让我们通过每一词语所在条目的语义路径信息查看有相同语义的其它词语信息,使类义辞书在检索问题上存在的严重不便得到明显改变,能让类义辞书具有的优越性得到很好发挥。
就以交通工具而言,一般人都有一定了解,但不可能很多。因为写文章或出于某种需要而要对陆上交通工具有所了解时,用户只要想到一种常见的陆上交通工具,如:汽车、马车、摩托车或火车,将其中的任意一个词语输入计算机,就能通过电脑词典菜单栏上提供的“类义词”命令按钮得到词典所收陆上交通工具的情况,使自己对陆上交通工具有比较全面的了解;人们写文章时常常会遇到无论怎么想也不能想到能确切表达自己想法的词语,遇到这种情况时,只要将自己想到的能较好表达自己想法的词语输入电脑词典,就有可能通过电脑词典菜单上提供的“类义词”命令按钮获得能更好表达自己想法的词语。
要写好文章,必须正确使用词语。要正确使用词语,首先必须了解词的含意、特点、感情色彩及用法,因为它直接关系到一篇文章的思想性和艺术性。有提供词语语义路径功能的电脑词典能把词典所收的表达同一概念的词语汇集在一起,让用户可以根据写文章的需要,方便的查阅同类词语中各个词的释义、例证,分析词与词间的差别,辨别它们的褒贬意义。通过选择和比较,既使正确用词问题得到解决,也使写文章的词汇得到丰富,有很好的帮助用户增长见识拓宽知识面的作用。
条目排列方式不同的辞书,能方便不同查询的需要。每种辞书都只能有一种条目排列方式,因此只能方便一种查询。条目按部首排列的词典,方便用部首索解;条目按音序排列的辞书,方便用拼音索解;正序词典方便用词语的首字索解;逆序词典方便以词语的尾字索解……。每一用户都会遇到要用不同索解信息来解决的问题,用辞书解决人们读书看报和写文章中遇到的问题,对只有一本辞书的人来说,即使拥有的辞书提供了多个索解办法,也只有一种索解办法能比较方便的解决问题,当以其它办法索解时,或者麻烦,或者不行。
有汉字部件构字信息、汉字拼音信息、汉字词语拼音信息、汉字构词信息、汉字词语语义路径信息等多种信息查询的多功能电脑词典,能克服上述辞书在查询问题上存在的缺陷,把以每种条目排列方式的一般辞书具有的功能都通过电子计算机具有的快速查找显示能力来实现,并能让用户通过选择,只将用户关心的信息栏目的目标信息汇集起来按指定顺序依次显示。使每种条目排列方式的辞书能带给用户的索解方便,都能让用户以截然不同的方式与速度得到享受。
多功能电脑词典具有的优越性还体现在能使用的索解信息与能获得的目的信息都比辞书多,即辞书能用的索解信息,电脑词典一定能用,辞书不便使用与不能使用的查询信息(如:串内可含通配符且串长符合要求的任意指定的部件串、拼音字符串及汉字串),电脑词典能同样方便的使用;辞书能提供的信息电脑词典一定能提供,辞书很难获得与没法获得的某些信息电脑词典也能很容易很迅速很准确的获得(如:含指定部件串的汉字、含指定拼音字符串的汉字或汉字词语、含指定汉字串的汉字词语及满足查询条件的目标信息的统计数据等),且有查找信息速度快、提供信息针对性强(只显示用户指定要看的信息栏目的信息)、满足查询条件的目标信息能依次按某种顺序集中显示,既便于查阅比较又便于防止遗漏出错等优点。
语言文字是人们交流思想,促进科学文化发展的重要工具,词典是帮助人们排除书写或阅读文章遇到文字障碍的工具。对一般人而言,没有词典的帮助不仅不能把要写的文章都写好,还不能把所看的别人写的文章都理解好,所以许多人读书写文章都要用到辞书,因辞书在使用上的不便及信息提供上存在的不足,使其作用的发辉受到了限制,电脑词典用计算机具有的快速查找显示功能,能集多种辞书的功能于一体,让语言文字规范化问题中遇到的比较基本常见的问题都能找到简单方便迅速准确的解决办法,不仅能克服辞书在使用上存在的低速低效等不足,还能让没法通过辞书进行解决的一些问题也能找到方便快速的解决办法。借助电脑词典写文章,能使所写文章在速度上和质量上都获得超过用书本词典所能达到的水平;借助电脑词典搞科研,也能使所搞科研成果在研究质量和效率上都能超过用书本词典所能达到的水平。
随着大硬盘生产技术的不断改进,利用电脑词典在内容的修改、充实、保存、复制和功能的调整、扩充等方面具有的优点,其内容可以不断充实、更新与完善,其功能也可适当增加与调整,使其能兼顾一些特殊需要。如对词典中的各条目分别给出一种或数种外语的相应单词,供有关人员在需要时查阅,增加留给用户自己添加方便查询的备注栏目与对目标信息增加统计、打印、拷贝等功能,为有关人员开展相关信息的分析研究工作提供方便等。
计算机时代研究汉字,离不开用计算机研究汉字的字音信息、字形信息、汉字的编码、构词和应用等问题。用计算机研究汉字不研究汉字编码,其研究工作就可能出现与中文信息处理产生矛盾的问题;用计算机研究汉字编码不研究汉字,其编码就会变成无源之水,无本之木,不能成为好编码。
要用计算机研究汉字和汉字词语,首先要能用计算机快速准确提供汉字与汉字词语具有的各种信息,电脑词典能用计算机快速准确提供汉字与汉字词语存储在电脑词典信息库中的各种信息的功能,能为用计算机研究汉字与汉字词语的工作奠定一定基础。
Claims (9)
1、一种多功能汉语电脑词典,其特征在于:在电脑磁盘文件的单字条目信息库中存入词典单字条目具有的多种信息,如:汉字、部件、笔画、拼音、释义、反义词、词语语义分类路径、频度,和在电脑词典磁盘文件的多字条目信息库中存入词典多字条目具有的多种信息,如:汉字词语、拼音、字数、词性、释义、举例、反义词、词语语义分类路径,只要按规定,输入其中的任意一个查询信息,就能获得自己所需的与查询信息相关的信息,其中单字条目信息库里第i条记录中的部件,是用拆分不拆交,限定每字最多能拆4个部件和一般不拆孤立部件的汉字拆分基本规定拆第i条记录中的汉字所得全部表形部件,按部件首笔依国家语委对相应汉字所作笔顺规范的规定排列而得,当以m表词典所收单字条目的数量时,i的取值为不超过m的所有自然数。
2、根据权利要求1所述的电脑词典,其特征在于电脑词典还可根据服务对象的不同,在单字条目信息库与多字条目信息库中增加其它任意一个或数个信息。
3、根据权利要求1或2所述的电脑词典,其特征在于汉字部件构字信息的查询是指按规定输入电脑词典汉字部件库中的任意一个部件或词典所收任意一个单字条目的汉字所含的一至全部部件构成的部件串,部件串中可含通配符,电脑磁盘文件中的程序,除能从电脑磁盘文件的单字条目信息库里迅速找出电脑词典所收各单字条目的汉字部件中,在相应部位含指定部件或指定部件串的所有目标汉字与单字条目信息库对每一目标汉字存储的各汉字信息外,还能根据所找到的各个目标汉字,从多字条目信息库中依次找出含每一目标汉字的所有汉字词语及多字条目信息库对每一相应汉字词语存储的各信息,并只对信息库中用户选定要看的信息进行显示。
4、根据权利要求1或2所述的电脑词典,其特征在于汉字拼音信息的查询是指,按规定输入词典所收任意一个单字条目的汉字拼音字符中的任意一个至全部拼音字符组成的拼音字符串,字符串中可含拼音字符和通配符,电脑词典中的程序能从电脑磁盘文件中的单字条目信息库里迅速找出各单字条目的拼音字符中,在相应部位含有给定拼音字符串的所有目标汉字和各目标汉字具有的全部信息,并能根据所找到的各个目标汉字,从多字条目信息库中找出含每一目标汉字的所有汉字词语及多字条目信息库对每一相应汉字词语所在多字条目中存储的各信息,并只给用户显示单字条目信息库与多字条目信息库中用户预先选定要看的信息栏目中的信息。
5、根据权利要求1或2所述的电脑词典,其特征在于词语拼音信息的查询是指按规定输入词典所收任意一个多字条目的词语拼音字符所含的一至多个拼音字符组成的拼音字符串,字符串中含拼音字符和通配符,电脑词典中的程序能从电脑磁盘文件中的多字条信息库中迅速找出各多字条目的拼音字符中,在相应部位含有给定拼音字符串的所有目标汉字词语与信息库对各目标汉字词语存储的全部汉字词语信息,只显示用户指定要看的信息栏目中的信息。
6、根据权利要求1或2所述的电脑词典,其特征在于汉字构词信息的查询是指,按规定输入词典所收单字条目中的任意一个汉字或一组字数不超过词典所收最长词目字数的汉字串,字串中可含通配符,电脑磁盘文件中的程序,能从多字条目信息库里找出各多字条目的汉字词语,在相应部位含有给定汉字或给定汉字串的所有目标汉字词语和信息库对各目标汉字词语存储的全部汉字词语信息,用户能通过选择,只将被选定的信息进行显示。
7、根据权利要求1或2所述的电脑词典,其特征在于电脑词典的汉字词语语义分类路径信息查询,能查看电脑词典所给汉字词语语义分类路径的目录结构,也能有选择的查看电脑词典所收单字条目的汉字与多字条目的汉字词语中,具有某指定词语语义分类路径的汉字和汉字词语的情况。
8、根据权利要求1或2所述的电脑词典,其特征在于汉字字音信息查询和汉字构词信息查询能结合起来用于语音矫正。
9、根据权利要求1或2所述的电脑词典,其特征在于电脑词典提供的含一个指定部件的汉字部件构字信息查询、电脑磁盘文件信息库中存放的汉字部件及用汉字拆分基本规定拆任意汉字所得汉字部件都能用于汉字操作系统中的造字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99115128 CN1095578C (zh) | 1999-09-08 | 1999-09-08 | 一种多功能汉语电脑词典 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99115128 CN1095578C (zh) | 1999-09-08 | 1999-09-08 | 一种多功能汉语电脑词典 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1287326A CN1287326A (zh) | 2001-03-14 |
CN1095578C true CN1095578C (zh) | 2002-12-04 |
Family
ID=5278141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 99115128 Expired - Fee Related CN1095578C (zh) | 1999-09-08 | 1999-09-08 | 一种多功能汉语电脑词典 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1095578C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101192108B (zh) * | 2007-03-28 | 2010-06-23 | 腾讯科技(深圳)有限公司 | 一种中文拼音输入方法及系统 |
CN103942190B (zh) * | 2014-04-16 | 2017-08-25 | 科大讯飞股份有限公司 | 语音合成中文本分词方法及系统 |
-
1999
- 1999-09-08 CN CN 99115128 patent/CN1095578C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1287326A (zh) | 2001-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meletis | The nature of writing: A theory of grapholinguistics | |
Mantello et al. | Medieval Latin: an introduction and bibliographical guide | |
Itkonen | Universal history of linguistics | |
Andrist | Toward a definition of paratexts and paratextuality: The case of ancient Greek manuscripts | |
Kytö | Register in historical linguistics | |
Thomas et al. | The Chinese ideophone database (CHIDEOD) | |
Meletis | The nature of writing | |
CN101930291B (zh) | 一种汉字简易输入、查找和学习方法 | |
Aichaoui et al. | Automatic Building of a Large Arabic Spelling Error Corpus | |
Harel et al. | Mapping the ancient mind: iClassifier, a new platform for systematic analysis of classifiers in Egyptian and beyond | |
CN1095578C (zh) | 一种多功能汉语电脑词典 | |
CN1645356A (zh) | 多维汉语学习系统 | |
Sahala | Neural Lemmatization and POS-tagging models for Coptic, Demotic and Earlier Egyptian | |
Tao et al. | Historical perspectives on Chinese written language and literacy education in China | |
Yáñez-Bouza | Historiographical methods | |
Wade | Furnace and Fugue | |
Tasovac | The historical dictionary as an exploratory tool: A digital edition of vuk stefanović karadžić’s lexicon serbicogermanico-latinum | |
Trips et al. | From original sources to linguistic analysis: Tools and datasets for the investigation of multilingualism in medieval english | |
Handel | CHAPTER 5 EARLY LEXICONS | |
Aplonova et al. | SpeechReporting Corpus: annotated corpora of West African traditional narratives | |
Cholcman | Biblioteca Digital de Emblemática Hispánica | |
Nganga et al. | Spoken word corpus and dictionary definition for an African language | |
Гриців | TEI application in fiction | |
McBride | Considerations for the continuation of a Kansa corpus | |
MARA | Furnace and Fugue: A Digital Edition of Michael Maier’s Atalanta fugiens (1618) with Scholarly Commentary |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |