CN101021828A - 汉语电子大字典 - Google Patents

汉语电子大字典 Download PDF

Info

Publication number
CN101021828A
CN101021828A CN 200710077611 CN200710077611A CN101021828A CN 101021828 A CN101021828 A CN 101021828A CN 200710077611 CN200710077611 CN 200710077611 CN 200710077611 A CN200710077611 A CN 200710077611A CN 101021828 A CN101021828 A CN 101021828A
Authority
CN
China
Prior art keywords
chinese
character
word
cpu
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200710077611
Other languages
English (en)
Inventor
朱明�
朱小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200710077611 priority Critical patent/CN101021828A/zh
Publication of CN101021828A publication Critical patent/CN101021828A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明的汉语电子大字典,它主要由大字典软件、电子扫描器和能显示检索结果的显示屏构成,大字典软件指令程序固化在中央处理器CPU中,其字库及检索程序装载在内存中,CPU通过控制扫描器,录入了需要识别的文字或图形,送入检索系统,再与字库中的相关字形、结构进行比较,从字库检索出该汉字的读音,字义、所有的异体字,CPU再发出指令给输出设备,在显示屏显示输出需要识别的汉字的字音、字义、组词的意义,同时将上述几部分结合做成一个方便使用、便于携带的汉语电子大字典工具,让使用者能快捷、迅速、方便知道自己所需要识别字的相关信息。汉语电子大字典工具的出现为国学研究提供一个利器,对发扬中国传统文化有不可估量的意义。

Description

汉语电子大字典
技术领域
本发明涉及一种汉语电子字典,特别是通过扫描汉字来识别和邦助阅读的汉语电子大字典。
背景技术
汉字在我国中华民族的文明发展史上有过伟大的功绩,我国人民长期以来创造出的灿烂文化大都是用汉字记载保存下来。中华民族有5000多年的文明史,自秦、汉以后各个朝代都留下大量的书籍文献,四书五经、大量的史料、文学作品、各种杂记、地方志、医药学文献等等,在我国发明印刷术后,各种版本的古籍得以传播、收藏,得以流传至今,给今天研究中华民族“文明发展史”准备了大量的素材,过去朝代,有官方或民间的修史,作“传”等的文献中的字里行间藏有很多我们先人治理国家的智慧、也记载着社会、自然变化及变迁等的珍贵的信息,汉字因为时代、朝代变迁,中华各民族的交融汉字也在逐渐发生变化,有些汉字在形状、读音、含义都发生了变化,由于汉字太多,太纷繁,因要全部记住它们及它们的变化十分困难。所以阅读史料时,有时是字不认识、有时是字认识了,但不知道在那里它的真实意义是什么,为此,历代相应出现了许多字典、辞书来解释它们,有名的有“说文解字”、康熙字典等,现代有各种汉语字典、辞典,辞海、新华大辞典、“成语辞典”,由于它们的种类多、数量巨大,同时又价格不菲,一般人基本不可能全部或部分购买它们,使得文化、历史的研究只能由专门的机构及它的专家进行。汉字的发展中产生不少异体字,别字,繁体字,有的字已不再使用,它们只保存在过去的典籍中,现代人要阅读这些书籍,这些字就变成了拦路虎,更不用说一个汉字各地有不同的读音,由于这些困难,中文成为比较难学的文字,在近年来,由于计算机技术的发展,我国古文化的研究,进入数字时代,世界上有越来越多的人在学习中文,研究中国历史和现代情况,了解我国改革开放的成功经验,因此在语言工具方面,出现了许多专利申请,如申请号为98123794.0名称为《双语电子辞典的数据处理方法》该发明为一种双语电子辞典的数据处理方法,该方法是以一套整合后的英汉或汉英数据来完成英汉、汉英的双向快速查询功能,其是利用英汉辞典的汉语解释,作为汉英辞典的汉语关键字,而用汉英辞典的英文解释,作为英汉辞典的英文关键字,并通过建立彼此对应的地址索引表而达到快速查找数据的目的,且该英文与汉语关键字都只出现一次,故可有效节省存储器内数据所占的存储空间,提高查询的速度,并降低其制造成本。另外有申请号为00229505.9名称为《扫描式翻译笔》该实用新型涉及一种扫描式翻译笔,它是由机身和扫描头两部分构成,两者之间采用组合安装,用软印制板实现电气连接。扫描头中间有两个腔体分别放置机械器件和光学器件,设计上采用了先进的光学字符识别技术,保证了扫描、翻译速度快且功耗低,克服了普通按键输入型掌上电子辞典输入繁琐且速度慢的问题,为用户带来方便。  另外,还有申请号为99103594.1《联想汉字输入系统》,申请号为97123339.X《部首创新排检、计算机汉字输入方法》,申请号为98123794.0名称为《双语电子辞典的数据处理方法》,申请号为200410040719.4名称《一种含汉字部件构字信息查询的汉语易通电脑词典编纂法》等很多专利申请,但是,上面列举和其他专利申请及产品,它们只是为解决双语学习、翻译使用,对中国人自己学习文化或用来学习研究古代文化中出现的不认识的字,要去快捷、迅速地、正确理解字、词意,却没有一个合适的电子汉语字典可以用。今天,我们能利用特定的工具和软件,将大量古籍能通过计算机录入,进行后处理成为可能,同时,为解决古今汉语文献阅读问题,应该也可以发明一种工具来帮助阅读。
发明内容
本发明的目的是通过现有的文字识别技术编制出的电子汉语字典软件与文字扫描、显示的新技术手段的综合,发明一种可以在阅读中文书籍时,遇见不认识的字、不明白的字意,不论它们是宋体、仿宋体、楷书、繁体等只要用扫描器一扫,通过计算机处理,就能在显示屏上反映出该字的各种异体字形和字意以及读音,可以加快阅读汉语速度和正确的理解其中含义,使得在今天信息和数字的时代,只要你是一个好学的人和愿意动脑筋的人,通过这个发明汉语电子大字典的应用,就可以从我们中华文化宝库的古籍中不断汲取养料和智慧,为今天新时代服务。
本发明的是通过以下的方式来达到,一种汉语电子大字典,它主要由汉语电子大字典软件、一个电子扫描器和一个能显示检索结果的显示屏构成,汉语电子大字典软件指令程序固化在中央处理器CPU中,电子大字典的字库及检索程序装载在内存中,中央处理器CPU通过控制扫描器,录入的文字或图象,送入检索系统,再与汉语电子大字典软件的字库的相关字形、结构进行比较,从字库检索出该字的读音,字义、所有的异体字,送到CPU进行处理后,再发出指令给输出设备,在显示屏显示输出需要识别汉字的字音、字义、所组词的词义,同时将这样几部分结合做成一个方便使用、便于携带的汉语电子大字典工具,可随身携带,让使用者能快捷、迅速、方便知道自己所需要识别字的相关信息。
汉语电子大字典,其中的软件包括检索、查询的检索系统,其次是各种字库部分,软件设计上采用了先进的光学字符识别技术,通过扫描得到的字形,通过软件具有字形比对查询的检索系统可以快速查询,同时可以采用拼音和其他输入汉字的方式进行快速查询,软件结构上建立各个汉语字形与汉字解释的关联数据库,并通过相关各种异体字建立彼此对应的地址索引表,而达到快速查找数据的目的,最后将上述的软件系统中检索关系指令软件固化在芯片中供CPU调用;安装的字库包括完备的常用汉字字库有单字1万多字,各种专业汉字字库、古汉字文字库各种字库有单字、词5-10万多条,库中分别包含有每一个字的字义、字音,各种异体字、繁体字内容;软件设计时让使用者可以给各个字库添加新的汉字条目、图形条目和词义解释,各种汉字字库存储在CPU的内存中,通过CPU的指令随时可以调用。
汉语电子大字典,其中的扫描器的机械器件和光学器件,硬件上采用了快速、低功耗的CPU和可以更换或增加的大容量的内存或闪存FLASH,用软印制板实现电气连接,保证了扫描、翻译速度快且功耗低,同时安装了可连续扫描输入的扫描器和普通按键输入装置或小键盘,保证检索系统中的字形数据和拼音以及其他方式输入汉字后的快速查询功能得以实施,同时将以上装置安装为一体,做成小笔记本、卡片大小,或做成筆形甚至与手机安装在一起的产品,产品可以通过USB接口或串口方式与计算机相连进行在线操作或升级。方便携带使用,为用户带来方便。
通过初步实施使用,这种便于携带的汉语电子大字典工具,可制作成随身携带、使用的产品,让使用者能快捷、迅速、方便知道自己所需要识别字的相关信息,为学习汉语的中国人或外国人提供一个快速、便捷的工具,可以根据不同需要的人群制作不同需要的汉语电子大字典,如为一般学习使用汉语的人可以安装完备的常用汉字字库,库内包含常用、次常用异体字等单字1万多字,它有每个字的字义、字音,各种异体字,常用词组,足够日常使用,如果是为从事中国古文化研究的人使用的产品,主要安装有专门的古汉字文字库,库容巨大,他们还可以对字库进行不断的补充,还可以通过网络交流,补充、下载,使得古汉字文字库将不断扩大,汉语电子大字典工具的出现使中国古文化研究工作能最大限度达到共享,为国学研究提供一个利器,对发扬中国传统文化有不可估量的意义。
附图说明
图1、为汉语电子大字典流程方框图。
图1中的1是汉语电子大字典中央处理器CPU单片机系统,2是输入设备键盘、3是输入控制电路、4是输入设备扫描器、5是输出设备显示屏、6是显示控制电路、7是输入输出接口、8是电源及线路、9是大容量内存或闪存FLASH。
参照图1,汉语电子大字典是由CPU中央处理器单片机系统1,输入设备键盘2、输入控制电路3、输入设备扫描器4、输出设备显示屏5、是显示控制电路6、输入输出接口7、电源及线路8、大容量内存或闪存FLASH 9所构成。各部分用用软印制板实现电气连接,中央处理器1是CPU单片机系统,为快速、低功耗E86以上CPU为核心,输出设备显示屏5为液晶屏,通过显示控制电路6控制5的输出,也已经是较为成熟的技术,大容量内存或如FLASH 9是本产品的重要部分,各种汉字字库和软件存储在在内存中,通过CPU的指令随时可以调用。输入输出接口7一般采用USB接口或串口与计算机连接,可以根据需要进行软件安装、在线软件升级、对字库进行操作等作输入接口,对扫描后处理的文档存盘后处理,转存到计算机中就可以输出接口。各部分均有控制线路。
具体实施方式
实施例1:由大字典软件、电子扫描器和显示检索结果的显示屏构成的一个方便使用、便于携带的汉语电子大字典工具,外形可以为卡片大小,其中中央处理器CPU采用E86以上单片机系统,软件指令程序固化在其中,完备的常用汉字字库有单字1万多字的字库及检索程序装载在大容量的内存如SD卡中,电子扫描器可以对需要识别的汉字进行扫描,中央处理器CPU通过控制扫描器,录入了需要识别的汉字、送入检索系统,再与汉语电子大字典软件的字库的相关字形、结构进行比较,从字库检索出该字的读音,字义、所有的异体字,送到CPU进行处理后,再发出指令给输出设备,在显示屏显示输出需要识别汉字的字音、字义、所组词的词义。这种产品适合一般学习汉语的中外人士使用,同时可随身携带,使用快捷、迅速方便使用者汉语阅读学习。同时扫描资料可以存入内存,通过USB输入输出接口与计算机联接,导入计算机,进行编辑和修改。
实施例2:由大字典软件、电子扫描器和显示检索结果的显示屏构成的一个方便使用、便于携带的汉语电子大字典工具,外形可以为小笔记本大小,其中中央处理器CPU采用E86以上单片机系统,软件指令程序固化在其中,古汉字文字库各种字库有单字、词5-10万多条,库中分别包含有每一个字的字义、字音,各种异体字、繁体字内容;软件设计时让使用者可以给各个字库添加新的汉字条目、图形条目和词义解释,装载在大容量的内存如1G的SD卡中,电子扫描器可以对需要识别的汉字或图形如印章、签名进行扫描,中央处理器CPU通过控制扫描器,录入的汉字、送入检索系统,再与汉语电子大字典软件的字库的相关字形、结构进行比较,从字库检索出该字的读音,字义、所有的异体字,送到CPU进行处理后,再发出指令给输出设备,在显示屏显示输出需要识别汉字的字音、字义、所组词的词义。软件设计时让使用者可以给各个字库添加新的汉字条目、图形条目和词义解释,这种汉字专业字库存储在CPU的内存中,通过CPU的指令随时可以调用。这种产品适合为从事对中国古文化研究的人使用的产品使用,同时可随身携带,使用快捷、迅速方便使用者。通过USB输入输出接口与计算机联接,导入计算机,进行编辑和修改和给各个字库图形库添加新的汉字条目、图形条目和词义解释的功能,能帮助使用者建立图形库如古籍中的印章库、书法字库、个人签名字库、指纹库,广泛用于鉴别、金融、安全等领域。

Claims (3)

1、一种汉语电子大字典,其特征在于它由它主要由汉语电子大字典软件、一个电子扫描器和一个能显示检索结果的显示屏构成,汉语电子大字典软件指令程序固化在中央处理器CPU中,电子大字典字库及检索程序装载在内存中,中央处理器CPU通过控制扫描器,录入了需要识别的文字或图象,送入检索系统,再与汉语电子大字典软件的字库的相关字形、结构进行比较,从字库检索出该字的读音,字义、所有的异体字,送到CPU进行处理后,再发出指令给输出设备,在显示屏显示输出需要识别的汉字的字音、字义、组词的词义,同时将这样几部分结合做成一个方便使用、便于随身携带的汉语电子大字典产品。
2、根据权利要求1所述的汉语电子大字典,其特征在于汉语电子大字典软件包括,检索、查询的检索系统,另外是各种字库部分,软件设计上采用了先进的光学字符识别技术,通过扫描得到的字形,与具有字形比对查询的检索系统进行快速查询,同时可以采用拼音和其他输入方式输入后进行快速查询,软件结构上,建立各个汉语字形与汉字解释的关联数据库,并通过相关各种异体字建立彼此对应的地址索引表,而达到快速查找数据的目的,最后将上述的软件系统中检索关系指令软件固化在芯片中供CPU调用;安装的字库包括完备的常用汉字字库有单字1万多字,各种专业汉字字库、古汉字文字库各种字库有单字、词5-10万多条,库中分别包含有每一个字的字义、字音,各种异体字、繁体字内容;软件的设计,让使用者可以给各个字库添加新的汉字条目、图形条目和词义解释,各种汉字字库存储在CPU的内存中,通过CPU的指令随时可以调用。
3、根据权利要求1所述的汉语电子大字典,其特征是其中的扫描器的机械器件和光学器件,硬件上采用了快速、低功耗的CPU和可以更换或增加的大容量内存或闪存FLASH,用软印制板实现电气连接,保证了扫描、翻译速度快且功耗低,同时安装了可连续扫描输入的扫描器和普通按键输入装置或小键盘,保证检索系统中的字形数据和拼音以及其他方式输入汉字后的快速查询功能得以实施,  同时将以上装置安装为一体,做成小笔记本或卡片大小,或做成筆形甚至与手机安装在一起的产品,产品通过USB接口或串口方式与计算机相连,可以进行在线操作或升级。
CN 200710077611 2007-01-23 2007-01-23 汉语电子大字典 Pending CN101021828A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710077611 CN101021828A (zh) 2007-01-23 2007-01-23 汉语电子大字典

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710077611 CN101021828A (zh) 2007-01-23 2007-01-23 汉语电子大字典

Publications (1)

Publication Number Publication Date
CN101021828A true CN101021828A (zh) 2007-08-22

Family

ID=38709600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710077611 Pending CN101021828A (zh) 2007-01-23 2007-01-23 汉语电子大字典

Country Status (1)

Country Link
CN (1) CN101021828A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425257A (zh) * 2012-05-24 2013-12-04 北京搜狗科技发展有限公司 一种生僻字符信息的提示方法和装置
CN109345451A (zh) * 2017-09-27 2019-02-15 牛毅 一种实现图像汉字拼接成词的系统及移动终端
CN109840326A (zh) * 2019-01-31 2019-06-04 浪潮软件集团有限公司 一种汉字字义、字音、字形的相似度比对系统及方法
CN110046361A (zh) * 2019-06-03 2019-07-23 杭州轻寻科技有限公司 一种具有全版面快速翻译功能的翻译笔
CN111681460A (zh) * 2020-06-28 2020-09-18 黑龙江工业学院 一种汉语言文化传播展示装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425257A (zh) * 2012-05-24 2013-12-04 北京搜狗科技发展有限公司 一种生僻字符信息的提示方法和装置
CN109345451A (zh) * 2017-09-27 2019-02-15 牛毅 一种实现图像汉字拼接成词的系统及移动终端
CN109840326A (zh) * 2019-01-31 2019-06-04 浪潮软件集团有限公司 一种汉字字义、字音、字形的相似度比对系统及方法
CN110046361A (zh) * 2019-06-03 2019-07-23 杭州轻寻科技有限公司 一种具有全版面快速翻译功能的翻译笔
CN111681460A (zh) * 2020-06-28 2020-09-18 黑龙江工业学院 一种汉语言文化传播展示装置

Similar Documents

Publication Publication Date Title
De Paiva et al. Openwordnet-pt: An open brazilian wordnet for reasoning
CN102016836B (zh) 管理电子形式的中文、日文及韩文语言数据的模组系统与方法
CN101206528A (zh) 用多种词汇之一以及解析模态对简化用户输入文本的处理
Dash et al. Utility and application of language corpora
Dexter et al. Quantitative criticism of literary relationships
CN101021828A (zh) 汉语电子大字典
CN102929865A (zh) 一种用于中文和东盟各国语言互译的pda翻译系统
Sacher Interactions in Chinese: designing interfaces for Asian languages
US9563282B2 (en) Brahmi phonemics based keyboard for providing textual inputs in indian languages
CN101055554A (zh) 一种电子词典
Kilgarriff Evaluating word sense disambiguation programs: Progress report
Nivre et al. Treebanking in Northern Europe: A white paper
Antworth et al. Software for doing field linguistics
Iglesias-Franjo et al. TIR over Egyptian hieroglyphs
Tichý et al. A lexico-semantic database of Czech: An interim report
Liu et al. Review and prospect of research on ancient book information processing in China
Zhang Computational Lexicography: From the Electronic to Digitalized Age
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Barman et al. Bengali reduplication generation with finite-state transducers (FSTs)
Brown et al. Active alice: using real paper to interact with electronic text
Love CHAPTER 10 APP-BASED AND ONLINE DICTIONARIES
CN1031228C (zh) 场景交际专用袖珍计算器
Shi et al. Chinese online-problems and solutions
Wu A partial syntactic analysis-based pre-processor for automatic indexing and retrieval of Chinese texts
CN102567510A (zh) 一种通过关联单字查询的装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20070822