CN1039671A - 汉字自生编码及其识别机 - Google Patents
汉字自生编码及其识别机 Download PDFInfo
- Publication number
- CN1039671A CN1039671A CN 88104585 CN88104585A CN1039671A CN 1039671 A CN1039671 A CN 1039671A CN 88104585 CN88104585 CN 88104585 CN 88104585 A CN88104585 A CN 88104585A CN 1039671 A CN1039671 A CN 1039671A
- Authority
- CN
- China
- Prior art keywords
- character
- chinese
- spontaneous
- autogenous
- sign indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明涉及汉字编码方法及其装置。其方法是将大小不同的标准印刷体汉字,经变焦距镜头把字幅调节到光电元件组成扫描模板尺寸,并对扫描模板进行同步扫描,随之输出二值化信息,经累加,合成为自生码。
本发明的汉字自生码编码装置由光电阅读头,X、Y向扫描电路,光电扫描模板,累加器,合成器组成。
Description
本发明涉及汉字编码方法及其装置。
用电脑识别汉字的技术至今在国内外尚未得到很好的解决。其原因在于汉字不象外国文字那样,仅由几十个不同的字母拼写而成。汉字是由长短不一的横、竖、撇、捺、勾、折和点等基本笔划,以不同的数量和位置在一方框内构成字形各异的4万多个汉字。这就给自动识别汉字带来了困难。近年来,国内学者对中文信息处理的研究,在输入方面先后提出过400多个编码方法或设想。如:见字识码,声韵部形码,五笔字形码,汉字拼形码,32键拼形码,拼音码,47键汉字拼音码,以及宏观字形码等。这些方案,大都需通过键盘输入,处理速度不高。与电脑的速度不匹配。为解决中文信息处理技术中的“瓶颈”问题,又有学者提出了象限端点特征与转动惯量特征法,数字条形法,划分映射法和最短路经等识别方案,它们大多是在进口或国产电子计算机的基础上,进行改装或添加附件来实现的。虽然它初步解决了机器代替人“写”的问题,但“看”的问题仍未解决。同时它还存在着容量不大,使用不简便等问题。国外对汉字识别技术也作过不少研究。先后提出过“周边分布频谱法”,“阶层模型重合法”和“加权相关法”等识别汉字的方法。这些方法却未能取得令人满意的效果。本发明为了识别数量巨大的汉字,对汉字的编码和识别提出了一种新的构思。
本发明提出了一种汉字自生编码方法和汉字识别装置。这种方法将大小不同的标准印刷体汉字,经变焦距镜头,把字幅调节到等于20×20只光电元件组成的正方形扫描模板的尺寸,并对扫描模板分为20行和20列同步扫描。这20×20只光电元件随之输出一系列二值化信息。对此信息分别沿行和列两个方向,按5比特为一组,用5位并行寄存器,对行和列进行扫描采样,得到X1X2…X80和y1y2…y80两列信息,然后将它们分别按先后顺序,送入X和y累加器中,按基数R=32的加法法则进行累加求和,其总和数分别为 FX和Fy
再将Fx和Fy,按Fx在前,Fy在后的顺序,送入合成器组合得到合成码FM。以此FM作为一个字符的特征识别码,代表所对应的字符。由于FM的产生是取决于字符自身的笔画结构,所以把FM称为汉字自生码。
这种自生码的编码装置如附图1所示,它由阅读头,X方向和y方向同步扫描电路和20×20只光电元件构成的扫描模板所组成。编码时将汉字置于阅读头下,阅读头如图2所示。汉字在光照下通过透镜成像于扫描模板。该模板上的20×20只光电元件便产生一系列二进制数,经X、y方向同步扫描电路对其采样,再经累加器和合成器便获得该汉字的自生码。
上述自生码的识别机,其原理如图3所示,它有控制器,自生码编码装置、存贮器、译码器,显示器以及打印设备组成,将被识别的字符置于光电阅读头下,经编码器编码,送入译码器,与存贮器中的编码比较后再送入读放电路,即可在显示器中显示或打印机输出。
使用本发明的方法及其装置,计算机识别汉字可省去人工编码,不需要人工通过键盘输入,这样不仅提高了计算机识别汉字的速度,同时使用十分方便,只要将字符置于光电阅读头下,便可进行字符识别,文件存贮,字符打印和字符的传递等一系列工作。对于使用者无需进行专门的输入训练。
附图1为汉字自生码编码装置的原理图。
图中:阅读头1,X-y方向扫描电路2,伺服机构3,扫描模板4,累加器5,合成器6,文件7。
附图2为光电阅读头示意图。
图中:文件7,光源8,反射镜9,自动对焦透镜组10,扫描模板4。
附图3为汉字自生码识别机系统图。
图中:自生码编码装置11,控制器12,存贮器13,译码器14,字形存贮器15,读放电路16,显示器17,打印机18,文件格式19,外存贮器20,文件7。
Claims (3)
1、一种汉字自生码编码法,其特征是将大小不同的标准印刷体汉字,经变焦距镜头,把字幅调节到等于20×20只光电元件组成的正方形扫描模板的尺寸,并将其分为20行和20列同步扫描,20×20只光电元件随之输出一系列的二值化的信息,经累加,合成为四位三十二进制的自生码。
2、一种汉字自生码识别机,其特征是由自生码编码装置,存贮器,译码器和显示器以及打印机设备所组成。
3、根据权利要求2所述的自生码识别机,其特征是自生码编码装置由光电阅读头,X方向扫描电路,y方向扫描电路,20×20只光电元件构成的扫描模板,累加器和合成器组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88104585 CN1039671A (zh) | 1988-07-20 | 1988-07-20 | 汉字自生编码及其识别机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88104585 CN1039671A (zh) | 1988-07-20 | 1988-07-20 | 汉字自生编码及其识别机 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1039671A true CN1039671A (zh) | 1990-02-14 |
Family
ID=4833058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 88104585 Pending CN1039671A (zh) | 1988-07-20 | 1988-07-20 | 汉字自生编码及其识别机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1039671A (zh) |
-
1988
- 1988-07-20 CN CN 88104585 patent/CN1039671A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mennens et al. | Optical recognition of Braille writing using standard equipment | |
US4669901A (en) | Keyboard device for inputting oriental characters by touch | |
KR880008124A (ko) | 한문자(漢文字)를 선택, 기억 및 표시하기 위한 방법과 장치 | |
CN1043210A (zh) | 字根编码输入法及其设备 | |
CN111709242A (zh) | 一种基于命名实体识别的中文标点符号添加方法 | |
KR830006737A (ko) | 표의 문자 발생기 | |
US4187031A (en) | Korean (hangul) electronic typewriter and communication equipment system | |
CN103310678A (zh) | 一种书写练习器及练习方法 | |
CN111985470A (zh) | 一种自然场景下的船牌矫正识别方法 | |
CN111261000A (zh) | 一种英语单词记忆训练系统 | |
CN1072029A (zh) | 五笔二维编码法及键盘 | |
Belay et al. | A Blended Attention-CTC Network Architecture for Amharic Text-image Recognition. | |
CN1039671A (zh) | 汉字自生编码及其识别机 | |
Stallings | Chinese character recognition | |
Stallings | The morphology of Chinese characters: a survey of models and applications | |
JPH0247788B2 (zh) | ||
CN203250434U (zh) | 一种书写练习器 | |
TW324820B (en) | Character pattern generating apparatus capable of easily generating characters of a plurality of different fonts | |
CN1052960A (zh) | 华语自动分词注音新技术 | |
CN100547523C (zh) | 音形混合式输入法 | |
Bourbakis | ANAGNOSTIS—An automatic text reading system | |
CN1141448A (zh) | 一种拼音笔画汉字输入方法及其所用键盘 | |
EP0016067A1 (en) | System for selecting graphic characters phonetically | |
CN85102847A (zh) | 计算机汉字动态编码输入 | |
CN1245305A (zh) | 总笔划向量输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |