CN1039671A - 汉字自生编码及其识别机 - Google Patents

汉字自生编码及其识别机 Download PDF

Info

Publication number
CN1039671A
CN1039671A CN 88104585 CN88104585A CN1039671A CN 1039671 A CN1039671 A CN 1039671A CN 88104585 CN88104585 CN 88104585 CN 88104585 A CN88104585 A CN 88104585A CN 1039671 A CN1039671 A CN 1039671A
Authority
CN
China
Prior art keywords
character
chinese
spontaneous
autogenous
sign indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 88104585
Other languages
English (en)
Inventor
傅开武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inst No806 Shanghai Space Office Ministry Of Space Industry
Original Assignee
Inst No806 Shanghai Space Office Ministry Of Space Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inst No806 Shanghai Space Office Ministry Of Space Industry filed Critical Inst No806 Shanghai Space Office Ministry Of Space Industry
Priority to CN 88104585 priority Critical patent/CN1039671A/zh
Publication of CN1039671A publication Critical patent/CN1039671A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及汉字编码方法及其装置。其方法是将大小不同的标准印刷体汉字,经变焦距镜头把字幅调节到光电元件组成扫描模板尺寸,并对扫描模板进行同步扫描,随之输出二值化信息,经累加,合成为自生码。
本发明的汉字自生码编码装置由光电阅读头,X、Y向扫描电路,光电扫描模板,累加器,合成器组成。

Description

本发明涉及汉字编码方法及其装置。
用电脑识别汉字的技术至今在国内外尚未得到很好的解决。其原因在于汉字不象外国文字那样,仅由几十个不同的字母拼写而成。汉字是由长短不一的横、竖、撇、捺、勾、折和点等基本笔划,以不同的数量和位置在一方框内构成字形各异的4万多个汉字。这就给自动识别汉字带来了困难。近年来,国内学者对中文信息处理的研究,在输入方面先后提出过400多个编码方法或设想。如:见字识码,声韵部形码,五笔字形码,汉字拼形码,32键拼形码,拼音码,47键汉字拼音码,以及宏观字形码等。这些方案,大都需通过键盘输入,处理速度不高。与电脑的速度不匹配。为解决中文信息处理技术中的“瓶颈”问题,又有学者提出了象限端点特征与转动惯量特征法,数字条形法,划分映射法和最短路经等识别方案,它们大多是在进口或国产电子计算机的基础上,进行改装或添加附件来实现的。虽然它初步解决了机器代替人“写”的问题,但“看”的问题仍未解决。同时它还存在着容量不大,使用不简便等问题。国外对汉字识别技术也作过不少研究。先后提出过“周边分布频谱法”,“阶层模型重合法”和“加权相关法”等识别汉字的方法。这些方法却未能取得令人满意的效果。本发明为了识别数量巨大的汉字,对汉字的编码和识别提出了一种新的构思。
本发明提出了一种汉字自生编码方法和汉字识别装置。这种方法将大小不同的标准印刷体汉字,经变焦距镜头,把字幅调节到等于20×20只光电元件组成的正方形扫描模板的尺寸,并对扫描模板分为20行和20列同步扫描。这20×20只光电元件随之输出一系列二值化信息。对此信息分别沿行和列两个方向,按5比特为一组,用5位并行寄存器,对行和列进行扫描采样,得到X1X2…X80和y1y2…y80两列信息,然后将它们分别按先后顺序,送入X和y累加器中,按基数R=32的加法法则进行累加求和,其总和数分别为 FX和Fy
FX = Σ i = 1 i = 80 X i
Fy = Σ i =1 i = 80 y i
再将Fx和Fy,按Fx在前,Fy在后的顺序,送入合成器组合得到合成码FM。以此FM作为一个字符的特征识别码,代表所对应的字符。由于FM的产生是取决于字符自身的笔画结构,所以把FM称为汉字自生码。
这种自生码的编码装置如附图1所示,它由阅读头,X方向和y方向同步扫描电路和20×20只光电元件构成的扫描模板所组成。编码时将汉字置于阅读头下,阅读头如图2所示。汉字在光照下通过透镜成像于扫描模板。该模板上的20×20只光电元件便产生一系列二进制数,经X、y方向同步扫描电路对其采样,再经累加器和合成器便获得该汉字的自生码。
上述自生码的识别机,其原理如图3所示,它有控制器,自生码编码装置、存贮器、译码器,显示器以及打印设备组成,将被识别的字符置于光电阅读头下,经编码器编码,送入译码器,与存贮器中的编码比较后再送入读放电路,即可在显示器中显示或打印机输出。
使用本发明的方法及其装置,计算机识别汉字可省去人工编码,不需要人工通过键盘输入,这样不仅提高了计算机识别汉字的速度,同时使用十分方便,只要将字符置于光电阅读头下,便可进行字符识别,文件存贮,字符打印和字符的传递等一系列工作。对于使用者无需进行专门的输入训练。
附图1为汉字自生码编码装置的原理图。
图中:阅读头1,X-y方向扫描电路2,伺服机构3,扫描模板4,累加器5,合成器6,文件7。
附图2为光电阅读头示意图。
图中:文件7,光源8,反射镜9,自动对焦透镜组10,扫描模板4。
附图3为汉字自生码识别机系统图。
图中:自生码编码装置11,控制器12,存贮器13,译码器14,字形存贮器15,读放电路16,显示器17,打印机18,文件格式19,外存贮器20,文件7。

Claims (3)

1、一种汉字自生码编码法,其特征是将大小不同的标准印刷体汉字,经变焦距镜头,把字幅调节到等于20×20只光电元件组成的正方形扫描模板的尺寸,并将其分为20行和20列同步扫描,20×20只光电元件随之输出一系列的二值化的信息,经累加,合成为四位三十二进制的自生码。
2、一种汉字自生码识别机,其特征是由自生码编码装置,存贮器,译码器和显示器以及打印机设备所组成。
3、根据权利要求2所述的自生码识别机,其特征是自生码编码装置由光电阅读头,X方向扫描电路,y方向扫描电路,20×20只光电元件构成的扫描模板,累加器和合成器组成。
CN 88104585 1988-07-20 1988-07-20 汉字自生编码及其识别机 Pending CN1039671A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 88104585 CN1039671A (zh) 1988-07-20 1988-07-20 汉字自生编码及其识别机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 88104585 CN1039671A (zh) 1988-07-20 1988-07-20 汉字自生编码及其识别机

Publications (1)

Publication Number Publication Date
CN1039671A true CN1039671A (zh) 1990-02-14

Family

ID=4833058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 88104585 Pending CN1039671A (zh) 1988-07-20 1988-07-20 汉字自生编码及其识别机

Country Status (1)

Country Link
CN (1) CN1039671A (zh)

Similar Documents

Publication Publication Date Title
Mennens et al. Optical recognition of Braille writing using standard equipment
US4669901A (en) Keyboard device for inputting oriental characters by touch
KR880008124A (ko) 한문자(漢文字)를 선택, 기억 및 표시하기 위한 방법과 장치
CN1043210A (zh) 字根编码输入法及其设备
CN111709242A (zh) 一种基于命名实体识别的中文标点符号添加方法
KR830006737A (ko) 표의 문자 발생기
US4187031A (en) Korean (hangul) electronic typewriter and communication equipment system
CN103310678A (zh) 一种书写练习器及练习方法
CN111985470A (zh) 一种自然场景下的船牌矫正识别方法
CN111261000A (zh) 一种英语单词记忆训练系统
CN1072029A (zh) 五笔二维编码法及键盘
Belay et al. A Blended Attention-CTC Network Architecture for Amharic Text-image Recognition.
CN1039671A (zh) 汉字自生编码及其识别机
Stallings Chinese character recognition
Stallings The morphology of Chinese characters: a survey of models and applications
JPH0247788B2 (zh)
CN203250434U (zh) 一种书写练习器
TW324820B (en) Character pattern generating apparatus capable of easily generating characters of a plurality of different fonts
CN1052960A (zh) 华语自动分词注音新技术
CN100547523C (zh) 音形混合式输入法
Bourbakis ANAGNOSTIS—An automatic text reading system
CN1141448A (zh) 一种拼音笔画汉字输入方法及其所用键盘
EP0016067A1 (en) System for selecting graphic characters phonetically
CN85102847A (zh) 计算机汉字动态编码输入
CN1245305A (zh) 总笔划向量输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication