CN85102853B - 手写汉字实时输入装置及输入方法 - Google Patents
手写汉字实时输入装置及输入方法 Download PDFInfo
- Publication number
- CN85102853B CN85102853B CN85102853A CN85102853A CN85102853B CN 85102853 B CN85102853 B CN 85102853B CN 85102853 A CN85102853 A CN 85102853A CN 85102853 A CN85102853 A CN 85102853A CN 85102853 B CN85102853 B CN 85102853B
- Authority
- CN
- China
- Prior art keywords
- stroke
- code
- conductor
- row
- individual character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Character Discrimination (AREA)
Abstract
手写汉字实时输入计算机的装置包括一个有按行、列相间排列的导体的矩阵字盘及一个有导电体笔头的笔状物体。当笔头与字盘平面接触时,就使某些行、列结点被导通。当写字时,笔头在平面上移动,被导通的结点坐标也随之移动。通过判别坐标移动的方向和距离就能辨认所写的笔画。手写汉字实时输入计算机的方法由于用了二次变码、字首码分页索引等手段,使内存开销很小,每个单字的内码仅16位二进制码,某些字可用多种笔顺书写,且输出无一重码。
Description
本发明是一种计算机识别书写字符的装置及方法。
近几年来,日本国对手写文字实时输入计算机的装置及方法进行了一些研究。
《日本公开特许公报》昭58-1280介绍了一种装置,其结构是在写字盘的下方支以数个压力传感器,根据各传感器受力分布的情况可计算出笔头在字盘平面上的座标。
《日本公开特许公报》昭58-64581介绍了另一种装置,其结构是使笔头部分发出光或超声波,在字盘的两角安装两个自动跟踪光源或声源的传感器,根据传感器转动的角度计算出笔头的座标。
以上二种装置不但结构本身比较复杂,且需用模/数转换器、运算放大器等电路,成本较高,使用条件也较苛刻。
《日本公开特许公报》昭57-125474介绍了一种在线汉字认识系统。该系统推荐一种输入装置的结构是用装在笔头部位的传感器去检测字盘发出的脉冲调制的电磁波,通过信号滤波能检测出笔头的座标。据说,所确定的座标还是比较精确的,但其结构也嫌过于复杂。特别是在写完一个笔画后,提笔高度需稍高,否则易将提笔后的笔头移动也误认为是有效笔画。
根据笔头座标方向的变化,可识别出所写的笔画。上述系统共归纳了42种笔画,且进而又归纳了72种用数个笔画组成的记号要素。当计算机将所写单字的笔画编组成的记号要素与存储在机内由记号要素索引的字典对照时,便可查出所写单字的目的代码。但是,用这种方法写一个“臣”字,就要用5个记号要素组成内码,即需要40位二进制码。笔画更多的字,码就可能更长。因此,不仅编制字典工作量大,为存储机内字典所耗费的内存开销也太大。此外,该系统的方法也难以辨认汉字中由相同笔画组成的同码字。
本发明的目的是要研制出一种结构简单、使用可靠的手写汉字输入装置。本发明的另一目的是要研制出一种能以极少的内存容量存储大量汉字及输出无一重码的输入方法。
本发明的组成如图1所示。当笔〔2〕与字盘〔1〕接触时,字盘上就有一个行与列的结点被接通,该行、列数即被视为即时笔头的座标。程序〔3〕是用来跟踪笔头座标及辨认笔画的。当一个笔画写完提笔后,即将原型笔画码及特征点座标寄存起来并使笔画计数器加1。当一个单字写完后,程序〔7〕将所寄存的种类较多的原形笔画码变码为几种较少的笔画代码。然后按机内字典所规定的字首笔画码索引页面。程序〔9〕将去掉字首笔画码后的余码进行第二次变码以变成更少几种笔画码,并按规则编出内码。当所写单字无同码字时,就可在字典中所索引到页面内查出所写单字的目的代码。若所写单字有同码字,则查出的是一个鉴别重码的子程序标志码,由于同一文种各个单字字形各不相同,故经鉴别重码后,可输出所写单字的唯一一个目的代码而无一重码。
现将本发明详细叙述如下:
本发明的输入装置包括一个接触式16×16矩阵字盘和一个笔状物体。
矩阵字盘供写字的一个平面上布有行列垂直、相间排列且相互绝缘的导体。字盘可用一叠齿状导体及若干镶嵌在齿状导体凹槽内的带状导体组成,各带状导体按长度方向未与齿状导体接触的一面及齿状导体齿顶的端面共同形成供写字的字盘平面。字盘也可简单地用一块双面铜箔板制成,其行、列导体即由板上的铜箔线条组成。在工艺条件许可时,可增加矩阵的行、列数,以提高分辨能力。
笔状物体的一端用导电体制成。相当于起一个笔头的作用。
当笔头与字盘平面相接触且接触面积的直径大于两行及两列的间距时,就能保证有一个以上的行、列结点被导通。
对字盘不时地扫描寻找导通的行、列结点,即可追踪笔头的座标位置。当书写某一笔画时,笔头座标发生移动,通过计算机对座标移动方向、距离的判断,即可识别出点、横、竖、撇、捺等笔画。若在上述笔画之后,笔头座标移动方向发生变化,则又可转化为其它笔画。每一种笔画用一种数码表示,则在写完一个笔画时,可得到一个代表这一笔画的原型笔画码。
当笔头与字盘脱离接触时,说明一个笔画已经写完,这时就将原型笔画码及该笔画的特征点座标(包括起始点座标、终点座标及转折点座标等)一起寄存起来,并使笔画计数加1,然后等待下一笔画或“字写完”信号到来。
为了识别各个不同的单字,笔画码的种类应多些,但在编内码时,笔画码的种类一多,内码就长,必然增大机内字典内存的开销。本发明的一个特征就是将上述原型笔画码进行二次变码。第一次变码是将原型笔画码变为横、竖、点(捺)、撇、顺折、逆折等六、七种笔画码,称为I型变码。当使用者发出“字写完”信号(例如按一个小键)则计算机就取出所寄存的原型笔画码进行第一次变码,并将I型变码存放在另外的寄存器单元内。
与以部首索引页面的查普通印刷字典的方法相似,本发明的另一特征是用字首笔画码(即各单字按笔画顺序的第一笔画至某一笔画的一个或数个笔画码)索引各单字的机内字典的页面。例如将字首笔画依次为横、撇、竖、顺折、横等5个笔画的所有单字归并于一个页面,则凡是写以“石”字为首的汉字(如矽、矾、磷、泵、石……等)时,都被引导到这一页面来。要注意的是“右、百、有、厘、夏……”等非以石字为字首但有相同字首笔画的单字也被归并至这一页面内。这样做的好处一是字首笔画码不再需要被编进每个单字的内码。因此大大缩短了机内字典内单字内码的字长。二是将查找内码的范围由数千字缩小至一个页面的数十个字,节省了查找时间。三是写字首边傍时可用多种笔顺。例如将字首笔画依次为点、竖、点及点、点、竖的字都引导到同一页面,则以竖心傍“忄”为边傍的字,其边傍可用以上任一种笔顺书写。
第二次变码是将Ⅰ型变码进一步归纳为横、竖、点(撇、捺)、折等四种Ⅱ型变码。这样做的用意主要是进一步缩短笔画码的字长,使有限的内存能够存取更多的笔画信息。此外,也可使某些单字有多种写法。如“英、刘、列、秦……”可写成“英、刘、列、秦……”等字形。当然这样一来,可能会造成一些本来是不同笔画的单字被编为相同内码,即发生重码。好在所写的原型笔画码已被寄存起来了,故一旦发生这种情况时,仍可藉助所寄存的原型笔画码鉴别重码。
本发明有一个笔画计数器,在手写文字的同时,每个单字的笔画数被自动记录下来,故与单字笔画数相关的数码可以作为编内码的一个组成部分。内码的其余部分是用去掉字首笔画码后的6个剩余笔画码(Ⅱ型变码)组成。当剩余笔画码不足6个时,用“0”补齐。
计算机自动编出内码后,就转入在指定的机内字典页面内对照查表。若所写的单字在该页面内无重码,就可直接查到所要得到的目的代码。若所写的单字在该页面内有重码,所查到的是一个鉴别重码子程序的标志码及需引用的笔画序数等数据。上述标志码将程序引导到某个鉴别重码子程序的入口地址。子程序有的是以某一笔画的原型笔画码为鉴别依据,有的是以某一、二个笔画的某特征点为鉴别依据,也有以某一、二个笔画的长度或斜率为鉴别依据的,不一而足。但通过鉴别重码后,就可得出所写单字的唯一一个目的代码以供输出了。
综上所述,本发明由于用了接触式字盘和笔,输入装置非常简便可靠。又由于用了二次变码、字首码索引页面等手段,使内存开销很小,每个单字的内码仅16位二进制码,输出无一重码,且有的单字可用多种笔顺书写而只用一个内码。本发明可方便地扩展文字容量及将本发明移植应用于其它文种。
附图简要说明如下:
图1是本发明的主要组成部分框图。
图2是一种用齿状导体及带状导体组成的字盘的示意图。
图3是一种用双面铜箔板制成的字盘的俯视图。
图4是一种笔状物体的剖视图。
图5是字盘与计算机连接的接口的电原理图。
图6是一些笔画代码二次变码的示意图。
图7是一部分用字首笔画码索引页面的框图。
图8是一种内码编码规则示意图。
图9是一部分字典的存储单元的内容的示意图。
下面是本发明的一个最佳实施例。通过举例予以描述本发明输入装置的结构的细节及手写输入汉字的方法。
图2是一种接触式16×16矩阵字盘的示意图。其行导体用16片齿状导体制成,在其凹槽内镶嵌了16片带状导体作为列导体。各导体均相互绝缘。而各带状导体按长度方向未与齿状导体相接触的一个表面及齿状导体齿顶的端面共同组成了供手写文字的平面ABCD。
图4是一个笔状物体的剖视图。它有一个用导电橡胶制成的可更换的笔头。
当笔头与字盘的供写字的平面相接触且接触面的直径大于两行及两列的间距时,就有一个以上的行、列结点被导通。在图2中若接触面为P所包括的面积时,则有第10、11行与第11、12列相交的4个结点被导通。
当书写文字而使笔头在该平面上移动时,被导通的结点在平面上的座标也随之移动。
在图5中,其接口电路的工作原理一般来说,可先使某一列输出为“0”,其它各列输出为“1”,然后检查各行输入中是否有“0”电平的行输入,如果没有,则使另一列输出为“0”,并重复上述扫描过程。例如,为手写“旭”字的第一笔画,当笔头落笔于P1点时,第4列与第14行的结点被导通,当第4列输出为“0”时,可检测到第14行输入为“0”,从而得到起始点座标P1(14,4)。不时重复扫描就可跟踪笔头的即时座标。当笔头移动到P2(9,4)点时,可判出是向下移动了5格,所写的笔画是一竖,但笔头再从P2点移动到P3(4,1)点时,可判出是向左下方向移动,所写的笔画已转为长撇丿了。等这一笔画写完提笔后,由于扫描不到“0”电平的行,就可将笔画丿的原型笔画码05及起始点座标P1、终点座标P3寄存起来。同理,第二笔画的笔头座标从P4点移至P,点时,可辨出笔画为,原型笔画代码为OB。用上述方法写完一个“旭”字,就可得05、0B、02、09、01、01等6个原型笔画码。
使用者按下“字写完”小键后,计算机即将上述原型笔画码进行第一次变码,所得到的Ⅰ型变码为3、5、2、5、1、1,如图6所示。
第一次变码后,计算机就进行由字首码索引寻找页面。在图7中可看出“旭”字可归并于以字首笔画Ⅰ型变码为3、5的页面内,并得到页面的首地址、字节数及字首笔画码数02H。
二次变码是将去掉字首笔画码后的余码变为Ⅱ型变码。由图6可看出其Ⅱ型变码是2、0、1、1。由于余码数小于6个,故补以2个“0”,变为2、0、1、1、0、0。
图8是计算机编制单字内码的组成规则。内码以16位二进制数组成。其高4位是与笔画数相关的数И=总笔画数-字首笔画码数-4。而当И<0时,则使И=0;又И>15时,使И=15。“旭”字的И=0。内码的低4位为余码的最后二个Ⅱ型变码,而中间8位则是余码的起首4个笔画的Ⅱ型变码。故“旭”字的内码被编为0000100001010000,即0850H。
由图9可查出在规定的机内字典页面内,内容为0850H的存储单元地址为An。假如所写的单字无同码字,则在An+K为地址的存储单元中就是所需要输出的目的代码。但由于“旭”字与“旮”字及“旬”字均为同码字,故尚需进一步鉴别重码。现在An+K单元中的内容为E12BH,由于其值大于D000H,故可判断出这是一个鉴别重码的子程序标志码。标志码E1引导到该子程序的入口,而2B的作用是将第2原型笔画码与OBH值比较,若第2原型笔画码<0BH则所写的单字的目的代码存子An+K+2单元中,(图9中该单元内容为4914,即为“旬”字的目的代码)而“旭”字的第2原型笔画码=0BH,故可查得An+K+4单元中内容为EF32。这又是一个子程序标志码,其作用是将第3笔画起始点行座标与第2笔画终点的行座标相比较,若第3笔画起始点在下,则所写的单字的目的码在An+K+4+2单元中,否则则存在An+K+4+4单元中。现在,前一单元的内容为7424即“旮”字的目的代码。而后一单元中的内容4881则正是所写的“旭”字的目的代码。
作为本实例的一种变换,本发明的字盘可简单地用如图3的一块双面铜箔板制成。正面有16条平行的铜箔直线条作为行导体,在每相邻两行之间有16个与行导体平行排列的小铜箔作为列导体。反面有16根与行导体相垂直的铜箔直线条,反面的每根线条通过金属化孔将正面与此线条同方向的16个列导体导通,使字盘正面形成16条与行导体相垂直又与行导体相间排列的列导体,作为供写字用的平面。
Claims (10)
1、一种用于手写汉字实时输入计算机的装置,其由一个以行、列形式相互垂直、相间排列又相互绝缘的导体做成的矩阵字盘及一个笔状物体组成,其特征在于用导电体制成的笔头与矩阵字盘平面相接触且接触面的直径大于两行及两列导体的间距时,就能使一个以上的行、列结点被导通,当写字时,笔头在平面上移动,被导通的结点在平面上的座标也随之移动。
2、如权利要求1中所述的装置,其特征在于矩阵字盘可用一叠齿状导体及若干镶嵌在齿状体凹槽内的带状导体组成,各导体均相互绝缘,各带状导体按长度方向未与齿状导体接触的一面及齿状导体齿顶的端面共同形成字盘的用于写字的平面。
3、如权利要求1中所述的装置,其特征在于矩阵字盘可用一块双面铜箔板制成,其正面有若干平行的铜箔线条作为行导体,每两行之间有若干与行导体平行的列导体,其反面有若干与行导体相垂直的铜箔线条,每根线条通过金属化孔与正面的若干列导体相导通,使在正面形成若干条与行导体相垂直且相间排列的列导体。
4、如权利要求1中所述的装置,其特征在于笔状物体有一个用导电橡胶制成的可更换的笔头。
5、一种通过辨认在字盘上手写汉字的笔画且将汉字实时输入计算机的方法,其特征在于由笔画码及笔画数为因子的单字内码是以各单字的字首笔画码为索引而进行分页的,若同一页面内有同码字,则用子程序鉴别重码。
6、如权利要求5中所述的方法,其特征在于用于分页的字首笔画码是用各单字按笔画顺序的第一笔画至某一笔画的一个或数个笔画码所组成的。
7、如权利要求5中所述的方法,其特征在于各单字的内码是用去掉字首笔画码后的全部或部分剩余笔画码作为组成部分的。
8、如权利要求5中所述的方法,其特征在于各单字的内码是用与各单字笔画数相关的数码作为组成部分的。
9、如权利要求6或7中所述的方法,其特征在于字首笔画码及剩余笔画码是将较多种类的原形笔画码经过一次或二次变码后变成的横、竖、撇、点(捺)、折等少数几种基本笔画码。
10、如权利要求5中所述的方法,其特征在于用来鉴别重码的子程序是用原形笔画码、特征点座标位置、笔画长度或笔画斜率等因素作为鉴别依据而编制的。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN85102853A CN85102853B (zh) | 1985-04-01 | 1985-04-01 | 手写汉字实时输入装置及输入方法 |
GB08607784A GB2175426A (en) | 1985-04-01 | 1986-03-27 | A real time input device for handwritten chinese characters |
JP61074095A JPS6379126A (ja) | 1985-04-01 | 1986-03-31 | 手書き漢字の実時間入力コンピユ−タ装置及びその入力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN85102853A CN85102853B (zh) | 1985-04-01 | 1985-04-01 | 手写汉字实时输入装置及输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN85102853A CN85102853A (zh) | 1986-09-10 |
CN85102853B true CN85102853B (zh) | 1988-07-13 |
Family
ID=4792807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN85102853A Expired CN85102853B (zh) | 1985-04-01 | 1985-04-01 | 手写汉字实时输入装置及输入方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JPS6379126A (zh) |
CN (1) | CN85102853B (zh) |
GB (1) | GB2175426A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104134081A (zh) * | 2014-07-31 | 2014-11-05 | 广东小天才科技有限公司 | 一种手写输入内容的拼读方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE570229A (zh) * | 1957-08-14 | |||
GB860254A (en) * | 1958-10-21 | 1961-02-01 | Arthur James Betts | Improvements in means for producing signals from hand-written characters |
GB1404460A (en) * | 1972-11-28 | 1975-08-28 | Standard Telephones Cables Ltd | Device for transmitting cursive script or drawi'g over a telephone |
GB1420581A (en) * | 1974-02-08 | 1976-01-07 | Marconi Co Ltd | Pressure sensitive devices |
GB1494901A (en) * | 1974-04-30 | 1977-12-14 | Suisse Horlogerie | Data entry and decoding system |
GB1601806A (en) * | 1977-05-31 | 1981-11-04 | Nippon Telegraph & Telephone | Tablet input devices |
-
1985
- 1985-04-01 CN CN85102853A patent/CN85102853B/zh not_active Expired
-
1986
- 1986-03-27 GB GB08607784A patent/GB2175426A/en not_active Withdrawn
- 1986-03-31 JP JP61074095A patent/JPS6379126A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN85102853A (zh) | 1986-09-10 |
JPS6379126A (ja) | 1988-04-09 |
GB8607784D0 (en) | 1986-04-30 |
GB2175426A (en) | 1986-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR910007752B1 (ko) | 문자인식시스템 | |
KR890002815A (ko) | 음성 인코딩 및 합성시스템 | |
CN1104791A (zh) | 一种数据处理用的二维代码纸 | |
JP2737173B2 (ja) | 記号列照合装置とその制御方法 | |
CN104376336B (zh) | 一种手写识别的方法及手写笔 | |
Sutherland | Computer inputs and outputs | |
CN85102853B (zh) | 手写汉字实时输入装置及输入方法 | |
CN111312062B (zh) | 一种插杆式灾害现场伤情信息标识装置 | |
US20090060339A1 (en) | Method of organizing chinese characters | |
CN214253474U (zh) | 一种语言学习用发音辅助装置 | |
JPS6453283A (en) | Handwritten character input device | |
JPS6095689A (ja) | 光学的文字読取装置 | |
CN85107060B (zh) | 写入和传送手写笔迹的点阵方法 | |
CN1003403B (zh) | 翻译方法 | |
Sebeok et al. | Computer research in psycholinguistics: Toward an analysis of poetic language | |
Preusse | DATA BASES | |
CA1044806A (en) | Electronic digital system and method for reproducing languages using the arabic-farsi script | |
JPS57100567A (en) | Character reader | |
JPS6450180A (en) | Handwritten graphic recognizing method | |
Stone | Standards for computer-aided content analysis: The Pisa conventions and recommendations | |
CN118314582A (zh) | 模型训练方法、版面要素检测方法和系统、电子设备 | |
JPS63314685A (ja) | 放射状バ−コ−ド | |
CN1204812A (zh) | 多级智能字符串比较方法 | |
JPS5762467A (en) | Character reader | |
JPS6444579A (en) | System for extracting character information described in cad drawing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C13 | Decision | ||
GR02 | Examined patent application | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |