CN1008013B - 汉字信息拼码 - Google Patents

汉字信息拼码

Info

Publication number
CN1008013B
CN1008013B CN 87103491 CN87103491A CN1008013B CN 1008013 B CN1008013 B CN 1008013B CN 87103491 CN87103491 CN 87103491 CN 87103491 A CN87103491 A CN 87103491A CN 1008013 B CN1008013 B CN 1008013B
Authority
CN
China
Prior art keywords
symbol
chinese character
chinese
sign indicating
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
CN 87103491
Other languages
English (en)
Other versions
CN87103491A (zh
Inventor
颜敏政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN87103491A publication Critical patent/CN87103491A/zh
Publication of CN1008013B publication Critical patent/CN1008013B/zh
Expired legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明是用于电脑等信息设备的汉字拼码。它可以直接读懂,也可以用现行电脑一样大小的键盘输入给电脑。拼码可直接显示或打印,也可以译回汉字原文显示或打印。拼码是发音音标及汉字形旁以笔顺为原则并列而成的。汉字形旁由部首整理而出,用以分别同音字。

Description

要增进人们之间通过信息设备(包括打字机、电脑、电报打字机、电动排版机等)的信息交换效率,输入的媒介最好是一种能直接读懂的且符号不多的字母或拼码,例如像罗马字母。但汉字有好几万字,不容易输入。汉字的输入须要经过一种拼码,这种拼码不但要能直接读懂,不必经译码手续,而且必须正确不误的代表每个及所有的汉字,而且符号不多,能纳入双手可以操作的像英文电脑大小的键盘。
通过这种拼码,英文用的信息技术可以大众化地用于汉文。过去的各种汉字译码只解决了一部分问题。
本发明的主要目的是用少数的拼码符号来正确不误地代表每一个及所有的汉字,以便输入各种信息的设备。这种拼码可以直接读出,了解,表达意义,完全像一种文字。拼码包括发音符号及形旁符号。发音符号包括现通行的拼音(罗马字)符号,及以前用的注音符号。形旁符号是用来分别同音字的,每个汉字通常一个形旁,最多两个,依笔顺关系附在发音符号串的前后。
本发明的另一目的是提供一套拼码原则,并整理出一套实用的形旁符号。这些形旁是由部首推演出来的。很多仍像原来的部首,可以容易地辨认。请参见表1。
表1a
形码    拼音缩写    包括的部首
亠    TO    一丶二
亻 R 人欠
Figure 87103491_IMG2
九    JU    儿几丿乙兀无尢鬼乚
八 BA
Figure 87103491_IMG3
角羊父
力    L    (工)
刂    D    刀介
饣 BO
Figure 87103491_IMG4
勹己巳(色)
十    SH    干斗幸士克
S 水冫川巛
Figure 87103491_IMG6
口    K    曰舌齒
土    T    (生)
大    DA
女    NU
子    ZI    孑孓(亅)
宀    A    穴冖
山    SN
巾 JN
广    AN    厂尸舍
弓    GN
阝    E    耳卩邑阜音
忄    X    心
扌    SO    手艹門又殳寸彐聿隶()
犭 Q 犬豕 虍牛羊
Figure 87103491_IMG9
C
Figure 87103491_IMG10
艹青麻
个    ZU    竹
UI 飛非
戈    G    弋矛
木    M    片果
攵    PU    文攴夂攵
日    RI    白
歹    DI
毛    MO    髟彡(耂)
表1b
形码    拼音缩写    包括的部首
气    QI
火    H    赤黑光
Figure 87103491_IMG13
Z 足 辶走廴疋彳亍爪癶止舛
王    YU    玉王
月    UE    肉骨夕
Figure 87103491_IMG15
ME 門戶
四 SF 囗(西)(
田    TN    里
疒    CU
皮 P 革
Figure 87103491_IMG17
Figure 87103491_IMG18
MN 皿匚 缶臼
Figure 87103491_IMG20
鼎瓜鬲凵
目    MU    見
石    SR
示    SK
禾    HE    禾香麥
立    LI    辛
米    MI
纟    SI    糸(幺)
ZO 舟
Figure 87103491_IMG22
CG 虫
I 衣(
Figure 87103491_IMG25
Figure 87103491_IMG26
贝    B    貝
讠    Y    訁
车    CH    車
Figure 87103491_IMG27
YO 酉鹵
钅    J    金
Figure 87103491_IMG28
IU 雨
页 YE 頁身首面自(鼻)(
饣    SW    食
马    MA    馬
Figure 87103491_IMG30
U 魚
Figure 87103491_IMG31
乌 N
本发明的另一目的在于提供一种输入汉字的键盘及连用的汉字信息设备。信息设备的输入可以用各种方式,如声音输入,但键盘仍然是最通用的。键盘上有本发明的拼码符号及空格键,来分开各汉字间的拼码。请参见表2。信息设备附有存贮器,其中存有每个汉字及所有汉字字形和其拼码。如此可以有选择地把汉字本身及其拼码显示或打印出来。
表2
Figure 87103491_IMG33
本发明的其他目的,优点及细节可以根据下文得到更清楚的理解。
以下是附图说明及实施例。
图1甲及乙:列出各形旁符号及其拼音缩写和包括的部首。
图2:列出冂
Figure 87103491_IMG34
(m ù)的同音字译成本发明的拼码,包括注音连形旁,拼音连形旁及拼音连形旁的拼音缩写。
图3:本发明的拼码键盘之一。
图4甲:利用本发明的注音符号拼码一文实例。
图4乙:利用本发明的拼音符号拼码一文实例。
图5:本发明的代表性的信息设备图。
下面是本发明的详细情况及应用。
本发明可把汉字拼码化,以便用于信息设备。本发明的拼码把汉字译成可以直接读出的形、音符号。因为这些拼码代表汉字的完全发音及所属的形旁,所以叫形音拼码。该形音拼码可以完全不误地再译回原来的汉字。
图5代表可用与本发明的一种信息设备。键盘30打入的信号由电线44传到显示器46,另一电线48连接键盘30与打印机50,可以命其打印形音拼码,如要汉字原文,可按“字”键38。拼码的文件编辑,可以直接用键盘30在显示器46作业。
拼码可以用电线52传到一个处理机54加以处理及传递。可以是有线的或无线的通讯路线56传递到一个接受器58,接受器58由电线60接到打印机50,可以打出处理过的拼码文件。这部分的信息设备,除了键盘上的符号及其布置外,与其它现有的英文设备一样。
本发明加了一个字典记忆及翻译器64,其中存有所需要的汉字 的字形与拼码,按下键盘上的“字”键38,可以经电线62命令翻译器64把在显示器46上的拼码文章变成汉字原文,或把汉字原文变成拼码文章。汉字原文的信号是从存贮器64由电线66传到显示器46,信号也可以转到处理及传送器54,以便加以处理,传送及打印出汉字原文。
现回到字码,字码用的音符,最好是按照民族形式的音标,像注音符号及四声,但其它发音符号也可以,例如现在英文字母拼音方式式,这些音符是用来表达汉字的完全发音,在大部分的字典中都可以找到(也可以是方言的及少数民族的汉字发音)。本发明所举的例子是用普通话(北京话)以注音符号说明。因为汉字中有太多的同音字,单独用这些发音符号来当拼码是不能够完全正确的来代表所有的汉字。
本发明的拼码应用一组形旁符号,附加在音符的旁边,来区别不同的同音字,作为分类,如此可以正确地把每个汉字拼码化。
这一组形码是由214个字典中常用的部首演化出来的。有此形码是由部首变形而来的,但仍然可以认出。这些形码可以说是汉字边旁的浓缩,可以用来当部首。本发明现在选用图1甲及乙中的64个形旁符号当形码。
本发明还提供选择这些形旁的原则及程序:在字典常用的214个部首中选出汉字最多的部首,没被选中的部首可归类到被选中的部首中。大部分被选中的部首保留原来的形式,小部分变了些形式,以更适合代表归类下来的部首群。这些部首群的归类至少符合下列一个条件:(1)它们由同样的古字演变而来;(2)它们在演变过程中有过同样的意义;(3)它们是同意或同形;(4)它们有部分笔划是相同的;(5)它们可以互通,或经常被互相误用。
在形码选择过程中,先选出一组形码,再探测性地把字典中所有的汉字用本发明的字码化原则(下述)译成拼码,再在已选出的这组形码中再选出及合并出一组更少的形码,再用这一组形码把汉字拼码化,一直重复到所需的形码由部首中被浓缩出来。最终目标是以最少的形码,以最高度的可认性及直接可读性,来把所有汉字拼码化。
汉字既多又复杂,到现在还没有一套完满的归类法。如果只用过于简单的原则,譬如把一个部首放在注音符号的前面,甚至采用字典中所有的214个部首也无法完全把同音字加以区别。
本发明的拼码不只是形、音码的符号的选择,而且对它们之间的相关位置也加以布置。这些拼码符号可以是单独一个符号代表一个汉字,或几个符号排列出来代表一个汉字,本发明现采用下列六个排列方式:
(1)一个形码排在几个或一个音码的前面;
(2)一个形码排在几个或一个音码的后面;
(3)几个或一个音码单独排列,没有形码;
(4)几个或一个音码,由一个形码带头,及另一个形码在后;
(5)一个形码;
(6)二个形码相连,没有音码。
上面是以被采用次数多少列出来的。前四个排列方式可代表95%以上的汉字。最后两个没有音码,在第五方式中的形码本身就是汉字,按照该汉字发音。在第六方式中,有两个形码符号,第二形码本身也是汉字,由它代表发音。在第四或第六方式中的两个形码,它们的符号可同可不同。
下面是汉字拼码化的原则,用他们把汉字译成上述六个排列方式拼码。
甲、形码原则
一、如两个同音汉字有同样的一个形码并且其形、音码间又有同样的笔顺关系,比较少用字可再加一个形码以加区别。这个再加的形码叫作形标。例如“芃”为屮夂乚九′,而“蓬”字为屮夂
Figure 87103491_IMG35
。这两个汉字同发音,也同属“屮屮”部带头。“芃”已比“蓬”少用,所以加一个形标“九”。
二、字典内有些汉字的部首是误编的,需要修改,以代表较正确的边旁意义。新的边旁当然是由原来汉字中找出。如“暮”为冂ㄨ ;应为“日”边,不是字典中的“屮屮”部。
三、一部分少用的部首已收入代表同意或同形的形码,如“鼎”部已拼入“皿”码。如果不是很明显的话,最好少用这种形码代表。这种形码代表可以用作形标。例如“鼐”为ㄋㄞ ,及“耐”为了ㄞ
Figure 87103491_IMG38
四、如果没有更好的方法选择形码,笔画多的汉字译成多一点形码,如“繫”为车丅丨
Figure 87103491_IMG39
,但“系”为丅丨
Figure 87103491_IMG40
五、如果必须在可能的几个形码中选择,则应尽量选用意义而尽少用笔顺来选择,如“翟”为ㄓㄜ
Figure 87103491_IMG41
。如意义选择不明,才用第一个笔顺的形码,如“仇”为亻彳
Figure 87103491_IMG42
六、每一个汉字的字码,最多有两个形码符号,一在音码前面,一在后面。
乙、音码原则
一、拼码中的发音部分代表汉字的完全发音,包括声调符号。声调符号一般是加注在韵母上,但本拼码法加注在最后一个非声调符号上,以便造词用。普通话中的第一声符号在本字码是不必注明的。如加以注明则表示(1)在好几个字的词中用来作字间的界线;(2) 在形码上注明是第一声发音;(3)在词中最后一个字上(或单独字上)注明是轻声。
二、每个形码都有一固定的发音,一个汉字可能由一个或两个形码(没有音码)组成拼码。最后一个形码又用来代表发音,如“荔”为屮力。
三、破音字有不同发音,可以译成不同的拼码。不但音码不同,形码也可能不同。如“吃”为口彳或口
Figure 87103491_IMG43
丙.选字码优先次序
把一个汉字译成拼码时,应依照下列优先次序选择符号:
一、0.如果一汉字与一形码相同,应该译成该形码,如“力”为力。
一、一.如一汉字由两个形码组成,且以第二形码为发音,应译成该两个形码,且同样笔顺,如“码”为石    马。
二、0.其次是选一形码与音码结合组成拼码。形码在音码的前后取决于原汉字的笔顺。如“悯”为忄ㄇ丨
Figure 87103491_IMG45
或“愍”为ㄇ丨ㄣ
二、一.如果由笔顺无法分别在前在后,形码应在音码之前,如“辩”为讠ㄐ丨
三、其次是一个形码后再加一个形码作发音符号,如“荔”为屮力。
四、再其次是译成音码而不带形码。一汉字如不能很明显的辨别其部首,应归这一优先,“民”为ㄇ丨
五、0.最后的优先是,如前二.0.二、一、所译成的拼码仍无法分别两汉字的话,用第二形码做形标,如“谕”为讠凵
Figure 87103491_IMG49
,但“语”为讠
Figure 87103491_IMG50
五、一.形标位置也按照原来汉字的笔顺,如“蜇”为扌ㄓㄜ
Figure 87103491_IMG51
六、越是常用字越有优先选择次序,如“芋”为屮 ,“蓣”为屮凵
Figure 87103491_IMG53
这些原则如文法原则一样,可有例外,但只在必要时又无法避免时才有例外。
拼码符号是一个个由左至右显示出来的,但其它排列也可以,如由上至下,或由右至左。
本发明现选择了图1的64个形码,其包括的部首则列在其右栏,有些在括号内的部首是用来做形标的,应少用。
要把一个汉字,如“暮”(图2.21),译成拼码,先把音码译下(图2.20)。这发音可以在字典中找出。形码最好是依照字典中该字的部首。但由于疏忽,本字破例列入“屮屮”部。在本字内又可找到“日”,甚至“大”等部首成分。但“暮”字与“日”的关系比与“屮屮”或“大”密切多了(其实“暮”是从日,莫声)。所以本发明选“日”为该字形码。根据笔顺原则,这形码附在音码后面,声符则加注在形码上(最后一个非声调符号),如图2.22所示。一般说,这就完成了一字的拼码化。
图2列出ㄇ义音的13个同音字与拼码。“木”字(图2.23),字码也是“木”,因它本身就是一形码。“目”字(图2.28),也是一样,译成“目”。“沐”字(图2.24)由两个形码“讠”及“木”组成(图2.26),根据音码原则乙、二,第二形码“木”代表发音,其他图2的汉字都译成一个形码及其注音符号。“牧”字(图2.25)属于“牛”部首,已拼入“犭”码,所以“牧”字译成犭ㄇ义(图2.27)。由此可看出,每个汉字都可正确地译成拼码,每一拼码可正确地代表单独一个汉字。
有些字群,像“芋”与“蓣”,同音同形码,加上音、形码的笔顺关系相同,所以“蓣”的字码加了一个形标以区别,为屮凵
Figure 87103491_IMG54
,而“芋”为屮
Figure 87103491_IMG55
。如此这两个字就译成不同的两个拼码。在整个字典中,这种形标占很少数量。
拼码由图3代表的键盘输入。键盘30有字键32,排成五个水平行及十二个垂直列,有一个空档键34,可以输入空格,也有一个高低键36,可以控制在键上高的一个符号或低的符号。另外还有一个“汉字”键38,按下时可把显示的拼码回译成汉字原形,再按下时,又显示拼码。
其他现在通用的符号如标点及数目没在图3中表示(数目可以像现在通用电脑一样摆在右边的一方格上,阿拉伯数字在低键,汉字数在高键)。这些通行的符号可放在图3中未加利用而标注“C”的键上。
下面的说明中,水平行由上往下数,垂直列由左往右数。
最常用的是声调符号,故放在右手食指控制的键上,即第八列、第二到五行的下键。其次是发音符号,放在第二到第五行,除声调符号及标点符号“C”以外的下键上。
所有上键都放有一个形码符号,最常用的四个形码放在第一行的下键上(从第七列到第十列)。
要打入一个音码,只要按下所要的键,要打入一个形码,要按下所要的键并同时加按上下键36。拼码符号的输入与译成的拼码次序一样的一个个符号打入。如此打入每个汉字,然后再按空白的档键34。在由几个汉字组成的词或人名地名中,每个汉字的拼码可以一串打入,中间不需空白,这时,声调符号就变成一个个汉字界限。
本发明的拼码加上标点,可以当一般文字使用。图4甲翻译了 “西游记”的一小段故事:借棒记。美猴王,孙悟空用“闭水法”到海底的水晶宫去,要向海龙王借一些武器。图4乙是以拼音代替注音符号,其中形码符号也可以用图1中的拼音缩写(罗马字大写)来代替。
本发明所选择的实用方式已经在上面作了清楚的描述,本发明不仅仅是所述的例子,其范围由下列权利要求所概括。

Claims (12)

1、把一个个汉字输入信息设备内的方法,其特征在于包括下列的步骤:
1)把键盘上的拼码符号分成两组,第一组用来注明汉字的完全读音,包括声调,及第二组用来表示汉字的边旁;
2)如果一个汉字与一个第二组符号相同者,由该第二组符号单独代表;
3)如果一个汉字由两个第二组符号同样笔顺组成,且以第二个第二组符号为发音,由该二个第二组符号代表;
4)如果一个汉字不能以以上方法代表者;则把一个汉字的发音,包括声调,用几个第一组符号加以完全注音;
5)再由第二组中,选出一个符号,依照该符号在该汉字中的笔顺,加附在已选出的第一组注音符号的一边,来表示该汉字的边旁;如该汉字没有明显的边旁时,不加第二组符号;
6)在由一个第二组符号及几个第一组符号仍无法分别该汉字与其同音,同边旁及同笔顺字时,可再由第二组符号中加选一个符号作为形标,加附在第一组注音符号的另一边;以及
7)把所选出的一个个符号,输入该信息设备内,打入的次序是:所选的该第二组符号,所选的几个第一组中的非声调符号,所选的第二组符号,最后是该第一组中的声调符号。
2、权利要求1的方法,另加上输入空白来分开每汉字间的拼码,及把输入的符号,依照打入的次序显示出来。
3、权利要求1的方法中,其第一组符号是汉字拼音方案的符号,包括声调符号。
4、权利要求1的方法中,其第一组符号是注音符号,包括四声符号。
5、权利要求1的方法中,其第二组符号是部首。
6、权利要求5的方法中,其第二组符号,是把近200常用的部首,加以归类而浓缩出来,由可以收入通用键盘上的少数的形码代表一个个部首群:这些部首群的归类至少符合下列一个条件;(1)它们由同样古字演变而来;(2)它们在演变过程中有过同样的意义;(3)它们是同意或同形;(4)它们有部分笔划是相同的;(5)它们可以互通,或经常被互相读用。
7、权利要求1的方法中,第二组符号,是由第一组符号加以特别的标明来代替。
8、权利要求7的方法中,所用的符号是英文字母,大写来代替一组符号,小写代替另一组符号。
9、权利要求2的方法中,再加把输入的拼码与所储存的所有汉字翻译成的拼码,加以比较,而检定出所代表的一个汉字,而把该汉字显示出来。
10、一种信息处理设备,包括:
由键盘和显示器组成的输入装置:中央处理及控制装置:字典记忆装置及翻译装置;以及由打印机构成的输出装置:
该信息处理设备的特征在于:
所述键盘包括代表着汉字的形符、音符及调符的各个输入键和空格键;所述中央处理及控制装置根据从键盘输入的信号依输入次序在显示器上显示所代表的符号及空格;所述字典记忆装置中存有所需用的各个汉字的内码及其字形信号:所述翻译装置中存有与该汉字相对应的内码及拼字组信号,拼字组信号与内码信号之间在翻译器中互相对译;每个汉字的拼字组信号的组成是,前面最多只有一个形符信号;接着是最多只有一系列代表一个汉字完全发音的音符信号组;后面是最多只有一个形符的信号;最后是代表调符的信号;所述中央处理及控制装置在输入的信号中找出代表调符的及空格的信号,而把代表每个汉字的拼字组信号分开而输入翻译器;所述键盘上还包括一个汉字键,它控制中央处理及控制装置和记忆翻译装置,把输入的拼字组信号变成汉字字形信号在显示器上或打印机上把字形显示出来或打印出来。
11、权利要求10的设备内的键盘,包括盘上的64形码符号。
12、权利要求11的设备内的键盘上的音码符号,是汉语拼音方案的符号。
CN 87103491 1986-05-19 1987-05-14 汉字信息拼码 Expired CN1008013B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86430586A 1986-05-19 1986-05-19
US864305 1986-05-19

Publications (2)

Publication Number Publication Date
CN87103491A CN87103491A (zh) 1988-03-30
CN1008013B true CN1008013B (zh) 1990-05-16

Family

ID=25342967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 87103491 Expired CN1008013B (zh) 1986-05-19 1987-05-14 汉字信息拼码

Country Status (2)

Country Link
JP (1) JPS6312060A (zh)
CN (1) CN1008013B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63259310A (ja) * 1987-04-13 1988-10-26 Rinnai Corp ガスバ−ナ

Also Published As

Publication number Publication date
JPS6312060A (ja) 1988-01-19
CN87103491A (zh) 1988-03-30

Similar Documents

Publication Publication Date Title
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1008013B (zh) 汉字信息拼码
CN1387109A (zh) 盲文数码(小键盘)输入法
CN1166997C (zh) 汉字免拆分快速输入法
CN1075896C (zh) 以词为单位的音形意汉字计算机输入法
CN1267807C (zh) 一种用汉字及部首读音编码的汉字输入方法
CN101055499A (zh) 音形汉字输入法
CN1347023A (zh) 二笔手写智能输入系统
CN1108551C (zh) 优化赋音形码计算机汉字输入方法
CN1118085A (zh) 可用数字键盘输入的汉字输入系统及其键盘
CN1288185A (zh) 音形字理码汉字输入方法
CN1056007C (zh) 一种以汉字音角特征为信息元的计算机汉字输入方法
CN1055434A (zh) 字符的图元输入方法及其键盘
CN1026829C (zh) 中文头尾码输入法及其键盘装置
CN1023669C (zh) 一种字元拼形计算机中文输入法
CN1062797A (zh) 文字输入键盘及方法
CN1175722A (zh) 计算机中文通用输入法
CN1825254A (zh) 汉字输入法及其所用的计算机键盘
CN1317631C (zh) 整体拼形汉字输入法
CN1114146C (zh) 一种汉语语素编码计算机键盘输入法
CN1162766C (zh) 一种汉字音形编码输入方法
CN1279427C (zh) 多维汉字编码输入法
CN1110809A (zh) 汉字结构笔顺数字和部首偏旁混合编码方法及其键盘
CN1246759C (zh) 一种采用根素码的计算机汉字输入方法
CN1104353A (zh) 形声汉码输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C13 Decision
GR02 Examined patent application
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee