CN1056007C - 一种以汉字音角特征为信息元的计算机汉字输入方法 - Google Patents
一种以汉字音角特征为信息元的计算机汉字输入方法 Download PDFInfo
- Publication number
- CN1056007C CN1056007C CN97109191A CN97109191A CN1056007C CN 1056007 C CN1056007 C CN 1056007C CN 97109191 A CN97109191 A CN 97109191A CN 97109191 A CN97109191 A CN 97109191A CN 1056007 C CN1056007 C CN 1056007C
- Authority
- CN
- China
- Prior art keywords
- key
- word
- sign indicating
- indicating number
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明以独体字和部首为构字部件拆分合体字,区分汉字内含构字部件的个数和结构,选取其部件字音和字形(用自然数字表示)特征信息代码组编字码,对应26个字母键和10个数字键输入,最短2码,最长6码,由其音形码式自然断开,输入国标繁简两体各2万个汉字无重码,输入全部规范的词组基本无重码,繁简两体任意选择,按码直接输入输出和相互转换输出不用切换;中英两种文字直接输入输出不用切换。
Description
本发明涉及一种汉字编码及其计算机键盘输入技术。
目前,汉字键盘输入技术,就提取汉字特征信息的方式,大致可分为提取汉字整字字音类特征信息编码的音码类和拆分汉字提取构字部件或字根等字形类特征信息编码的形码类两大基本类型。由音码和形码变形简单相加组成的音形码,同时具有音码和形码的基本特征,故不作为基本类型。
提取汉字整字字音类特征信息编码的音码类,包括汉语拼音全拼和各种简拼,包括音形码中的音码,存在的不足之处主要表现在只认识国家标准汉字简化字集2万多个单字的15%即3千个单字左右的广大用户,对其余的还不认识的单字无法使用音码输入。此外,简拼,包括双拼,需要记忆而难以记忆的规则较多,包括韵母与键元的对应分布规则,失去了易学性和输入流畅的特色。
拆分汉字提取构字部件或字根即字形类特征信息编码的形码类,包括音形码中的形码,具有代表性的如中国专利85105556表形码、中国专利85100837王码(五笔字形)、中国专利95103384田码、周志农先生设计的自然码、陈代宇先生设计的大众音形码、李公宜先生设计的交大李码、中国专利91109162启宏全息码等,存在的不足之处主要表现在随意将汉字拆分成字根或部件,随意将字根或部件以音托或形托方式对应键元分布定位,规则繁杂,无规律可循,难学难记,操作时的思维过程延长。
上述的音码类,形码类,包括音形码,同时还存在如下主要不足之处:1、字编码、词编码、字编码与词编码,重码率较高,未能实现盲打;2、无规律可循的“简码”,只有死记硬背才能应用,并需要多击一次断码键;3、编码输入的单字和词组的容量未能满足实用的需要,若增加库容量,重码率会急剧上升。
上述的汉字键盘输入技术存在的种种不足之处,其根本原因是对汉字固有的部件结构规律和音形统一规律这两大规律,及其辩证统一法则,缺乏科学的认识,仅仅依据对汉字的特征信息的表面认识主观随意地处理,犯了两个基本的错误,即不拆分汉字(如音码类)或随意拆分汉字(如形码类),背离了汉字固有的部件结构规律;单一地或片面地提取汉字字音类特征信息(如音码类)或字形类特征信息(如形码类),背离了汉字固有的音形统一规律。以对“土、士、事、
”5个字编码为例。若单一提取汉字的字形类特征信息,包括其笔形、笔画、结构,必有重码;若单一地提取汉字字音类特征信息,包括声母、韵母、声调,必有重码;若不拆分合体字,取其整字的音形特征信息,也必有重码。这5个字编码如此,将字编码扩展到6763个字,乃至国家标准汉字集繁简两体各2万多个字,更加如此。由于背离了汉字固有的部件结构规律和音形统一规律,使汉字编码规则失去了客观依据,为异化重码,不得不主观意断,又由于汉字的复杂性,汉字特征信息的多样性和多样可选择性,使各种主观方案似乎都具有某种客观性,由此,种种大同小异、繁杂无序、无规可循、码式单一僵化、编码空间缩小、重码居高不下、输入功能不足的汉字编码层出不穷,乃至“万码奔腾”。
本发明的目的是:提供一种以汉字音角特征为信息元的计算机汉字输入方法,它具有以下优点:1、字、词编码基本无重码;2、编码有规律性,不需死记硬背;3、字、词编码容量大。
为实现上述目的,本发明的解决方案为:它以汉字的部首和独体字或合体字作为构字部件拆分汉字,将单个汉字拆分为若干个部件,汉字单笔画、独立不是部首不是字的笔画群,不作为构字部件;单字以其构字部件为特征信息元、词组以其单字为特征信息元,取其字音类特征信息和字形类特征信息编制其特征信息元的特征信息代码,以“音形”码式和“形形”码式两种码式组编其字码和词码;将特征信息代码即字、词码中的声、形、韵码分布于计算机英文键盘“A-Z”26个字母键、“0-9”10个数字键和“<、>、?、;”4个符号键共40个键;
1)提取其特征信息元(部首部件取其名称第一字)汉语拼音声母的第一个字母和韵母的主母音字母,为其字音类特征信息的代码,即音码,分别为声码(简称为“声”)和韵码(简称为“韵”)。
2)提取其特征信息元上左、下左、下右、上右四角的笔形结构特征类信息,用“0~9”10个数字,分别为各角的笔形结构特征信息编制代码,称为形码(简称为“形”);数字与其笔形结构特征对应编码的法则是“横一撇二点捺三,叉四插五竖折六,角七八八横折九,独立方框小竖零”,即:
9=、
; 0=口、小、丨。
3)“音形”码式字编码,规范编码为5码等长,区分单个汉字内含的构字部件的个数和部件结构,选取构字部件的字音类特征信息代码和字形类特征信息代码,分别进行字编码,允许一字多码,即:
单部件字,即由一个部件构成的字,即独立体字部件和部首部件,取其部件声码,上左、下左、下右各角形码和韵码,依次以“声形形形韵”式排列,为其字码。
二部件字,即由两个部件构成的字,依次取其各部件声码,再取3个形码,依次以“声声形形形”式排列,为其字码;其3个形码的选取规则是:部首在左,不包括“虫、木、扌、氵”在左为部首的二部件字,取第一部件上左、第二部件上左、下右角形码;其它结构,包括“虫、木、扌、氵”在左为部首的二部件字,取其非部首部件上左、下左、下右各角形码。
三部件字,即由三个部件构成的字,依次取各部件声码,再取不是部首部件的两个部件各部件上左角形码,依次以“声声声形形”式排列,为其字码。
四部件字以上多部件字,依次取前四个部件各部件声码,取整字下右角形码,依次以“声声声声形”式排列,为其字码。
4)“音形”码式词编码,规范编码4码等长,区分词组单字个数选集其字音类特征信息代码和字形类特征信息代码,分别进行词编码,即:
二字词组,取各字声码和上左角形码,依次以“声形声形”式排列;
三字词组,取第一字声码,第二字声码和上左角形码,第三字声码,依次以“声声形声”式排列;
四字词组,取第一字声码,第二字上左角形码,后两字各字声码,依次以“声形声声”式排列;
五字以上多字词组,取第一字声码,第三字上左角形码,后两字各字声码,依次以“声形声声”式排列。
5)“音形”码式字词码中的声码、韵码和形码,即特征信息代码与计算机英文键盘“A~Z”26个字母键、“0~9”10个自然数字键对应分布为:声码和韵码按汉语拼音字母规则与键盘“A~Z”26个字母键一一对应,形码按自然数与键盘“0~9”10个数字键一一对应。
6)“形形”码式字编码,4码等长,区分单个汉字内含的构字部件的个数,单一选集构字部件字形类特征信息代码即形码,分别进行字编码,即:
单部件字,依次取其部件上左、下右、下左、上右四角形码,依次排列;
二部件字,依次取各部件上左、下右两角形码,依次排列;
三部件字,依次取各部件上左角形码和整字下右角形码,依次排列;
四部件以上多部件字,依次取前四个部件各部件上左角形码,依次排列。
计算机键盘上乙、丙、丁行中的“A~Z”26个字母键和“<、>、?、;”4个符号键共30个键,分别与甲行的10个数字键,从左到右,一一对应,为“形形”码式字编码中形码代用键。
本发明由于遵循汉字固有的部件结构规律,以汉字部首和独体字或合体字拆分汉字,维护了汉字的完整性、规范性、统一性,不随意乱拆分汉字;适应了不同用户的知识水平,包括识字率的需求,只要认识“亡、口、月、贝、凡”这些构字部件,就能使用“音形”码输入若不认识的“赢”字,奠定了提取汉字特征信息进行无重码的汉字编码的科学基础,如不拆分汉字或随意拆分汉字,都不可能实现无重码字词编码;奠定了汉字特征信息代码与键盘键位合乎规律的对应分布而无需死记硬背的科学基础;还由于遵循汉字固有的“一字一形”、“一字一音”、“音形统一”规律,同时提取构字部件字音类特征信息和字形类特征信息编制其特征信息代码,作为字词编码的集选要素,选集其特征信息代码组编字词码,使字词编码的码式活跃起来,特征信息代码即字词码的键盘键位分布活跃起来,编码空间容量增大,如单部件字以“声形形形韵”,二部件字以“声声形形形”,三部件字以“声声声形形”,多部件字以“声声声声形”即5码长编码空间分别为20万、40万、80万、160万个单字编码,若6码长,分别为200万、400万、800万、1600万个单字编码。
下面对本发明作进一步详细说明:
图1为本发明汉字特征信息元的一种键位分布方案。
图2为本发明汉字特征信息元的另一种键位分布方案。
图3为本发明汉字构字部件字形类特征信息代码规则一览表。
本发明系统规则如下:
一、汉字拆分规则。本规则的特征是:
1、本发明遵循汉字固有的“木、子→李”、“弓、长→张”这一部件结构规律,确定汉字的构字部件和按部件拆分汉字的规则,将汉字的合体字拆分成若干个部件,为汉字特征信息元。
2、本发明将独体字、汉字部首、合体字定义为构字部件,分别为独体字部件、部首部件、合体字部件;汉字单笔画、独立不是部首不是字的笔画群,不作为构字部件。
3、本发明定义的独体字部件,是指在不拆分汉字笔画的条件下不能够拆分成两个或两个以上单字或部首部件的单字即独体字,一个独体字为一个部件。独体字部件按其笔画间的结构形式,共分为如下四种:
其一,单笔画连接结构。如“日、月、万、方、人”。
其二,单笔画离散结构。如“川、小、心、三、八”。
其三,单笔画交叉结构。如“九、十、又、丰、冉”。
其四,笔画群混合结构。如“鼠、展、合、襄、并”。
4、本发明定义的部首部件,以1983年中国文字改革委员会与文化部出版局等单位联合制定的统一汉字部首为基础,酌情增删,确定汉字部首,一个部首为一个部件。本发明删去所有的拆分独体字的笔画所立的部首,将合体字左右结构中居右、上下结构中居下的即书写顺序最后书写的一个部件“刂、斗、阝、戈、见、卩、廴、斤、力、毛、黾、皿、鸟、攵、攴、皮、欠、犬、彡、殳、色、灬、瓦、心、页、羽、隹、辶、支”共29个部件作为部首部件,除此之外的合体字,均以汉字书写顺序的第一个部件为部首部件。本发明部首部件分为如下三类:
其一,独体字部首类。如“石、鸟、鼠、页、雨”。
其二,笔画群部首类。如“扌、氵、辶、刂、钅”。
其三,合体字部首类。如“鼻、麻、鼓、辟、敝”。
5、本发明定义的合体字部件,是指由上述的独体字部件和部首部件组成的字即合体字,充当另一个字的组成部分时,作为一个部件拆分,这个合体字即为合体字部件。如“孀”中的“霜”、“相”。
6、本发明将拆分汉字的方式,分为定式拆分和随机拆分两种。
将单个汉字内含的独体字部件和部首部件,不论其在字中的位置,逐一拆分,为定式拆分。
例:孀→女、雨、木、目;藻→艹、氵、口、口、口、木。
将单个汉字内含的合体字作为一部件拆分,为随机拆分。随机拆分,允许单个汉字有多种拆分,供用户选择。
例:藻→艹、澡; 艹、氵喿;艹、氵、品、木。
7、本发明将单个汉字按其拆分的内含的构字部件的个数,分为如下四类:
其一,单部件字。如“古、页、展、非、扌、艹、阝、刂”。
其二,二部件字。如“到→至、刂;李→木、子;”。
其三,三部件字。如“数→米、女、攵; 培→土、立、口”。
其四,四个部件以上,多部件字。如“樱→木、贝、贝、女;赢→亡、口、月、贝、凡”。
若随机拆分,“孀”可拆分为“女、霜”二个部件,“女、雨、相”三个部件;“樱→木、婴”二个部件。
二、汉字特征信息提取规则。本规则的特征是:
1、本发明遵循汉字固有的“一字一形、一字一音、音形统一”规律,同时提取汉字特征信息元字音类特征信息和字形类特征信息,作为汉字编码集选的要素。
2、本发明提取特征信息元(部首部件取其名称第一个字)汉语拼音声母的第一个字母和韵母的主母音字母,为其部件字音类特征信息的代码,分别为声码(简称为“声”)和韵码(简称为“韵”);无声母的部件用字母“R”作为其部件的声码。
例:天(TIAN)→TA 哀(AI)→RA 扌(提手旁)→TA
3、本发明提取特征信息元上左、下左、下右、上右四角各角笔形结构特征类信息,用“0-9”10个自然数字,分别为各角的笔形结构特征信息编制代码,称为形码,简称为“形”,自然数字与其笔形结构特征对应编码的法则,如图3所示,其法则用口诀表述是“横一撇二点捺三,四插五竖折六,角七八八横折九,独立方框小竖零”,即:
9=、
; 0=口、小、丨。
三、字编码规则。本规则的特征是:
1、本发明字编码以国家标准《信息交换用汉字编码字符集》全集的全部单字为字集,分常用汉字库和标准汉字库两级汉字库,以“音形”码式和“形形”码式两种码式统一编码。其常用汉字库为GB2312-80集即简化字集和GB12345-90集即繁体字集的全部单字。
2、本发明“音形”码式字编码,规范编码为5码等长,按上述的定式拆分或随机拆分的规则拆分汉字,区分单个汉字内含的构字部件的个数和部件结构,选取构字部件的字音类特征信息代码和字形类特征信息代码,分别进行编码,允许一字多码,即:
单部件字,即由一个部件构成的字,即独体字部件和部首部件,取其部件声码,上左、下左、下右各角形码和韵码,依次以“声形形形韵”式排列,为其字码。
例:土→T411U 士→S411U 事→S555U
二部件字,即由两个部件构成的字,依次取其各部件声码,再取3个形码,依次以“声声形形形”式排列,为其字码;其3个形码的选取规则是:部首在左,不包括“虫、木、扌、氵”在左为部首的二部件字,取第一部件上左、第二部件上左、下右角形码;其它结构,包括“虫、木、扌、氵”在左为部首的二部件字,取其非部首部件上左、下左、下右各角形码。
例:地→TY459 吧→KB079 邑→KB779 蛊→CM513
庆→GD488 氖→QN926 问→MK000 边→LZ446
颌→HY800 材→MC424 池→SY579
四部件字以上多部件字,依次取前四个部件各部件声码,取整字下右角形码,依次以“声声声声形”式排列,为其字码。例:樱→MBBN4
→WKYB9
→WKYN9 藻→CSKK3上述字编码,若不认识不常用的独体字类构字部件,即国家标准《信息交换用汉字编码字符集》基本集之外的第一至五辅助集所收列的独体字,无法确认构成合体字的某个独体字部件及其声码,以字母“V”为其声码的代码。
例:诀→YG358→YV358 抉→TG558→TV558
本发明“音形”码式的单字输入,以上述的5码等长的规范编码为基础,分常用汉字库和标准汉字库两级汉字库,简化字和繁体字两个系列,以无重码为原则,去其5码等长编码的冗余信息码,最短为2码,输入到位信号提示;若5码重码,定式拆分取其整字上右角形码为第6码,基本无重码,输入到位信号提示;随机拆分,重码字信号提示键选输入,即最长为6码。
4、本发明“形形”码式字编码,4码等长,区分单个汉字内含的构字部件的个数,单一选集构字部件字形类特征信息代码即形码,分别进行字编码,即:
单部件字,依次取其部件上左、下右、下左、上右四角形码,依次排列。例:甫→5063
二部件字,依次取各部件上左、下右两角形码,依次排列。例:脑→7646 鸽→8026
三部件字,依次取各部件上左角形码和整字下右角形码,依次排列。例:梧→4100 垫→5541四部件以上多部件字,依次取前四个部件各部件上左角形码,依次排列。例:樱→4774
→3077四、词编码规则。本规则的特征是:
1、本发明以输入公共词组库和可切换的单科专业词组库规范的全部词组无重码为原则,区分词组单字个数,分别编码。即:
二字词组,4码等长,取各字声码和上左角形码,依次以“声形声形”式排列。
例:国家→G0J3 事物→S5W2
三字词组,4码等长,取第一字声码,第二字声码和上左角形码,第三字声码,依次以“声声形声”式排列。
例:特殊性→TS1X 普遍性→PB3X
四字词组,4码等长,取第一字声码,第二字上左角形码,后两字各字声码,依次以“声形声声”式排列。
例:古代汉语→G2HY
五字以上多字词组,4码等长,取第一字声码,第三字上左角形码,后两字各字声码,依次以“声形声声”式排列。
例:中华人民共和国→Z8HG
上述各类词组,若4码重码,依次取其词组第1、2、3…各字下左角形码,为第5码、第6码……,输入到位信号提示。其编码空间,4码长20万条词组,5码长200万条词组,6码长为2000万条词组。
一字词,即“词组+词组+…”句式中的名词、动词、形容词、量词、代词、副词、介词、连词、助词类一字词,3码等长,取其上左、下右两角形码和声码,依次以“形形声”式排列;若3码重码,取其整字下左角形码为第4码。
例:你→20L 我→25W 他→29T 的→26D 地→49D 得→24D
2、本发明非规范词组由用户自定义词组进行编码,自定义词组的编码的词组单字最长不超过120个汉字。自定义词组缩码方法如下:
方法一,击单键“+”键,输入词组各字,击单键“+”键,自定义词组编码完毕,再输入时,输入其词组各字声码,击单键“+”键结束,即输入到位。
方法二,移动光标于自定义词组第一字处,击单键“+”键,移动光标于自定义词组最后一个字处,击单键“+”键,自定义词组编码完毕,再输入时,输入其词组各字声码,击单键“+”键结束,即输入到位。
五.汉字与其它文字兼容输入规则。本规则的特征是:
1、本发明将汉字特征信息代码即“音形”码式中的声码、韵码和形码,分布于计算机键盘“A~Z”26个字母键、“0~9”10个数字键和“<、>、?、;”4个符号键共40个键位,并将其40个键在键盘上的位置,分为英文键盘模式和中文键盘模式两种模式,以行列式定位,即:
A、英文键盘模式,不改变现通用的键盘键位分布,即:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 Q W E R T Y U I O P
丙行 A S D F G H J K L ;
丁行 Z X C V B N M < > ?
计算机键盘上乙、丙、丁行中的“A~Z”26个字母键和“<、>、?、;”4个符号键共30个键,分别与甲行的10个数字键,从左到右,一一对应,为“形形”码式字编码中形码代用键,如图2所示:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 Q-1 W-2 E-3 R-4 T-5 Y-6 U-7 I-8 O-9 P-0
丙行 A-1 S-2 D-3 F-4 G-5 H-6 J-7 K-8 L-9 ;-0
丁行 Z-1 X-2 C-3 V-4 B-5 N-6 M-7 <-8 >-9 ?-0
“音形”码的简化字和繁体字字词码中的声码和韵码按汉语拼音字母规则与其英文键盘“A~Z”26个字母键一一对应,形码按自然数与键盘“0~9”10个数字键一一对应输入,甲行左端的单键“~”键为汉字繁简两体选择输出的换档键:奇次键,输出为繁体字;偶次键,输出为简化字。
“形形”码式,单部件字码于甲行键位对应输入,重码字于乙行键选输入;二部件字、三部件字、多部件字的前3码于甲行键位对应输入,第4码依次分别于乙、丙、丁行键位对应输入,重码字于其本行键选输入。
B、中文键盘模式,将10个形码键排列于第1行即甲行,将20个声码键按字母顺序排列于中间两行即乙行和丙行,将5个韵码键、4个符号键和“V”键集中排列于第4行即丁行,即:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 B C D F G H J K L M
丙行 N P Q R S T W X Y Z
丁行 I U E A V ; ? < > O
计算机键盘上乙、丙、丁行中“A~Z”26个字母键和“<、>、?、;”4个符号键共30个键,分别与甲行的10个数字键,从左到右,一一对应,为“形形”码式字编码中形码代用键,甲行中的“1、2、3、4、0”键为韵码“I、U、E、A、O”代用键,如图1所示:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 B-1 C-2 D-3 F-4 G-5 H-6 J-7 K-8 L-9 M-0
丙行 N-1 P-2 Q-3 R-4 S-5 T-6 W-7 X-8 Y-9 Z-0
丁行 I-1 U-2 E-3 A-4 V-5 ;-6 ?-7 <-8 >-9 O-0
“音形”码的简化字与繁体字字词码中的声码对应乙、丙两行的字母输入,韵码和形码分别对应甲行的韵码代用键和10个数字键输入,输出为简化字;韵码和形码分别对应丁行的韵码键和形码代用键输入,输出为繁体字。
“形形”码的简化字和繁体字字码的输入同英文键盘“形形”码的输入。
2、汉语拼音文字输入规则:
在上述的汉字直接输入输出状态下,不用切换,汉语拼音文字按其字母规则对应英文键盘的字母键直接输入,4个符号键“<、>、?、;”依次分别为汉语拼音文字主母音字母的“1、2、3、4”各声调输入键,同时为其字符串输入的断开键,输出功能键。
3、英文输入规则:
在上述的中文输入输出状态下,不用切换,英文对应上述的英文键盘的字母键直接输入,单键“Alt”键为其字符串输入断开键,半角输出功能键和空格键;单键长形空格键为其字符串输入断开键,全角输出功能键和空格键。
4、支持“英→汉”直译软件的运行:
在上述的汉字输入输出和英文输入输出的状态下,不用切换,英文对应上述的英文键盘的字母键直接输入,单键“Ctrl”键为其字符串输入断开键,直译成汉字输出功能键。输出的汉字繁简两体仍由单键“~”键设定选择。
5、支持“汉→英”直译软件的运行:
经单键“F12”键奇次键切换,采用中文键盘模式,汉字按码对应其甲、乙、丙三行键位输入、英文对应其字母键输入,汉字按码对应其乙、丙、丁三行键位直接输入,直译英文输出。“F12”键偶次键退出。
6、自然数字和图形符号的输入规则:
A、单键长形空格键,为自然数字、英文字母和其它10个符号键,各键位标明的与之同档的图形字符全角输出键。
B、单键“Alt”键,为自然数字、英文字母和其它10个符号键,各键位标明的与之同档的图形字符半角输出键。
C、单键“Caps Lock键,为英文字母大小写输出换档键、自然数字键位切换成中文数字输出的换档键。
D、单键“Shift”键,为分布于10个数字键、26个字母键和其它10个符号键共46个键位上档标明的图形符号输出功能键:奇次键为全角输出,偶次键为半角输出。
E、单键“Tab”键,为分布于10个数字键、26个字母键和其它10个符号键共46个键位上档标明的图形符号输出功能键:奇次键为全角输出,偶次键为半角输出。
本发明汉字输入方法,与目前其它任何一种汉字键盘输入系统相比较,在输入功能及学用方便的程度方面,具有明显的特点和优势。主要有如下几点:1、键盘输入国家标准《信息交换用汉字编码字符集》全集繁简两体各2万多个单字,码长最短2码,最长6码,基本无重码。
2、键盘输入全部规范的汉语词组和专业单科词组,码长最短4码,最长6码,基本无重码;且与单字输入无重码。词组的规范编码空间,4码长为20万条词组,5码长为200万条词组,6码长为2000万条词组。
3、字词不等码长输入无重码,由其码式自然断开,无需记忆其“简码”,无需设置断码键,即少击一键,可盲打输入。
4、汉字繁简两体用户可任意选择,不熟悉哪是繁体字哪是简化字的陆、台、港用户,均可按码直接输入输出,按需相互转换输出,不用切换。
5、不用切换,中文(汉字和汉语拼音文字)与英文可交叉直接输入输出,键位标明的102个中文和英文图形符号(半角和全角)均可直接输入输出。
6、识字率不同的用户可任意选择音形码或形形码、可按定式拆分规则和随机拆分规则选择自感最方便的某种拆分方式,准确无误地拆字、识码和按码输入国家标准汉字集繁简两体各2万多个汉字。只要认识“亡、口、月、贝、凡”等1200个独体字和汉字部首的用户,就可以应用音形码输入如“赢”等不认识的合体字。
7、本系统规则的教学可与九年制义务教育同步进行。包括汉语拼音、汉字部首、汉字结构的教学。接受过九年制义务教育的用户,均可运用所学的知识掌握本系统汉字特征信息代码及其键位分布等系统规则,无需死记硬背无规律可循的字根分类及其字根的键位分布规则。
8、本系统的汉字拆分规则即定式拆分规则为压缩汉字库奠定了可行性基础,即只收若1200个构字部件即部首和独体字建立汉字库,以拼形方式输入合体字,压缩掉合体字所占用的字库空间。
Claims (5)
1、一种以汉字音角特征为信息元的计算机汉字输入方法,其特征在于:以汉字的部首和独体字或合体字作为构字部件拆分汉字,将单个汉字拆分为若干个部件,汉字单笔画、独立不是部首不是字的笔画群,不作为构字部件;单字以其构字部件为特征信息元、词组以其单字为特征信息元,取其字音类特征信息和字形类特征信息编制其特征信息元的特征信息代码,以“音形”码式和“形形”码式两种码式组编其字码和词码;将特征信息代码即字、词码中的声、形、韵码分布于计算机英文键盘“A-Z”26个字母键、“0-9”10个数字键和“<、>、?、;”4个符号键共40个键;
1)提取其特征信息元汉语拼音声母的第一个字母和韵母的主母音字母,为其字音类特征信息的代码,即音码,分别为声码和韵码;
2)提取其特征信息元上左、下左、下右、上右四角的笔形结构特征类信息,用“0-9”10个数字,分别为各角的笔形结构特征信息编制代码,称为形码;数字与其笔形结构特征对应编码的法则是:
9=、
; 0=口、小、丨;
3)“音形”码式字编码,规范编码为5码等长,区分单个汉字内含的构字部件的个数和部件结构,选取构字部件的字音类特征信息代码和字形类特征信息代码,分别进行字编码,允许一字多码,即:
单部件字,即由一个部件构成的字,即独体字部件和部首部件,取其部件声码,上左、下左、下右各角形码和韵码,依次以“声形形形韵”式排列,为其字码;
二部件字,即由两个部件构成的字,依次取其各部件声码,再取3个形码,依次以“声声形形形”式排列,为其字码;
三部件字,即由三个部件构成的字,依次取各部件声码,再取不是部首部件的两个部件各部件上左角形码,依次以“声声声形形”式排列,为其字码;
四部件字以上多部件字,依次取前四个部件各部件声码,取整字下右角形码,依次以“声声声声形”式排列,为其字码;
4)“音形”码式词编码,规范编码4码等长,区分词组单字个数选集其字音类特征信息代码和字形类特征信息代码,分别进行词编码,即:
二字词组,取各字声码和上左角形码,依次以“声形声形“式排列;
三字词组,取第一字声码,第二字声码和上左角形码,第三字声码,依次以“声声形声”式排列;
四字词组,取第一字声码,第二字上左角形码,后两字各字声码,依次以“声形声声”式排列;
五字以上多字词组,取第一字声码,第三字上左角形码,后两字各字声码,依次以“声形声声”式排列;
5)“音形”码式字词码中的声码、韵码和形码,即特征信息代码与计算机英文键盘“A~Z”26个字母键、“0~9”10个数字键对应分布为:声码和韵码按汉语拼音字母规则与键盘“A~Z”26个字母键一一对应,形码按自然数与键盘“0~9”10个数字键一一对应;
6)“形形”码式字编码,4码等长,区分单个汉字内含的构字部件的个数,单一选集构字部件字形类特征信息代码即形码,分别进行字编码,即:
单部件字,依次取其部件上左、下右、下左、上右四角形码,依次排列;
二部件字,依次取各部件上左、下右两角形码,依次排列;
三部件字,依次取各部件上左角形码和整字下右角形码,依次排列;
四部件以上多部件字,依次取前四个部件各部件上左角形码,依次排列;
计算机键盘上乙、丙、丁行中的“A~Z”26个字母键和“<、>、?、;”4个符号键共30个键,分别与甲行的10个数字键,从左到右,一一对应,为“形形”码式字编码中形码代用键。
2、如权利要求1所述的汉字输入方法,其特征在于:计算机键盘模式为:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 Q W E R T Y U I O P
丙行 A S D F G H J K L ;
丁行 Z X C V B N M < > ?时,
“Q、A、Z”键为形码“1”的代用键;
“W、S、X”键为形码“2”的代用键;
“E、D、C”键为形码“3”的代用键;
“R、F、V”键为形码“4”的代用键;
“T、G、B”键为形码“5”的代用键;
“Y、H、N”键为形码“6”的代用键;
“U、J、M”键为形码“7”的代用键;
“I、K、<”键为形码“8”的代用键;
“O、L、>”键为形码“9”的代用键;
“P、;、?”键为形码“0”的代用键。
3、如权利要求1所述的汉字输入方法,其特征在于:计算机键盘模式为:
甲行 1 2 3 4 5 6 7 8 9 0
乙行 B C D F G H J K L M
丙行 N P Q R S T W X Y Z
于行 I U E A V ; ? < > O
“B、N、I”键为形码“1”的代用键;
“C、P、U”键为形码“2”的代用键;
“D、Q、E”键为形码“3”的代用键;
“F、R、A”键为形码“4”的代用键;
“G、S、V”键为形码“5”的代用键;
“H、T、;”键为形码“6”的代用键;
“J、W、?”键为形码“7”的代用键;
“K、X、<”键为形码“8”的代用键;
“L、Y、>”键为形码“9”的代用键;
“M、Z、O”键为形码“0”的代用键;
甲行中的“1、2、3、4、0”键分别为韵码“I、U、E、A、O”的代用键。
4、如权利要求1所述的汉字输入方法,其特征在于:
汉语拼音文字按其字母规则对应英文键盘的字母键直接输入,4个符号键“<、>、?、;”依次分别为汉语拼音文字主母音字母的“1、2、3、4”各声调输入键,同时为其字符串输入的断开键,输出功能键。
5、如权利要求1所述的汉字输入方法,其特征在于:
英文对应英文键盘的字母键直接输入,单键“Alt”键为其字符串输入断开键,半角输出功能键和空格键;空格键为其字符串输入断开键,全角输出功能键和空格键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97109191A CN1056007C (zh) | 1997-08-01 | 1997-08-01 | 一种以汉字音角特征为信息元的计算机汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97109191A CN1056007C (zh) | 1997-08-01 | 1997-08-01 | 一种以汉字音角特征为信息元的计算机汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1178339A CN1178339A (zh) | 1998-04-08 |
CN1056007C true CN1056007C (zh) | 2000-08-30 |
Family
ID=5171001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97109191A Expired - Fee Related CN1056007C (zh) | 1997-08-01 | 1997-08-01 | 一种以汉字音角特征为信息元的计算机汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1056007C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1331025C (zh) * | 2002-03-07 | 2007-08-08 | 白定泉 | 拼音四角笔码(形)汉字输入法及其键盘设计 |
-
1997
- 1997-08-01 CN CN97109191A patent/CN1056007C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1331025C (zh) * | 2002-03-07 | 2007-08-08 | 白定泉 | 拼音四角笔码(形)汉字输入法及其键盘设计 |
Also Published As
Publication number | Publication date |
---|---|
CN1178339A (zh) | 1998-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1342276A (zh) | 键盘输入设备、方法和系统 | |
CN1056007C (zh) | 一种以汉字音角特征为信息元的计算机汉字输入方法 | |
CN102511021B (zh) | 一种数序码元键盘的信息输入方法 | |
CN1062361C (zh) | 音形派生键形码计算机汉字输入方法 | |
CN100339808C (zh) | U码汉字输入法 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1052314C (zh) | 一种汉字二维数码的计算机键盘输入方法 | |
CN1103181A (zh) | 多键并击式高速汉字输入方法及键盘装置 | |
CN1455358A (zh) | 华语拼音统一方案及单拼输入与智能转换翻译 | |
CN1825254A (zh) | 汉字输入法及其所用的计算机键盘 | |
CN1043016A (zh) | 汉字全息码 | |
CN1150441C (zh) | 字形笔顺码汉字输入法及其键盘 | |
CN1167994C (zh) | 一二三四输入法 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1553305A (zh) | 声形四码汉字计算机输入方法 | |
CN1648826A (zh) | 外国人汉字输入法及其键盘设计 | |
CN1015751B (zh) | 计算机汉字十笔字拼写输入方法 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1801050A (zh) | 输入国际语文文字的系统及方法 | |
CN1420422A (zh) | 码元用笔划集合数表示法及用途 | |
CN1175722A (zh) | 计算机中文通用输入法 | |
CN1054445C (zh) | 一种计算机汉字编码输入方法及其键盘 | |
CN1180185A (zh) | 汉字编码输入方法 | |
CN1204083A (zh) | 一套汉字编码输入法及其键盘和检字法 | |
CN1213102A (zh) | 汉语语素编码及其计算机键盘输入 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |