CN1677327A - 活字输入系统 - Google Patents

活字输入系统 Download PDF

Info

Publication number
CN1677327A
CN1677327A CN 200410033077 CN200410033077A CN1677327A CN 1677327 A CN1677327 A CN 1677327A CN 200410033077 CN200410033077 CN 200410033077 CN 200410033077 A CN200410033077 A CN 200410033077A CN 1677327 A CN1677327 A CN 1677327A
Authority
CN
China
Prior art keywords
word
stroke
chinese character
sign indicating
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410033077
Other languages
English (en)
Inventor
林声闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200410033077 priority Critical patent/CN1677327A/zh
Publication of CN1677327A publication Critical patent/CN1677327A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本方案采用的汉字规则信息完全是大众所熟知的汉字信息,和人们日常交流中对汉字拆分解释说法完全一致。它没有人为编造出某些的与人们所熟知通用的汉字规则信息相悖的规则。所以学习很容易。由于码长短,拆字编码无歧义,而输入按键又直接与坐标位置对应。所以输入速度极快。

Description

活字输入系统
本发明涉及汉字编码输入系统
方块汉字的输入编码,是将汉字进行分解,再逐级选取其中信息作为编码元素,而每个汉字所含信息量是巨大的,所以,汉字编码方案有很多种。现今社会上编码现状是:易学难用,易用难学。究其原因,在于拆解汉字编码过份集中在汉字的某方面信息上。编码发明者为了减少码长和重码率,人为地设计或固化某些不明确或非通用难记忆的规则。俗话说:江山易改,本性难移,因规则非通用性而大大影响编码的易学性和实用性。其实,因汉字信息量大,只有突破传统方法,精选几方面的信息又有针对性地辅选某方面信息进行拆解组合编码。在充分利用键盘键容量基础上,辅以少量人为调整组合拆分编码。就能达到易学易用快速输入目的。
目前的键盘输入法主要有3种:音码、形码、音形码。音码以声母或以韵母为独立编码元素,重码率高,输入慢;形码以部件或笔画编码,记忆量大,较难学习;由此可见,音形码是编码研究的重点。目前音形码的一种为二笔输入法,其音码必须熟悉英文键盘。其形码所定义的某些笔画书写顺序与人们书写习惯不相符,规则混乱难记。
本发明目的在于设计一种极其简单的编码方法,使其码长很短而重码率不致过高,并且能够兼顾专业输入,能够充分发挥现有的各种编码快速输入手段。
本发明核心在于:采用汉字公认明确、广泛通用的信息作为编码基础,以汉字自身特征为背景,有针对性地对这些信息进行多维分解组合编码,在充分利用键盘键位容量的基础上,进行适当调整,形成一种杂而不乱、易学易用的编码方案。
汉字拆解编码过程是汉字组字的逆过程,其组字过程如下:笔画一→字部一→双部字一→多部字。字部是由一次不间断地连续写成的若干笔画复合连接交叉所形成的相对不变的结构(绝大多数都是古汉字的基本图形衍变而来的)。双部字和多部字通称为组合字。本编码采用4种汉字信息:拼音、结构分部、字部、笔画。笔画采用最传统的简易分法将汉字笔画分成横、竖、撇、点、折五大类(捺笔归入撇)。这5种笔画再两两组合成25种双笔画。汉字拆分遵循“直观为主,二字先分;成字优先,大字在前;拆分在前,拆连在后;逢交不拆,上大右大。”的原则。对于组合字则依其总体结构一次性拆分为前后两大部,如上下、左右、里外结构,将其上、左、外作为一个整体,称为前部。将其下、右、里作为一个整体称为后部。对上中下、左中右结构字。如果上中、中下;左中、中右结构均不能组合构成一个较小的字。则依上大右大原则,拆分为上中、下;左、中右两大部。以上中、左为前部;下、中右为后部。
笔画含一、乙等单笔字;字部含口、目、大等单部字。对于单笔字和单部字我们不再拆分。为了明确区分单部字和组合字我们规定:非末笔且分离的单笔画不再拆分。结构相当紧密的汉字为单部字,字形界线不明显的汉字也看作单部字。
由汉字构字规律可知,书写时以某些双笔画开头的汉字字部极多,且组字频率高;而以另外一些双笔画开头的汉字字部较少,为了使各个键位汉字均匀分布,减少重码率,特设适当数量的字部(大部份是偏旁部首和一些重新定义的部类码),作为比笔画优先的编码元素;并且分开定义到笔画元素及特设码对应键。以横竖开头的字部,如果先写的横笔和竖笔不相连,依此我们把它们从横竖类字部中分离出来,另称为横竖分笔,记作“—分”。例:“邴”字的字部编为“—分”。以撇折开头的字部,如果该折笔含有勾笔画,依此我们把它们从撇折类字部中分离出来,另称为撇勾,记作“ノ亅”。例:“勾”字的字部编为“ノ亅”。以横、“竖勾”两笔画开头的字部,依此我们把它们从横折类字部中分离出来,则称为横竖勾,记作“一亅”。例:“丁”字的字部编为“一亅”。以横撇开头的字部,如果先写的横笔和撇笔相交,依此我们把它们从横撇类字部中分离出来,另称为横撇叉笔,记作“—叉”。例:“龙”字的字部编为“—叉”。对“氵、艹、口”3个组字频率高的字部,当字的底线处有带钩的笔画,则称为有勾水、有勾草、有勾口,记作“氵2、艹2、口2”;没有带钩笔画的,则称为无钩水、无钩草、无钩口,记作“氵1、艹1、口1”。例:“吴”字“口”字部编为“口1”;“清”字“氵”字部编为“氵2”。依此我们把它们定义到不同的键码上。这些特设字部均从含字较多的双笔画字部中选出,调配到含字较少的笔画码或特设码对应键。
以下为本发明编码实施方案。形码部分:将25个双笔画组合和5个单笔画结合键位座标安排到最靠近手指的30个按键中,另定义(ノ+1)、(ノ+2)、(—+)三个特加码,+表示特加码。同时定义“九、金、木、水、火、土、氵、艹、亻……”等字部的代码,如下表。
    字部 笔画代码     字部 笔画代码
钅十 (口1) 丨丶
木刂 (口2) 丨
水(氵1)鸟 ノ丨
(—分)火 九匕乃长 ノノ
土士工 (ノ亅) +1
(艹1)(一叉) —丶 亻几 +2
衤衤礼 — 立立 丶丨
(一亅)扌手辶 —+ 宀广 丶ノ
山  贝 丨— (艹2) 丨
日  目 丨丨 (氵2) 丶
虫口(方框) 丨ノ
当拆分笔画时遇到这些字部,优先按其代码对应键,不再拆分笔画。有些特设字部本身就是一个汉字,这些汉字的编码是重复按其字部码对应键。如“目”字,拆成丨丨,丨丨共两键。
单笔画字编码:重复按其单笔画对应键。如:“一”字编成—,—两键。
单部字、准单部字编码:取头4笔笔画。头2笔笔画按双笔画组合对应键,后2笔笔画按单双笔画对应键。3笔单字全取3笔笔画。头2笔笔画按双笔画组合对应键,第3笔画按单笔画对应键。2笔单字先取2笔笔画按双笔画组合对应键,取第2笔画按单笔画对应键。如“不”字,拆成—ノ,丨丶,共两键。“大”字,拆成—叉,丶共两键。
双部字编码:各部取其头2笔笔画按其双笔画对应键。如“耷”字,拆成—叉,—丨共2键。
多部字编码:以“直观为主;2字先分,成字优先,大字更优;拆分在前,拆连后边;逢交不拆,上大右大。”拆分原则先拆分为前后两部。取各部的最前字部作编码单元,取其两个编码单元的头2笔笔画按双笔画组合对应键。如“解”字,拆成ノ,ノ共2键。“辩”字拆成(立),丶两键。
拼音码分标准版和方言版。
标准版:拼音码采用双重标准设制,拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码。同时增设模糊码。
(1)将含字较多的l声母,以a、o、e、u为首的单韵母或复韵母归为一类,组合成l1声韵复合码;以首韵母为i的单韵母或复韵母为另一类,组合成l2声韵复合码。拼音声母为j的汉字,以单韵母i或以ia为首的复韵母为一类,组合成j1声韵复合码;其它韵母为另一类,组合成j2声韵复合码。声母为y的汉字,以a、o、e为首的单韵母或复韵母归为一类,组合成y1声韵复合码;以i、u、u为首的单韵母或复韵母为另一类,组合成y2声韵复合码。
(2)取含字较少的p、m、f、t、n、g、k、r、z、c、s、w、zh、ch、b、d、h、q、x、sh共18个声母为单声母码。含字较多的l、y、j共3个声母,仍然保留单声母码。
(3)首字母为“a、o、e”的无声母汉字,我们定义其声母为“0”。
(4)以z、zh为首字母的汉字,还可以共用一个模糊码
Figure A20041003307700051
以c、ch为首字母的汉字,还可以共用一个模糊码 以s、sh为首字母的汉字,还可以共用一个模糊码
Figure A20041003307700053
(5)拼音码分为8区。一区b、p、m、f。二区d、t、n、l。三区g、k、h。四区zh、ch、sh。五区z、c、s。六区j、q、x。七区
Figure A20041003307700054
Figure A20041003307700055
八区l1、l2、j1、j2、y、y1、y2、0、r、w。其中一~七区为顺音。八区为散音区。
方言版:在中国不同的地方有不同的方言。而在不同的方言对标准普通话的某些拼音声母较难区分。容易混淆。针对此情。我们设计一种合声分韵技术方案。即把容易混淆的几个声母归并为一个共同的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;
本人操粤语。先说粤语版:拼音码采用多重标准设制,拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码。容易混淆的声母先归并为一特定的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;
(1)将含字较多的l声母,以a、o、e、u为首的单韵母或复韵母归为一类,组合成l1声韵复合码;以i为首的单韵母或复韵母为另一类,组合成l2声韵复合码。声母为y的汉字,以a、o、e为首的单韵母或复韵母归为一类,组合成y1声韵复合码;以i、u、u为首的单韵母或复韵母为另一类,组合成y2声韵复合码。
(2)取含字较少的p、m、f、t、n、g、k、r、w、b、d、h、共12个声母为单声母码。含字较多的l、y共2个声母,仍然保留单声母码。
(3)首字母为“a、o、e”的无声母汉字,我们定义其声母为“r”,即无声母汉字和“r”声母汉字共用一键。
(4)声母j、z、zh我们统一把它们定义为声母j。以a、o、e为首的单韵母或复韵母归为一类,组合成j1声韵复混码;以单韵母为i为一类,组合成j2声韵复混码;以首韵母为i的复韵母为一类,组合成j3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成j4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成j5声韵复混码;属于j5声韵复混码的汉字均为一字多码。
(5)声母q、c、ch我们统一把它们定义为声母q。以a、o、e为首的单韵母或复韵母归为一类,组合成q1声韵复混码;以单韵母为i为一类,组合成q2声韵复混码;以首韵母为i的复韵母为一类,组合成q3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成q4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成q5声韵复混码;属于q5声韵复混码的汉字均为一字多码。
(6)声母x、s、sh我们统一把它们定义为声母x。以a、o、e为首的单韵母或复韵母归为一类,组合成x1声韵复混码;以单韵母为i为一类,组合成x2声韵复混码;以首韵母为i的复韵母为一类,组合成x3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成x4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成x5声韵复混码;属于x5声韵复混码的汉字均为一字多码。
(7)拼音码分为8区。一区b、p、m、f。二区d、t、n、l。三区g、k、h。四区j1、j2、j3、j4、j5。五区q1、q2、q3、q4、q5、。六区x1、x2、x3、x4、x5。七区l1、l2、y、y1、y2、r、w。其中一~六区为顺音。七区为散音区。
特设字部的代码、各笔画及特加码、各拼音在键盘定义如下:
标准版:
Figure A20041003307700061
粤语版:
编码方案如下:
一、形音活码:
单字取三码:一、二码为形码,三码为音码,取码规则见上。词组取四码。二字词组取码顺序:取第一字的一、二码,第二字的一、二码。三字词组取码顺序:取第一字的一、二码,第二字的第一码,第三字的第一码。四字词组取码顺序:顺取各字的第一码。多字词组取码顺序:取第一、二、三、末字的第一码。
二、音形活码:
单字取三码:首码为汉字的拼音码,次码,三码为形码,取码规则见上。词组取四码。二字词组取码顺序:取第一字的一、二码,第二字的一、二码。三字词组取码顺序:取第一字的一、二码,第二字的第一码,第三字的第一码。四字词组取码顺序:顺取各字的第一码。多字词组取码顺序:取第一、二、三、末字的第一码。
标准版和方言版。字、词取码顺序均同理。
本发明的优点是:拼音编码和字形编码均采用双重设制,本方案码长极短、简单明确、歧义少、反应快,所以相当方便有效。它以汉字最明确的、广泛认知的信息为拆解编码元素。其输入按键直接与坐标位置对应,输入者无须熟悉英文键盘,即可快速输入汉字。由于本方案采用的汉字规则信息完全是大众所熟知的汉字信息,和人们日常交流中对汉字拆分解释说法完全一致。它没有人为编造出某些的与人们所熟知通用的汉字规则信息相悖的规则。所以学习很容易。由于码长短,拆字编码无歧义,而输入按键又直接与坐标位置对应。所以输入速度极快。它适于听打和看打。
实施实例编码表:
例字                             标准版              粤语版
例字  编   码  分  解      音形码     形音码    音形码    形音码
汉    h     氵1    丶    SDX        DXS       SDX       DXS
字    z  i  宀         VCQ        CQV       JCQ       CQJ
编    b        、    EZQ        ZQE       EZQ       ZQE
码    m     —ノ       WKZ        KZW       WKZ       KZW
输    sh u  —   ノ丶    B;O       ;OB      Z;O      ;OZ
入    r     ノ丶   丶     ‘OS        OS‘              ‘OS        OS‘
速    s  u  —丨   辶      XJ‘                 J‘X      ZJ‘              J‘Z
度    d     广     丶    UEX        EXU       UEX       EXU

Claims (9)

  1. 一种汉字声形码输入系统,利用经过重新定义的英文标准键盘和移动电话键盘进行汉字输入,其特征包括:
    (1)本方案拼音编码和字形编码均采用多重设制;
  2. (2)形码采用多重标准设制:一定数量的字部以整体作为取码元素,不再拆分笔画;其它字部以首写笔画本身或首写笔画为主,辅以其它特征作编码元素;
  3. (3)取汉字笔画的传统分法将汉字笔画分成横、竖、撇、点(包含捺)、折5大类,这5种单笔画再两两组合成25种双笔画;为了充分利用键盘键位容量,另增设几个特加码;将单笔画与双笔画及特加码分开定义在键盘上;25种双笔画按起笔笔画分成5个双笔画区,5种单笔画组成一个单笔画区,几个特别加设码组成特加码区;
  4. (4)汉字拆分遵循“直观为主,二字先分;成字优先,大字在前;拆分在前,拆连在后;逢交不拆,上大右大;”的原则,将组合字一次性拆分为前后两大部;取两大部的最先前字部或字部笔画作编码元素;
  5. (5)某些首写双笔画含字部较多,且组字频率高,则以这些字部的其它特征或以含有这些字部的汉字的其它特征作为编码辅助元素,把它们分为不同的部类码,拆编到不同的键码上;一些组字频率极高的字部;以含有这些字部的汉字的其它特征作为编码辅助元素,把它们拆编到不同的键码上;
  6. (6)由汉字构字规律可知,书写时以某些双笔画开头的汉字字部较多,且组字频率高,而以另外一些双笔画开头的汉字字部较少;为了使各个键位汉字均匀分布,减少重码率,特设适当数量的字部(其中包含按权利要求5所述而分拆出来的特殊字部),作为比笔画优先的编码元素;并且分开定义到笔画元素及特加码对应键位中;这些特设调整字部均从含字较多的双笔画字部中选出,调配到含字较少的笔画码及特加码对应键;
  7. (7)拼音码采用多重标准设制:拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码;容易混淆的声母先归并为一特定的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;
  8. (8)拼音码分为顺音码区和散音区;各顺音码区内的声母以习惯顺序按英文字母在键盘中的几何坐标位置按从左到右或从右到左或从上到下的顺序有规律线性排列;
  9. (9)取码顺序为先二形码后音码的形音码设制;
CN 200410033077 2004-03-29 2004-03-29 活字输入系统 Pending CN1677327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410033077 CN1677327A (zh) 2004-03-29 2004-03-29 活字输入系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410033077 CN1677327A (zh) 2004-03-29 2004-03-29 活字输入系统

Publications (1)

Publication Number Publication Date
CN1677327A true CN1677327A (zh) 2005-10-05

Family

ID=35049868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410033077 Pending CN1677327A (zh) 2004-03-29 2004-03-29 活字输入系统

Country Status (1)

Country Link
CN (1) CN1677327A (zh)

Similar Documents

Publication Publication Date Title
CN1023038C (zh) 汉字音形序码计算机汉字输入方法
CN1169041C (zh) 音形拼音汉字输入法
CN1677327A (zh) 活字输入系统
CN1514339A (zh) 汉字拼音字部笔画二制三码输入系统
CN106325540B (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN1306376C (zh) 纳西图形文字的计算机输入方法
CN1125393C (zh) 利用计算机键盘汉字编码输入方法
CN107256092A (zh) 汉字数字形码快速输入法
CN1125395C (zh) 一二末码汉字输入法
CN1206582C (zh) 汉字输入法
CN1054930C (zh) 形声复合码汉字输入方法
CN101008868A (zh) 电脑和手机键盘的中文双笔输入法
CN1383052A (zh) 汉字象形三笔码的编码方法及其计算机键盘输入
CN1204487C (zh) 根声码汉字输入法
CN1420422A (zh) 码元用笔划集合数表示法及用途
CN1085861C (zh) 六笔码电脑汉字输入方法
CN1010988B (zh) 汉字输入方法及其所用键盘
CN1109284C (zh) 汉字多息码计算机输入方法
CN1725155A (zh) 优选码输入系统
CN1039168C (zh) 多字符集汉字输入系统
CN1217496A (zh) 汉字阴阳双极声韵形码输入系统
CN1869896A (zh) 中文笔形输入法
CN100407114C (zh) 五九块笔码——“分块、辩首笔形、数总笔画”的汉字信息处理
CN1103179A (zh) 汉字音形快速三位等长编码
CN1360246A (zh) 汉字编码数字化及其使用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication