CN1175025A - 一种汉字模糊音编码的输入方法 - Google Patents
一种汉字模糊音编码的输入方法 Download PDFInfo
- Publication number
- CN1175025A CN1175025A CN 97108112 CN97108112A CN1175025A CN 1175025 A CN1175025 A CN 1175025A CN 97108112 CN97108112 CN 97108112 CN 97108112 A CN97108112 A CN 97108112A CN 1175025 A CN1175025 A CN 1175025A
- Authority
- CN
- China
- Prior art keywords
- key
- sound
- word
- parts
- little
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
一种汉字模糊音编码的输入方法,将汉字声母分为b、p、m、f、h、d、t,n、l、g、k、j、q、x、z、zh、c、ch、s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节;汉字输入时,先取其字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。能克服读音不准的困难,而且码元分配均匀,重码率低,取码规则少,记忆量小,反应速度快。
Description
本发明涉及一种能将汉字输入计算机或类似设备的方法。
迄今登记的汉字编码的输入方法可分为数字类、拼音类、拼形类、音形类和形音类等五大类型。音形类把拼音和拼形结合起来,以音为主辅之以部件名称等字型的特征信息。表音码输入法就是其中一种。表音码从《新华字典》、《现代汉语词典》检字体系中,提取了常用字、常用字变体形式、偏旁冠盖、生僻字等176个偏旁部首和8个笔画共计184个部首笔画作为基本部件,给部分部件定音,少数部件的键位需要强记,取单字和单字部件的声母的首字母进行编码,取码顺序按书写顺序取头两个或三个部件的音。汉字的结构很有规律,笔画组成小部件,小部件组成大部件,大部件组成单字。取大部件最直观,但由于汉字约70%为形声字,取大部件会造成与字音重复取码,因此表音码需取三个部件以减少重码。取三个部件又遇到取大部件还是小部件的问题,因为大多数汉字只有两个大部件。这样一来,表音码输入法不得不一一定义可取部件并定出多项取码规则:有11个需要强记键位的部件,需要记住15个生僻字、25个不能直接读出音的偏旁和22个变体偏旁、119个不拆分的独体字。因而表音码输入法记忆量大、规则多,涉及到中间的部件,反应速度较慢。另外表音码输入法只取单字和部件音的首字母,虽能避免发音不准带来的某些错误,但不能区别边音和鼻音,h和f,送气音和不送气音,码元分配不平均。
本发明拟研究设计一种能克服上述缺陷的汉字模糊音编码的输入方法,以实现规则少、记忆量小、反应速度快、重码少的目的。
为达到上述目的,本发明采取的汉字编码的输入方法是:将汉字声母分为b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节。汉字输入时,先取字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。以上所取键码依次排列组成汉字的输入码。在键盘上依次敲击汉字的输入码即可完成汉字的输入。当出现重码时,加敲数字键。所谓“独立”是指所取部件不与其它部件相交或不完全与其它部件相接,“可读”指所取部件为常用字或定义了音的偏旁,“最小”指所取部件不再与后面的部件和笔画组成可读部件。
b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类声母分别与键盘上的Q~P、A~;、Z~/各十个键码依次对应。Q~P键码为Q、W、E、R、T、Y、U、I、O、P,A~;键码为A、S、D、F、G、H、J、K、L、;,Z~/键码为Z、X、C、V、B、N、M、,、.、/。单韵母对应Q~P代码,复韵母对应A~;代码,鼻韵母对应Z~/代码。
将笔画分为横、竖、撇、点、折五类,竖钩归于竖,其余所有拐弯的笔画归于折,提归于横,捺归于点。
定义了30个偏旁部件的读音,如表1。其它可读偏旁部件读字音,不可读部件取首笔或末笔音。
表1 30个偏旁部件的读音
偏旁部件 | 读音 | 偏旁部件 | 读音 | 偏旁部件 | 读音 |
冫(竖着的不相交的两点,包括“习”“衣”、“尽”等字中的两点) | 冰 | 讠 | 言 | 攵攵 | 文 |
匚 | 匡 | 犭 | 犬 | ||
刂 | 刀 | 饣 | 食 | ||
亻 | 人 | 纟 | 丝 | ||
廴 | 建 | 礻 | 示 | ||
八(包括“八”、“分”等字的“八”以及横着的、不相交的两点如“并”“米”、“兵”、“小”等字中的两点) | 八 | 阝卩 | 耳 | 疒 | 病 |
氵灬水 | 水 | 衤 | 衣 | ||
忄 | 心 | 钅 | 金 | ||
宀冖 | 盖 | 爫 | 爪 | ||
辶 | 走 | 扌 | 手 | ||
卄 | 草 | 士 | 土 | ||
廾 | 弄 | 巳巳 | 已 |
将“丿”,“女”,“十”,“日”,“足”,“八”,“冫”,“丶”,“金”,“人”,“大”,“宀”,“纟”,“竹”,“又”,“寸”,“水”,“月”,“木”,“小”,“石”21个组字率较高的字或笔画偏旁的音分配在组字率较低的键上(如图1),需要强记。强记的21个部件中的“足”,“金”,“水”,“木”,“小”,“石”和标示在键上的其它5个部件“禾”,“土”,“火”,“文”,“王”不再拆分。21个字或偏旁部件与键码的对应关系如表2所示。
表2
字或偏旁 | 键码 | 字或偏旁 | 键码 | 字或偏旁 | 键码 |
丿 | W | 丶 | S | 水 | V |
女 | E | 金 | D | 月 | B |
十 | R | 人 | F | 木 | M |
日 | T | 大宀 | H | 小 | , |
足 | Y | 纟竹 | J | 石 | . |
八 | I | 又 | K | ||
冫 | A | 寸 | Z |
本发明将声母分为十类,韵母分为三类,声韵结合构成三十个模糊音节。将400多个音节模糊化为30个音节后,克服了读音不准的困难,30个音节在键盘上分配较均匀且很有规律,既可减少重码率,又便于记忆;汉字输入时,先取字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码,取码规则少,规范,比取大部件反应速度快;只需调整21个部件的键位,就可使得部件音所对应的键码在键上的分配相当平均,且记忆量小。因而本发明提供的汉字编码的输入方法科学合理,易学易记易用,并可实现高速输入。
下面根据附图和实施例对本发明作进一步详细说明。
图1为码元分配图。
常用单字(约4000个,其中一部分与难字重复)使用三键输入。第一键取单字字音所对应的键码;第二键取按笔顺第一个独立、可读、最小部件的音或不可读部件、分不出部件的首笔音所对应的键码,全包围和半包围结构的字,包围部分先起笔的先外后内,包围部分后起笔的先内后外;第三键取最后一个独立、可读、最小部件的音或不可读部件、分不出部件的末笔音所对应的键码。重码取数字键。
难字(3000常用字以上的字、难读准音的字)使用两键输入。即取首尾两个独立、可读、最小部件的音所对应的键码,不可分独体字取首笔和末笔音所对应的键码。重码取数字键。
双字词使用四键输入。每字两键,取码方法同单字的第一键和第二键。重码取数字键。
三字词使用四键输入。取三个字的音和第三字首部件的音所对应的键码,重码取数字键。
四字词和四字以上词使用四键输入。取头三个字和最后一字的音所对应的键码。重码取数字键。
实施例1:
单字:
啊PGG 阿P;G 埃;EH 挨;LH 哎;GS 唉;GH 哀;SA 癌;Z. 皑;AY
氨/YE 肮/BY 蔼;KP 矮;OE 艾;KS 碍;Z 爱;JK 隘;;Z 安/;E
鞍/VE 俺/FC 按/LE 暗/TT 岸/.R 案/,M 昂/T; 盎//Z 澳;VH
奥;WH 懊;NH 凹;OX 敖;X/ 熬;;V 翱/AA 袄;PH 傲;F/
实施例2:
难字:
瑷BK 廒BP 灞VB 鞴V/ 滗VA 窆;U 豳.A 檗OM 瓿RP
实施例3:
词组:
元极/;YM 模糊QMWI 科学TWHI
元音码//QO 中华民族MSZU 振兴中华民族MNMU
Claims (10)
1.一种汉字模糊音编码的输入方法,包括将笔画分为横、竖、撇、点、折五类,提归于横,竖钩归于竖,捺归于点,其余所有拐弯的笔画归于折,其特征在于:将汉字声母分为b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节;汉字输入时,先取其字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。
2.根据权利要求1所述的方法,其特征在于: b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类声母分别与键盘上的Q~;P、A~;、Z~/各十个键码依次对应,单韵母对应Q~P键码,复韵母对应A~;键码,鼻韵母对应Z~/键码。
3.根据权利要求1所述的方法,其特征在于:偏旁部件的读音为:
偏旁部件
读音
偏旁部件
读音
偏旁部件
读音
冫(竖着的不相交的两点,包括“习”“衣”、“尽”等字中的两点)
冰
讠
言
攵攵
文
匚
匡
犭
犬
刂
刀
饣
食
亻
人
纟
丝
廴
建
礻
示
八(包括“八”、“分”等字的“八”以及横着的、不相交的两点如“并”“米”、“兵”、“小”等字中的两点)
八
阝卩
耳
疒
病
氵灬氺
水
衤
衣
忄
心
钅
金
宀冖
盖
爫
爪
辶
走
扌
手
卄
草
士
土
廾
弄
已巳
已
其它可读偏旁部件取字音,不可读部件取首笔或末笔音。
4.根据权利要求1所述的方法,其特征在于:“丿”、“女”、“十”、“日”、“足”、“八”、“冫”、“、”、“金”、“人”、“大”、“宀”、“纟”、“竹”、“又”、“寸”、“水”、“月”、“木”、“小”、“石”的音对应的键码为:
字或偏旁
键码
字或偏旁
键码
字或偏旁
键码
丿
W
、
S
水
V
女
E
金
D
月
B
十
R
人
F
木
M
日
T
大宀
H
小
,
足
Y
纟竹
J
石
.
八
I
又
K
冫
A
寸
Z
5.根据权利要求1或4所述的方法,其特征在于:“足”、“金”、“水”、“木”、“小”、“石”、“禾”、“土”、“火”、“文”、“王”部件不再拆分。
6.根据权利要求1或2或3或4或5所述的方法,其特征在于:常用单字使用三键输入,第一键取单字字音所对应的键码,第二键取按笔顺第一个独立、可读、最小部件的音或不可读部件、分不出部件的首笔音所对应的键码,第三键取最后一个独立、可读、最小部件的音或不可读部件、分不出部件的末笔音所对应的键码。
7.根据权利要求1或2或3或4或5所述的方法,其特征在于:难字使用两键输入,即依次取首尾两个独立、可读、最小部件的音所对应的键码,不可分独体字取首笔和末笔音所对应的键码。
8.根据权利要求1或2或3或4或5所述的方法,其特征在于:双字词使用四键输入,每个字取两个键码,取码方法同单字的第一个键码和第二个键码。
9.根据权利要求1或2或3或4或5所述的方法,其特征在于:三字词使用四键输入,取三字音和第三字首部件音所对应的键码。
10.根据权利要求1或2或3或4或5所述的方法,其特征在于:四字词和四字以上词使用四键输入,取头三字和最后一字的音所对应的键码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97108112A CN1057166C (zh) | 1997-06-19 | 1997-06-19 | 一种汉字模糊音编码的输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97108112A CN1057166C (zh) | 1997-06-19 | 1997-06-19 | 一种汉字模糊音编码的输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1175025A true CN1175025A (zh) | 1998-03-04 |
CN1057166C CN1057166C (zh) | 2000-10-04 |
Family
ID=5170140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97108112A Expired - Fee Related CN1057166C (zh) | 1997-06-19 | 1997-06-19 | 一种汉字模糊音编码的输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1057166C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1952856B (zh) * | 2005-10-21 | 2011-09-28 | 钟巨航 | 输入法 |
-
1997
- 1997-06-19 CN CN97108112A patent/CN1057166C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1952856B (zh) * | 2005-10-21 | 2011-09-28 | 钟巨航 | 输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN1057166C (zh) | 2000-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1057166C (zh) | 一种汉字模糊音编码的输入方法 | |
CN1171137C (zh) | 改进的hlv汉字拼音输入方法 | |
CN101587381B (zh) | 音形汉字无重码输入法 | |
CN102368177B (zh) | 新汉字声韵输入方法及输入键盘 | |
CN101751134A (zh) | 正左上方汉字输入法 | |
CN1051161C (zh) | 一种汉字数码输入法 | |
CN102073383A (zh) | 字首部件拼音输入法 | |
CN101706685A (zh) | 一种汉字输入法 | |
CN201732370U (zh) | 汉语语音数字化装置 | |
CN1770071A (zh) | 数字式三击形音汉字输入法 | |
CN101430604A (zh) | 汉字码输入法 | |
CN1293451C (zh) | 三击形音汉字输入法 | |
CN101470535A (zh) | 优化汉字码输入法 | |
CN1206581C (zh) | 混合输入方法 | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
CN1328649C (zh) | 汉字“三形联想”形码输入法 | |
CN86105505A (zh) | 汉字输入方法及其所用键盘 | |
CN1204078A (zh) | 一种拼音汉字编码的输入法 | |
CN1945504A (zh) | 特定拉丁字母表调汉字拼音输入技术方案 | |
CN101504572A (zh) | 完善汉字码输入法 | |
CN1514339A (zh) | 汉字拼音字部笔画二制三码输入系统 | |
CN101907928A (zh) | 一种汉字元拼拼音扩展输入方法 | |
CN1206582C (zh) | 汉字输入法 | |
CN1174349A (zh) | 汉字二十九形字根码编码输入方法 | |
CN101609369B (zh) | 汉字声母口型声调三笔输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |