CN101901062B - 基于音素编码的计算机汉字信息处理方法 - Google Patents
基于音素编码的计算机汉字信息处理方法 Download PDFInfo
- Publication number
- CN101901062B CN101901062B CN2010102362333A CN201010236233A CN101901062B CN 101901062 B CN101901062 B CN 101901062B CN 2010102362333 A CN2010102362333 A CN 2010102362333A CN 201010236233 A CN201010236233 A CN 201010236233A CN 101901062 B CN101901062 B CN 101901062B
- Authority
- CN
- China
- Prior art keywords
- chinese character
- chinese
- tone
- key
- letter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
本发明涉及一种基于音素编码的计算机汉字信息处理方法,通过通用键盘,按照汉字的音素的编码方法,输入汉字对应的音素,实现在计算机中对汉字的输入,所述汉字的音素编码方法为:每个汉字通过声母、韵母、声调和义符一一确定,首先通过普通键盘输入汉字的声母和韵母分别对应的英文字母后,计算机从汉字库中调出相应声母和韵母匹配的同音汉字,然后从普通键盘上输入汉字音调对应的英文字母,若能唯一确定所需输入的汉字,则输入汉字结束。若输入汉字音调对应的英文字母后若显示出同音且同声调的汉字,则通过键盘输入汉字对应义符,最终确定所需输入的汉字。本发明提供的处理方法可快速、准确、唯一地输入所需汉字。
Description
技术领域
本发明涉及一种基于音素编码的计算机汉字信息处理方法,具体地说是一种通过将汉字的音素分解成与英文字母对应后基于音素编码的计算机汉字信息处理方法。
背景技术
汉字作为汉语言信息跨时空传递的载体。由于其自身结构的复杂性,直接导致信息传递受众的局限性。
中国有大量的文盲、低学历人群和在校小学生,在使用计算机阅读中文文本信息时总会有很多字不认识。难以理解文本所要传递的正确信息。
目前市场尚无解决上述人群在使用计算机时遇到的阅读障碍的技术。
要想根除或基本根除这一现象,人们就需要一种更简单实用的技术来取代目前的计算机处理和计算机输入等。
发明内容
本发明目的在于克服上述现有技术中对汉字的计算机处理及输入中存在的不足,提供一种基于音素编码的计算机汉字信息处理方法。通过将汉字的读音分解为声母、韵母、声调和义符,并将声母、韵母、声调和义符与英文字母一一对应,实现通过普通键盘敲入音素字母即实现对汉字的准确输入。
实现本发明目的采用的技术方案是:一种基于音素编码的计算机汉字信息处理方法,通过通用键盘依次输入对应汉字的声母键、韵母键、声调键和义符键唯一确定该汉字,并通过计算机处理后显示出输入的汉字;所述声母键为键盘上的A~Z二十六个字母,分别对应汉语拼音方案中的声母;所述韵母键为键盘上的A~Z二十六个字母,分别对应汉语拼音方案中的韵母;所述声调键为键盘上的A~Z二十六个字母,分组对应汉语拼音方案中阴平、阳平、上声、去声、轻声五种声调,其中字母A、B、C、D、E、F对应阴平,G、H、I、J、K、L对应阳平,M、N、O、P、Q、R对应上声,S、T、U、V、W、X对应去声,Y、Z对应轻声;
所述的义符键为键盘上的A~Z二十六个字母,用于对显示的数目在二十六个以下的同声母、韵母和声调的汉字进行选择;
所述处理方法包括以下步骤:
1)通过普通键盘依次输入期望输入的汉字的声母键、韵母键、以及声调键组合中的第一个字母;
2)如果输入的声母键、韵母键和声调键确定出一个唯一汉字,则转步骤5);否则转步骤3);
3)计算机屏幕显示出一组数目为二十六个以下的汉字选项,如果显示了所述期望输入的汉字,则输入该汉字对应的义符键并转步骤5),否则转步骤4);
4)删除输入的声调键,再输入该声调键组合中的下一个字母作为声调键,转步骤3);
5)计算机处理后显示输入的汉字。
进一步优选地,所述字母B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各字母分别对应汉语拼音方案里的B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各声母;从余下的字母中取出I、U、V三个字母分别对应汉语拼音方案里的复声母ZH、CH、SH;再从余下的字母中取出O字母作为零声母,加在单原音韵母和复原音韵母对应的字母和单声母音节字母前,A、E为备用声母。
进一步优选地,所述字母A、O、E、F、J、W、B、P、T、Q、R、Y、I、G、N、L、H、M、C、S、Z、U、K、X、D、V分别与韵母a、o/uan、e、ai、ei、ao、ou、an、en、ang、eng、ong/iong、i、ia、ie、iao/uang、iou、ian、in、iang/uai、ing/ua、u/van、uo、uei/ve、uen/vn、v一一对应。
本发明汉字输入方法通过普通键盘依次输入汉字的声母、韵母、声调和义符,从而唯一确定出该汉字,并通过计算机处理后显示出输入的汉字。首先通过普通键盘输入汉字的声母和韵母分别对应的英文字母后,计算机从汉字库中调出相应声母和韵母匹配的同音汉字,然后从普通键盘上输入汉字音调对应的英文字母,若能唯一确定所需输入的汉字,则输入汉字结束。若输入汉字音调对应的英文字母后若显示出同音且同声调的汉字,则通过普通键盘输入汉字对应义符的英文字母,最终确定所需输入的汉字。如:按照上述汉字的音素编码,“人”字是由声母“r”韵母“t”声调“g”义符“a”组合而成,完整书写就是:“rtga”,通过普通键盘依次敲击r、t、g、a即实现了输入汉字“人”。
本发明提供的计算机汉字信息处理方法简单,由于音素编码与汉字之间是一一对应关系,因此计算机处理器可以快速搜索出输入音素编码所对应的汉字,并直接将其显示出。通过音素编码中声母、韵母、声调和义符四个字母实现对汉字输入的一步定位,减少了繁琐的选择过程。相比目前没有声调确认的模糊输入法更具有准确性,相比需要记住复杂字根的五笔输入法,更适合普及大众使用。
此外,本发明方法具有以下优点:
1)新手根据输入法提示输入汉字并学习音素编码,音素编码认读熟练后即可以使用音素编码在无中文输入法软件、字库的计算机上使用A至Z26个字母直接进行中文信息交流。
2)针对只会说汉语,不会写汉字的母语非汉语的人,可以方便快速地输入汉字。
3)连续输入,整体转换。由于音素编码与汉字之间是一一对应关系,具有可逆性。所以音素编码与汉字之间可以自由转换。可以将整篇中文文本复制到输入法输入框里整体转换成音素编码。读者通过声母、韵母、声调三元素的整读,再结合语句、语境、语义推导出文本信息,实现文本阅读。方便只会说汉语不会写汉字的国外友人和中国广大的文盲、低学历人群和在校小学生在计算机上阅读中文文本。阅读学习的过程只需要熟练认读声母、韵母组合的简拼和声调变化即可,义符元素熟不熟悉不妨碍阅读。
具体实施方式
下面通过具体的实施例对本发明作进一步的说明。
一种基于音素编码的计算机汉字信息处理方法通过通用键盘,按照汉字的音素的编码,输入汉字对应的音素,实现在计算机中对汉字的输入,所述汉字的音素编码为:每个汉字由声母、韵母、声调和义符一一确定。
所述声母为A~Z二十六个字母,分别对应汉语拼音方案中的声母,其中字母B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各字母分别对应汉语拼音方案里的B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各声母,从余下的字母中取出I、U、V三个字母分别对应汉语拼音方案里的复声母ZH、CH、SH,为使音素编码等长,再从余下的字母中取出O字母作为零声母,加在单原音韵母和复原音韵母对应的字母和单声母音节字母前,A、E为备用声母。
所述的韵母与英文字母之间的对应代码见表1
韵母 | 代码 |
a | a |
o/uan | o |
e | e |
ai | f |
ei | J |
ao | w |
ou | b |
an | p |
en | t |
ang | q |
eng | r |
ong/iong | y |
i | i |
ia | g |
ie | n |
iao/uang | l |
iou | h |
ian | m |
in | c |
iang/uai | s |
ing/ua | z |
u/van | u |
uo | k |
uei/ve | x |
uen/vn | d |
v | v |
表1
所述的声调与英文字母之间的对应代码见表2:
阴平 | A | B | C | D | E | F |
阳平 | G | H | I | J | K | L |
上声 | M | N | O | P | Q | R |
去声 | S | T | U | V | W | X |
轻声 | Y | Z |
表2
所述的义符为A~Z 26个字母。
A至Z二十六个声母分别与A至Z二十六个韵母组合共得到676个组合,对应汉语拼音方案里的拼音音节,余为备用简拼。
其中特殊音节用特殊方式处理。例如:
“ng”依旧写作“ng”,
“hm”依旧写作“hm”,
“er”依旧写作“er”,
“hng”简化写作“hn”。
lo=咯。(因为与拼音“luan”的简拼“lo”相同。考虑到该音节字数不多,所以归入特殊处理。)
汉字每个音节都有N个字。用来表示不同的意思。同音字又分5个不同的声调。且每个声调包含的字数不同。为了便于区分,就需要用到“声调”、“义符”组合。组合方式是阴平声调“A”与义符A到Z二十六个字母分别组合一次,得到26个组合。为同音节同声调第一组组合。表示1-26个阴平声调的汉字。当同音节同声调汉字超过26个时,起用阴平声调“B”,与义符A到Z二十六个字母分别组合一次,就又得到26个组合,为同音节同声调第二组组合,表示27——到52个阴平声调的汉字,依次类推。6×26=156共得到156个同音节同声调组合,表示汉字同音节同声调1至156个汉字。当同音节同声调字数超过156个时,启用一个备用简拼,再与同音节同声调156个组合分别组合一次,表示156至312个同音节同声调汉字。依次类推,直到对应完同音节同声调所有汉字。
阳平、上声、去声、轻声组合方式同上。
A到Z二十六个声调分别与A到Z二十六个义符组合一次,共得出676个组合。
A至Z二十六个声母分别与A至Z二十六个韵母组合后得到的676个组合乘以A到Z二十六个声调分别与A到Z二十六个义符组合得到的676个组合,共得出456976个音素编码,对应中国所有汉字,余为备用音素编码。
本发明通过普通键盘依次输入汉字的声母、韵母、声调和义符,从而唯一确定出该汉字,并通过计算机处理后显示出输入的汉字。首先通过普通键盘输入汉字的声母和韵母分别对应的英文字母后,计算机从汉字库中调出相应声母和韵母匹配的同音汉字,然后从普通键盘上输入汉字音调对应的英文字母,若能唯一确定所需输入的汉字,则输入汉字结束。若输入汉字音调对应的英文字母后若显示出同音且同声调的汉字,则通过普通键盘输入汉字对应义符,最终确定所需输入的汉字。
下面以具体的操作对本发明作详细的说明,以键入声母F举例,键入第一键F时电脑屏幕上将出现下表3效果:
同声母汉字 | 第二键提示 | 拼音提示 |
发 | A | fa |
佛 | O | fo |
副 | U | fu |
否 | B | fou |
反 | P | fan |
分 | T | fen |
非 | J | fei |
放 | Q | fang |
风 | R | feng |
表3
当敲入第一键为F时,此时计算机处理器在后台处理中搜索出同声母的汉字,若继续敲入韵母“AN”(“AN”韵母对应的字母是“P”),即输入声母“F”、韵母“P”两键后电脑屏幕上显示如下表4所示:
同音节汉字 | 第三键声调/第四键义符提示 |
帆 | AA |
番 | AB |
蕃 | AC |
幡 | AD |
藩 | AE |
翻 | AF |
凡 | GA |
矾 | GB |
钒 | GC |
烦 | GD |
墦 | GE |
蕃 | GF |
璠 | GG |
膰 | GH |
燔 | GI |
蹯 | GJ |
樊 | GK |
繁 | GL |
蘩 | GM |
反 | MA |
返 | MB |
犯 | SA |
范 | SB |
饭 | SC |
贩 | SD |
畈 | SE |
泛 | SF |
梵 | SG |
表4
输入后面的编码,计算机处理器在后台处理中搜索出同韵母的汉字。继续敲入第三键S,计算机处理器在后台处理中搜索出同声调的汉字,
电脑屏幕上显示如下表5所示:
同声调汉字 | 第四键义符提示 |
犯 | A |
范 | B |
饭 | C |
贩 | D |
畈 | E |
泛 | F |
梵 | G |
表5
输入表5后面的编码即可输出所需的唯一汉字,实现对所需汉字的唯一输出。
Claims (3)
1.一种基于音素编码的计算机汉字信息处理方法,通过通用键盘依次输入对应汉字的声母键、韵母键、声调键和义符键唯一确定该汉字,并通过计算机处理后显示出输入的汉字;所述声母键为键盘上的A~Z二十六个字母,分别对应汉语拼音方案中的声母;所述韵母键为键盘上的A~Z二十六个字母,分别对应汉语拼音方案中的韵母;
其特征在于:所述声调键为键盘上的A~Z二十六个字母,分组对应汉语拼音方案中阴平、阳平、上声、去声、轻声五种声调,其中字母A、B、C、D、E、F对应阴平,G、H、I、J、K、L对应阳平,M、N、O、P、Q、R对应上声,S、T、U、V、W、X对应去声,Y、Z对应轻声;
所述的义符键为键盘上的A~Z二十六个字母,用于对显示的数目在二十六个以下的同声母、韵母和声调的汉字进行选择;
所述处理方法包括以下步骤:
1)通过普通键盘依次输入期望输入的汉字的声母键、韵母键、以及声调键组合中的第一个字母;
2)如果输入的声母键、韵母键和声调键确定出一个唯一汉字,则转步骤5);否则转步骤3);
3)计算机屏幕显示出一组数目为二十六个以下的汉字选项,如果显示了所述期望输入的汉字,则输入该汉字对应的义符键并转步骤5),否则转步骤4);
4)删除输入的声调键,再输入该声调键组合中的下一个字母作为声调键,转步骤3);
5)计算机处理后显示输入的汉字。
2.根据权利要求1所述基于音素编码的计算机汉字信息处理方法,其特征在于:所述字母B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各字母分别对应汉语拼音方案里的B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W各声母;从余下的字母中取出I、U、V三个字母分别对应汉语拼音方案里的复声母ZH、CH、SH;再从余下的字母中取出O字母作为零声母,加在单原音韵母和复原音韵母对应的字母和单声母音节字母前,A、E为备用声母。
3.根据权利要求1所述基于音素编码的计算机汉字信息处理方法,其特征在于:所述字母A、O、E、F、J、W、B、P、T、Q、R、Y、I、G、N、L、H、M、C、S、Z、U、K、X、D、V分别与韵母a、o/uan、e、ai、ei、ao、ou、an、en、ang、eng、ong/iong、i、ia、ie、iao/uang、iou、ian、in、iang/uai、ing/ua、u/van、uo、uei/ve、uen/vn、v一一对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102362333A CN101901062B (zh) | 2010-06-11 | 2010-07-16 | 基于音素编码的计算机汉字信息处理方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010197855.X | 2010-06-11 | ||
CN201010197855 | 2010-06-11 | ||
CN2010102362333A CN101901062B (zh) | 2010-06-11 | 2010-07-16 | 基于音素编码的计算机汉字信息处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101901062A CN101901062A (zh) | 2010-12-01 |
CN101901062B true CN101901062B (zh) | 2012-05-23 |
Family
ID=43226652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102362333A Expired - Fee Related CN101901062B (zh) | 2010-06-11 | 2010-07-16 | 基于音素编码的计算机汉字信息处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101901062B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766015A (zh) * | 2018-12-26 | 2019-05-17 | 舒从如 | 汉字拉丁码输入法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1045878A (zh) * | 1989-03-22 | 1990-10-03 | 唐懋宽 | 计算机中文声数编码输入技术 |
CN1085672A (zh) * | 1993-09-02 | 1994-04-20 | 江西铜业公司贵溪冶炼厂 | 汉字声调输入法 |
CN1661595A (zh) * | 2004-02-26 | 2005-08-31 | 肖红华 | 多功能密码文 |
-
2010
- 2010-07-16 CN CN2010102362333A patent/CN101901062B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1045878A (zh) * | 1989-03-22 | 1990-10-03 | 唐懋宽 | 计算机中文声数编码输入技术 |
CN1085672A (zh) * | 1993-09-02 | 1994-04-20 | 江西铜业公司贵溪冶炼厂 | 汉字声调输入法 |
CN1661595A (zh) * | 2004-02-26 | 2005-08-31 | 肖红华 | 多功能密码文 |
Also Published As
Publication number | Publication date |
---|---|
CN101901062A (zh) | 2010-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102122298B (zh) | 一种中文相似性匹配方法 | |
CN105957518A (zh) | 一种蒙古语大词汇量连续语音识别的方法 | |
CN102214238B (zh) | 一种汉语词语相近性匹配装置及方法 | |
CN100462901C (zh) | Gb拼音输入法 | |
CN104408037A (zh) | 藏文文本的向量模型表示方法 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
CN102053719B (zh) | 华文汉字输入法 | |
CN103616960A (zh) | 六元音字母双拼输入法 | |
CN101727195A (zh) | 汉语语音码多样信息输入法 | |
CN101901062B (zh) | 基于音素编码的计算机汉字信息处理方法 | |
CN101694602A (zh) | 一种利用汉字全息声韵母代码的汉字输入法 | |
CN105045410A (zh) | 一种形式化拼音和汉字对应识别的方法 | |
CN102368177B (zh) | 新汉字声韵输入方法及输入键盘 | |
CN100561469C (zh) | 创建和使用中文语言数据和用户自纠正数据的方法和系统 | |
CN100458668C (zh) | 首音汉字输入法 | |
CN1332294C (zh) | 汉语语音编码输入法 | |
CN103777771B (zh) | 易捷速录系列输入方法 | |
CN106325540B (zh) | 一种滇东北次方言苗文的简笔输入法及其应用 | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
CN107315725A (zh) | 汉语普通话信息ascii集合码 | |
CN108459735A (zh) | 声韵双击触摸屏汉语拼音输入方法 | |
CN1022350C (zh) | 汉字字母编码输入法 | |
CN101706685A (zh) | 一种汉字输入法 | |
CN106959764A (zh) | 一种有助于正确书写汉字的形码输入法 | |
TW202016767A (zh) | 應用於智慧行動裝置的四縣腔客語輸入系統及建立方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120523 Termination date: 20150716 |
|
EXPY | Termination of patent right or utility model |