CN104991656B - 一种输入汉语词组的方法 - Google Patents
一种输入汉语词组的方法 Download PDFInfo
- Publication number
- CN104991656B CN104991656B CN201510319456.9A CN201510319456A CN104991656B CN 104991656 B CN104991656 B CN 104991656B CN 201510319456 A CN201510319456 A CN 201510319456A CN 104991656 B CN104991656 B CN 104991656B
- Authority
- CN
- China
- Prior art keywords
- word
- spelling
- input
- simplicity
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0236—Character input methods using selection techniques to select from displayed items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
一种输入汉语词组的方法,如果输入词组拼音编码是第1字全拼,第2、3字简拼,并且其编码的重码词的数大于设定值时,输入界面显示了拼音编码组合,其特征是:第1个字全拼编码相同,第2字显示和该字简拼对应的全部全拼组合,第3保持其同样的简拼。进一步的,对于2字词:第1字全拼+第2字全拼(首字母和其简拼首字母相同);对于3字词:第1字全拼+第2字全拼(首字母和其简拼的首字母相同)+第3字简拼。
Description
技术领域
本发明属于计算机文字信息处理。
背景技术
目前的中文输入法几乎都是以汉语拼音编码输入为主,拼音输入法相比其他输入法有着天然的优势,因为现代每一个接受教育的中国人在还没学习汉字前,就先用大量时间学习汉语拼音或注音符号,原本只是用来标记汉字读音的拼音也就可以轻松地作为汉字的输入编码;另一个优势就是接近口语,所以拼音输入法可以在短时间内适应。
但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率相当高,2-3字的词组重码率也比较高;目前的计算机键盘只能一次输入一个拼音编码,而一个汉字的拼音编码长度是2-6,平均有4个编码,就是说在现有的键盘上,要击键4次才可以输入一个完整的汉字编码,如果为了减少击键次数,采用了简拼和全拼或者其混合的编码方法,但是如果采用简拼,对于2-3-4字词会产生大量的重码词,这时候,用户需要翻页多次才可以找到目标词。几年前,人们提出了双拼的方案,但是由于按键编码的冲突,且较难记忆,几乎被多数人放弃不用了。
在输入汉语过程中,如何做到既能够击键次数少,同时足够少的重码词,这是一个难题;因为4字或者以上的词,即使简拼,其重码词也比较少,用户几乎不需要翻屏,就可以找到目标词。而用户输入的最多的是2-3字词,多达60%以上;而2-3字词如果采用简拼或者部分简拼,其重码词非常多;常常要翻页才能找到需要的汉字,输入效率非常低下,导致大部分用户的较差的体验效果。
针对2-3字词,如何做到既能够减少击键次数,又能够较少的重码词,是本发明要解决的问题。
发明内容
本发明提供了一种新方法,使用户能够击键次数少而且重码也比较少地输入2、3字词,同时不必或者很少翻页,就能找到并且输入目标词。
具体如下:1)对于2字词,采用的编码方案是:第1字全拼+第2字简拼(首字母)
2)对于3字词,采用的编码方案是:第1字全拼+第2字简拼(首字母)+第3字简拼(首字母)采用上述编码输入后,如果输入界面显示的重码词少于设定值,一般目前的输入法设置是5,这里我们设置是6,那么输入界面就将这6个重码汉语词,全部显示在输入界面内。用户可以不必“翻页”,查到目标词;如果输入界面显示的重码词多于设定值6,那么输入界面此时显示的不是汉语词,而是输入法词库内的编码,其特征是:
对于2字词:第1字全拼+第2字全拼(首字母和其简拼首字母相同);
对于3字词:第1字全拼+第2字全拼(首字母和其简拼的首字母相同)+第3字简拼。
如果平均每个(全拼+全拼)拼音编码对应5个重码词,那么一次可以对应30个,其优点是,用户能够立刻发现要输入的词的全拼或者全拼+简拼的编码,是否显示在输入界面,而无需翻页查找,或者在键盘上输入第2个字的全拼字母,减少击键盲打出现的错误。
一种输入汉语词组的方法,所述的词组是2字词和3字词,如果输入所述的词组拼音编码是第1字全拼,第2、3字简拼,并且其编码的重码词的数大于设定值时,输入界面显示了输入法词库内的所输入的拼音编码组合,其特征是:第1个字全拼编码相同,第2字显示和该字简拼对应的全部全拼组合,第3保持其同样的简拼。当选中输入界面的某拼音编码的候选数字健,输入界面显示输入法词库内该编码指示的全部候选词,如果选中某数字键,对应的候选词上屏。进一步的,优选的所述的设定值是6;对于2字词:第1字全拼+第2字全拼(首字母和其简拼首字母相同);对于3字词:第1字全拼+第2字全拼(首字母和其简拼的首字母相同)+第3字简拼。
如果输入拼音编码指示的重码词的数,没有超出输入界面显示的设定值,如每屏6个,则将全部候选词,直接显示在输入界面内。如果超出6个重码词,将对应的拼音编码,显示在输入界面内,对于4字词以上的词,本方法不建议使用,因为如果第一个词全拼第2、3、4、字简拼,即使百万以上的大词库,重码词的概率很低,而且即使有也很少超过5个以上。另外,之所以没有选择全简拼的方式,作为索引指示,原因是2、3字词的拼音编码采用每个字的全拼的首字母,即使一个首字母对应平均6个全拼,那么2字词的简拼就对应6*6=36种全拼组合,3字词也是一样,那么需要6页才可以把其全拼组合显示出来;用户需要翻几次页,才可以找到目标词,失去了减少翻页的设计目的,得不偿失。
附图说明
图1是输入“li'b”,输入界面的示意图;
图2是输入“jian's'j”,输入界面的示意图;
具体实施方式
下面结合具体实施例对本发明做详细说明。
具体实施例1:
用户要输如公司名“立邦”,先输入拼音编码“li'b”,输入法根据程序指令,判断出其重码词多于6个,于是根据其规则,在输入法词库内,读取并显示符合“li'b”所有的拼音编码如图1所示,共有9种全拼编码符合规则:{li'bai,li'bang,li'bao,li'bei,li'bian,li'biao,li'bie,li'bin,li'bing},不包括:li'ba、li'bi、li'bo和li'bu;根据输入界面提示,用户按数字键“2”,输入界面显示如下:
li'bang
1立邦
按空格键或者数字键“1”,“立邦”上屏
如果要输入“李冰”,翻页,显示如图1b,根据输入界面提示,用户按数字键“2”,输入界面显示的词有:李冰、李兵、罹病、礼兵。按空格键“李冰”上屏。
尽管多了一次翻页,如果符合“li'b”编码的词全部显示的话,按照词频排序,该词肯定排在后面,要翻5、6页才可以找到,而且,多数情况下用户无法确定词库是否收录了这个词;如果全拼需要按4健,而本方法只按3次健,因此用户可以快速扫描输入界面,很快判断出要输入的词的编码是否存在,如果有,直接按相应的数字键,如果没有,可以马上删除第2好字的简拼,逐字输入。输入过程的不确定性,降低了输入效率。
具体实施例2:用户要输入“建设局”,输入jian's'j,显示图2,按数字键“5”,转换为
jian'she'j
1建设局
按空格键,“建设局”上屏,相对2字词,3字词的编码组合要少。
本发明的进一步实施例:如果某些词全拼组合非常多,比如首字母是“l”的全拼有{lai,lan,lang lao,lei,leng,lia,lian,liang,liao,lie,lin,ling,liu,long,lou,luan,lue,lun,luo,lve}20个,不含“la、le、li、lu和lv”;可以采用每行显示2个以上的编码组合,如输入“ji’l”之后,输入界面显示:
1.lai lan lang lao
2.lei leng
3.lian liang liao
4.lie lin ling liu
5.long lou
6.luan lue lun luo
这样用户可以立刻找到要输入的词的编码,不需要翻页;如果要输入“寂寥”,按数字键“3”,输入界面显示:
1.ji’lian
2.ji’liang
3.ji’liao
再按数字键“3”
ji’liao
1寂寥
2集料
最后空格健,“寂寥”上屏,如果下次再输入该词,只要输入其简拼“j’l”,由于输入法通常具有根据用户的输入,调整其词库排序的功能,“寂寥”会排在首位会很快被输入。
本发明具有如下的技术效果:1)减少了简、混拼编码输入出现的重码词过多,大幅度减少翻页次数;2)兼顾击键次数和重码词的数量,输入效率得到最优化,比现有的输入编码方式,提高20%以上;3)词的编码在输入界面集中显示,使用户迅速判断出要输入的词编码是否存在,减少了输入的盲目性和击键次数及其误击率,增加了输入的命中率,各种输入词编码的提示,减少了用户思考拼音编码的强度,提高了打字效率。如果用于手机触摸屏,更有优势。
Claims (1)
1.一种输入汉语词组的方法,所述的词组是2字词和3字词,其特征是,如果输入所述的词组编码是第1字全拼第2、3简拼,并且如果其输入法对应的相同编码词的数量大于设定值时,输入界面显示了输入法词库内的拼音编码组合,具体是:第1字保持相同全拼,第2字显示和该字简拼对应的全拼全部,第3字简拼相同;当某个拼音编码对应的候选数字被选中,输入界面显示该编码对应的输入法词库全部的候选词;
所述的设定值是6;
在拼音编码转换为第1字和第2字是全拼,或者第1字和第2字是全拼以及第3字是首字母简拼的情况下,输入窗界面显示了全部的对应的2字词,或者3字词,如果选中某候选数字键,对应的候选词上屏。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319456.9A CN104991656B (zh) | 2015-06-11 | 2015-06-11 | 一种输入汉语词组的方法 |
KR1020167026293A KR20170027694A (ko) | 2015-06-11 | 2015-06-15 | 중국어 문구를 입력하는 방법 |
US15/505,728 US10042433B2 (en) | 2015-06-11 | 2015-06-15 | Method for inputting chinese phrase |
PCT/CN2015/000409 WO2016197267A1 (zh) | 2015-06-11 | 2015-06-15 | 一种输入汉语词组的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319456.9A CN104991656B (zh) | 2015-06-11 | 2015-06-11 | 一种输入汉语词组的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104991656A CN104991656A (zh) | 2015-10-21 |
CN104991656B true CN104991656B (zh) | 2018-12-21 |
Family
ID=54303472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510319456.9A Expired - Fee Related CN104991656B (zh) | 2015-06-11 | 2015-06-11 | 一种输入汉语词组的方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10042433B2 (zh) |
KR (1) | KR20170027694A (zh) |
CN (1) | CN104991656B (zh) |
WO (1) | WO2016197267A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170364486A1 (en) * | 2016-06-17 | 2017-12-21 | Yan Zhou | Precise Encoding and Direct Keyboard Entry of Chinese as Extension of Pinyin |
CN106293129B (zh) * | 2016-08-16 | 2018-11-02 | 汪念鸿 | 一种中文输入法中输入单个汉字的方法 |
CN110837306A (zh) * | 2018-08-18 | 2020-02-25 | 姜大林 | 一种字象输入法和学习法 |
CN113227946A (zh) * | 2018-11-03 | 2021-08-06 | 宗刚 | 一种拼音文字输入法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075262A (zh) * | 2007-06-12 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种计算机汉字输入方法及系统 |
CN101211238A (zh) * | 2006-12-28 | 2008-07-02 | 李政 | 用手写笔或手指在手写板上书写汉语拼音输入汉字的方法 |
WO2009098350A1 (en) * | 2008-02-05 | 2009-08-13 | Nokia Corporation | Device and method for providing fast phrase input |
CN101694608A (zh) * | 2008-12-04 | 2010-04-14 | 北京搜狗科技发展有限公司 | 一种输入法及输入法系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7165019B1 (en) * | 1999-11-05 | 2007-01-16 | Microsoft Corporation | Language input architecture for converting one text form to another text form with modeless entry |
US20060048055A1 (en) * | 2004-08-25 | 2006-03-02 | Jun Wu | Fault-tolerant romanized input method for non-roman characters |
US8438142B2 (en) * | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
CN100472536C (zh) * | 2007-03-26 | 2009-03-25 | 腾讯科技(深圳)有限公司 | 一种中文输入法简拼实现方法和系统 |
US8275601B2 (en) * | 2008-05-11 | 2012-09-25 | Research In Motion Limited | Mobile electronic device and associated method enabling transliteration of a text input |
CN101639732A (zh) * | 2008-12-08 | 2010-02-03 | 詹龙忠 | 一种用省拼编码的词组拼音输入法 |
US20120323556A1 (en) * | 2011-06-15 | 2012-12-20 | Chen Ti-Chih | System and method for using pinyin and a dynamic memory state for modifying a hanyu vocabulary test |
US8706472B2 (en) * | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US20140317564A1 (en) * | 2013-04-23 | 2014-10-23 | Synaptics Incorporated | Navigation and language input using multi-function key |
CN103246362B (zh) * | 2013-05-10 | 2016-03-23 | 小米科技有限责任公司 | 一种拼音输入的方法和装置 |
-
2015
- 2015-06-11 CN CN201510319456.9A patent/CN104991656B/zh not_active Expired - Fee Related
- 2015-06-15 KR KR1020167026293A patent/KR20170027694A/ko not_active Application Discontinuation
- 2015-06-15 US US15/505,728 patent/US10042433B2/en not_active Expired - Fee Related
- 2015-06-15 WO PCT/CN2015/000409 patent/WO2016197267A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211238A (zh) * | 2006-12-28 | 2008-07-02 | 李政 | 用手写笔或手指在手写板上书写汉语拼音输入汉字的方法 |
CN101075262A (zh) * | 2007-06-12 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种计算机汉字输入方法及系统 |
WO2009098350A1 (en) * | 2008-02-05 | 2009-08-13 | Nokia Corporation | Device and method for providing fast phrase input |
CN101694608A (zh) * | 2008-12-04 | 2010-04-14 | 北京搜狗科技发展有限公司 | 一种输入法及输入法系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104991656A (zh) | 2015-10-21 |
KR20170027694A (ko) | 2017-03-10 |
US10042433B2 (en) | 2018-08-07 |
WO2016197267A1 (zh) | 2016-12-15 |
US20170277276A1 (en) | 2017-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104991656B (zh) | 一种输入汉语词组的方法 | |
Simon | Some further notes on a class of skew distribution functions | |
US5218538A (en) | High efficiency input processing apparatus for alphabetic writings | |
CN101710262A (zh) | 字符纠错方法及装置 | |
CN102023782A (zh) | 一种输入转换过程中确定修改点的方法及装置 | |
US20140067731A1 (en) | Multi-dimensional information entry prediction | |
JP7049880B2 (ja) | 音声認識結果比較システム | |
CN103257721A (zh) | 在点击过程中不断变化以快速输入汉语拼音的屏幕键盘 | |
CN102033614B (zh) | 一种智能组合的公式输入方法及系统 | |
US8850311B2 (en) | Word input method | |
CN104933030A (zh) | 一种维吾尔语拼写检查方法及装置 | |
CN107943322A (zh) | 一种用于汉字拼音输入法的键盘及一种汉字拼音输入法 | |
CN103677302A (zh) | 手机中文快捷拼音输入的方法 | |
CN104571586B (zh) | 文字输入方法和装置 | |
CN106471743B (zh) | 普通ascii数据流的编码 | |
CN104991657A (zh) | 一种中文和日文假名综合输入法及输入法系统 | |
US7032175B2 (en) | Collision-free ideographic character coding method and apparatus for oriental languages | |
KR100804316B1 (ko) | 키패드에서의 알파벳 입력장치 및 그 방법 | |
CN104156077B (zh) | 标准键盘长词生成输入法 | |
KR100862242B1 (ko) | 단어 검색 방법 | |
US20170255274A1 (en) | Tibetan input method and system | |
US20160043736A1 (en) | System and method to concurrently match any type, combination and/or range of characters defined by a regular expression on a hardware implementation using a single detection logic | |
CN102768577B (zh) | 一种用户添加自定义词的方法 | |
WO2017113037A1 (zh) | 一种输入通用字的方法 | |
Taniceriu et al. | Error correction mechanism for five-key chording keyboards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20181029 Address after: 322200 18 District two, six Jian village, Yan tou Town, Pujiang, Jinhua, Zhejiang Applicant after: Pujiang Kaifeng Advertising Design Co.,Ltd. Address before: 215600 Room 203, 53 cloud 203 village, Zhangjiagang, Suzhou, Jiangsu Applicant before: Zhou Lianhui |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181221 |
|
CF01 | Termination of patent right due to non-payment of annual fee |