CN105425976A - 一种输入生僻字的方法 - Google Patents
一种输入生僻字的方法 Download PDFInfo
- Publication number
- CN105425976A CN105425976A CN201510319307.2A CN201510319307A CN105425976A CN 105425976 A CN105425976 A CN 105425976A CN 201510319307 A CN201510319307 A CN 201510319307A CN 105425976 A CN105425976 A CN 105425976A
- Authority
- CN
- China
- Prior art keywords
- rarely used
- used word
- input
- word
- rarely
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种输入生僻字的方法,属于计算机信息处理技术领域。为解决现有技术输入生僻字难以掌握,简化输入规则又会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字的问题,包括以下步骤:步骤1:用户输入;步骤2:调取生僻字集合并显示;步骤3:用户选择生僻字上屏。本方法适用于计算机终端或智能手机终端输入生僻字。
Description
技术领域
本发明具体涉及一种输入生僻字的方法,属于计算机信息处理技术领域。
背景技术
汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。在汉字计算机编码标准中,Unicode的中日韩统一表意文字基本字集则收录汉字简体、繁体及日语、韩语汉字共20902个,另有两个扩展区,近七万字。事实上,汉字数量要远远超过7万字,北京国安咨讯设备公司汉字字库收录了91251个汉字;而日本的《今昔文字镜》收录了近15个汉字。
输入法(InputMethod)指的是输入编码方式而不是实现文字输入的软件;如中文输入法中广泛使用的汉语拼音方案以及台湾使用注音符号,都能够作为汉字输入法的编码方式,从而形成能够录入汉字的拼音输入法或注音输入。拼音输入法相比其他输入法有着天然的优势,因为,现代每个接受教育的中国人在还没学习汉字前,就先用大量时间学习汉语拼音或注音符号,原本标记汉字的拼音也就可以轻松地作为汉字的输入编码;拼音输入法另一个优势就是接近口语,所以拼音输入法可以在短时间内适应。但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率相当高,即使词组重码率也是非常高。在输入汉字过程中,常常要翻很多页,才能找到需要的汉字,输入效率非常低下导致但大部分用户的不满。
输入法编辑器(InputMethodEditor)是一种程序,能使用户用“104键”的标准键盘,输入亚洲语言中数以千计的字符;IME用来存放系统输入法文件包括输入法程序、字典/词库(用于表意字的组成)、编码方案。当用户输入键击时,IME引擎会尝试确定应将键击转换成哪个(哪些)字符。
多数中国人认识的汉字数量在4000个左右,含国标一级3776个和部分国标二级汉字;因此4千字之外的几乎都是生僻字,所谓生僻字,就是多数人不知道这些字正确的读音及释义,因此很难用拼音输入法在计算机/智能手机上输入它们,这对于古籍文献的整理,以及汉字的信息化是一个巨大瓶颈。
根据GB18030-2000,合体字有以下结构:
1.左右结构、左中右结构;
2.上下结构、上中下结构;
3.全包围结构;
4.向上包围结构、向下包围结构;
5.向右包围结构、向右上包围结构、向右下包围结构;
6.向左下包围结构;
7.嵌套结构;
在中文拼音输入法状态下,要输入生僻字是非常困难的,如果要查字典,这样会中断输入,降低效率;如果凭猜测,有可能读音错误,如“埭”字,多数人可能会误读为“隶(li)”,但事实上,该字的正确读音是“dài”,这样的现象屡见不鲜。申请号为200710065842.5的中国专利《一种汉语拼音输入法》,针对“左右结构、上下结构、左中右结构、上中下结构”等合体字,提供了输入方法比如“玺(尔+玉)”的,采用“eryu?”输入;对于“汉字+部首/部件”结构的生僻字,通过输入“成字部件的全拼加上非成字部件拼音的第一个音节”来实现,如果非成字部件拼音多于一个,则选取任一个简单的非成字部件拼音的第一个音节,非成字部件拼音的读音规则根据国家标准;例如“菝(bá)”字由“拔”字和“草字头(cao)”,输入“bac?”,找到“菝”字。
在实际使用中,有些问题,因为有些人不知道国家标准的非成字部件的正确读法,也就无法知道其拼音编码,如“氐”字上的部件“罒”,估计多数人不太清楚如何读;而如果不输入非成字部件的读音编码,就会产生大量的重码生字;为了视觉友好性,目前输入法的输入窗平均显示5-7个候选字,通常需要不断的翻屏才能找到目标生僻字,如果是10万字,其重码生僻字的数量可想而知。
由于人们可能不知道所有组成生僻字的成字部件的全拼或非成字部件的汉语拼音,仍然很难输入生僻字,如果在输入法系统中简化输入规则,直接按组成生僻字的成字部件的全拼或非成字部件拼音的一个部分选择生僻字,将会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字。这种方法,对于拼音组合比较少,且生僻字选项较少的情况比较适用
发明内容
因此,本发明针对现有技术输入生僻字难以掌握,简化输入规则又会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字的问题,提供一种输入生僻字的方法,所述方法包括以下步骤:
步骤1:用户输入
用户激活生僻字输入法系统,输入要输入生僻字的一个成字部件的全拼或非成字部件拼音,所述生僻字输入法系统内,所有汉语拼音相同的成字部件的全拼或非成字部件拼音组成的生僻字组成一个生僻字集合,在一个生僻字集合内,成字部件的全拼或非成字部件拼音相同的生僻字组成生僻字子集;
步骤2:调取生僻字集合并显示
生僻字输入法系统的输入法程序根据步骤1输入的汉语拼音调取对应的生僻字集合,并将所述生僻字集合内的所有生僻字子集进行编号并显示在输入界面内;
步骤3:用户选择生僻字上屏
用户根据基本字选择对应的生僻字子集并按其编号对应的数字键,输入界面内显示选择的生僻字子集的所有生僻字并对其中每个生僻字进行编号,用户按要选择的生僻字的编号对应的数字键,要选择的生僻字上屏。
进一步的,所述步骤2中生僻字子集竖向排列并按顺序编号。
进一步的,所述步骤3中生僻字竖向排列并按顺序编号,每个生僻字后面标注其读音及对应的通假字等标注信息,所述标注信息只用于标注,不随生僻字上屏。
本发明的有益效果在于:绝大多数生僻字是由两个或两个以上的成字部件或非成字部件组成的,用户只要知道其中的一个成字部件或非成字部件的汉语拼音,输入后就可以利用本发明的方法,先选择生僻字子集,再选择生僻字,避免了大量的翻页查找工作,生僻字输入准确方便且速度快,本方法也可以用于常用汉字输入,但是普通的输入法一般包括了常用汉字字库,每个汉语拼音对应的选项并不多,因此本发明更适合生僻字的输入,尤其适合于计算机终端进行古籍文献的整理时使用,也可用于智能手机终端,满足一些用户喜欢使用生僻字的需求。
附图说明
图1是输入“vba”显示的示意图
图2是按键“3”的示意图
图3是程序流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行说明:
如图1所示,一种输入生僻字的方法,包括以下步骤:
步骤1:用户输入
在计算机终端或智能手机终端,用户激活生僻字输入法系统,通过键盘,输入拼音“vba”,生僻字输入法系统内,所有汉语拼音为“ba”的成字部件的全拼或非成字部件拼音组成的生僻字组成一个生僻字集合,在一个生僻字集合内,成字部件的全拼或非成字部件拼音相同的生僻字组成生僻字子集,包括“罷、八、巴、霸、罢”等成字部件或非成字部件;
步骤2:调取生僻字集合并显示
生僻字输入法系统的输入法程序根据步骤1输入的汉语拼音“ba”调取对应的生僻字集合,并将生僻字集合内的所有生僻字子集进行编号,并显示在输入界面内,显示结果如图2所示。
其中,生僻字子集竖向排列并按顺序编号,这样的排序方式使用户更加方便查找。
步骤3:用户选择生僻字上屏
用户根据基本字选择对应的生僻字子集并按其编号对应的数字键“3”,输入界面内显示选择的生僻字子集的所有生僻字并对其中每个生僻字进行编号,显示结果图3所示。
其中,生僻字竖向排列并按顺序编号,每个生僻字后面标注其读音及对应的通假字等标注信息,标注信息只用于标注,不随生僻字上屏。用户可以在输入生僻字的同时,获取该生僻字的读音及对应的通假字等标注信息。
用户按要选择的生僻字的编号对应的数字键“4”,要选择的生僻字“祓”上屏,标注信息不上屏。
上述具体实施方式只列举了对应汉语拼音“ba”的一部分生僻字,实际上还有许多符合条件的生僻字没有列入,如果将其全部列入,则本发明的优势将更加得到体现。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种输入生僻字的方法,所述的生僻字是国标一级3775之外的全部汉字包括日本汉字及韩国汉字,并且生僻字的结构是“通用字+非成字部件”,其中通用字是国标1级和2级的6780个汉字之中的简体字/繁体字或者异体字,其特征在于,所述生僻字中,具有相同汉语拼音的“通用字”的生僻字,组成一个生僻字集合,在该集合内,包括同一个通用字构成的生僻字,组成一个生僻字子集;所述的方法包括以下步骤:
步骤1:用户输入
用户激活生僻字输入法系统,输入“v”后,连续输入所述的生僻字包括的“通用字”的拼音的全拼编码;
步骤2:调取生僻字集合并显示
输入法读取生僻字集合,并将由同一个通用字构成的生僻字子集编号、排序并显示在输入界面内;
步骤3:调取生僻字子集并显示
用户键入某候选数字键,该候选数字编号在步骤2的输入界面对应的同一类生僻字子集内的全部生僻字进一步显示在输入界面内,而且所述的每一个生僻字被全部编号、排序;
步骤4:用户选择生僻字上屏
用户键入某候选数字键,步骤3的输入界面内对应的生僻字上屏。
2.如权利要求1所述的输入生僻字的方法,其特征在于,所述步骤2中,生僻字子集竖向排序并按顺序编号。
3.如权利要求1所述的输入生僻字的方法,其特征在于,所述步骤3中,生僻字竖向排序并按顺序编号。
4.如权利要求3所述的输入生僻字的方法,其特征在于,所述步骤3中,每个生僻字后面标注其读音及对应的通假字等标注信息,所述标注信息只用于标注,不随生僻字上屏。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319307.2A CN105425976A (zh) | 2015-06-11 | 2015-06-11 | 一种输入生僻字的方法 |
PCT/CN2015/000407 WO2016197265A1 (zh) | 2015-06-11 | 2015-06-15 | 一种输入生僻字的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319307.2A CN105425976A (zh) | 2015-06-11 | 2015-06-11 | 一种输入生僻字的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105425976A true CN105425976A (zh) | 2016-03-23 |
Family
ID=55504232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510319307.2A Pending CN105425976A (zh) | 2015-06-11 | 2015-06-11 | 一种输入生僻字的方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105425976A (zh) |
WO (1) | WO2016197265A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145244A (zh) * | 2017-04-26 | 2017-09-08 | 北京汉王数字科技有限公司 | 一种异形字符输入方法、装置及电子设备 |
CN112199031A (zh) * | 2020-10-15 | 2021-01-08 | 科大讯飞股份有限公司 | 输入方法、装置、设备及存储介质 |
CN114637407A (zh) * | 2020-12-15 | 2022-06-17 | 中国联合网络通信集团有限公司 | 汉字输入方法、系统、计算机设备及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444680B (zh) * | 2020-04-25 | 2023-05-16 | 中信银行股份有限公司 | 生僻字的编码扩展方法、装置、存储介质及电子设备 |
CN112698734B (zh) * | 2020-12-24 | 2024-04-26 | 维沃移动通信有限公司 | 候选词显示方法及装置、电子设备 |
CN117151041B (zh) * | 2023-10-27 | 2024-02-27 | 成方金融科技有限公司 | 兼容生僻字的pdf生成方法、装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1719390A (zh) * | 2005-07-18 | 2006-01-11 | 王宏源 | 利用汉字全信息通过全文检索获取生僻字的检字录入方法 |
US20070040813A1 (en) * | 2003-01-16 | 2007-02-22 | Forword Input, Inc. | System and method for continuous stroke word-based text input |
CN101236461A (zh) * | 2008-02-25 | 2008-08-06 | 黄健风 | 一种基于字形特征的汉字输入法 |
CN102541281A (zh) * | 2010-12-22 | 2012-07-04 | 张家港市赫图阿拉信息技术有限公司 | 一种输入疑难字的方法 |
CN102736741A (zh) * | 2011-04-12 | 2012-10-17 | 腾讯科技(深圳)有限公司 | 一种汉字的拼音输入方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923421A (zh) * | 2009-06-09 | 2010-12-22 | 邓桂成 | 候选汉字显示方法和系统以及汉字输入方法和系统 |
CN102566769B (zh) * | 2010-12-13 | 2015-11-25 | 深圳市世纪光速信息技术有限公司 | 汉字输入方法及系统 |
-
2015
- 2015-06-11 CN CN201510319307.2A patent/CN105425976A/zh active Pending
- 2015-06-15 WO PCT/CN2015/000407 patent/WO2016197265A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070040813A1 (en) * | 2003-01-16 | 2007-02-22 | Forword Input, Inc. | System and method for continuous stroke word-based text input |
CN1719390A (zh) * | 2005-07-18 | 2006-01-11 | 王宏源 | 利用汉字全信息通过全文检索获取生僻字的检字录入方法 |
CN101236461A (zh) * | 2008-02-25 | 2008-08-06 | 黄健风 | 一种基于字形特征的汉字输入法 |
CN102541281A (zh) * | 2010-12-22 | 2012-07-04 | 张家港市赫图阿拉信息技术有限公司 | 一种输入疑难字的方法 |
CN102736741A (zh) * | 2011-04-12 | 2012-10-17 | 腾讯科技(深圳)有限公司 | 一种汉字的拼音输入方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145244A (zh) * | 2017-04-26 | 2017-09-08 | 北京汉王数字科技有限公司 | 一种异形字符输入方法、装置及电子设备 |
CN112199031A (zh) * | 2020-10-15 | 2021-01-08 | 科大讯飞股份有限公司 | 输入方法、装置、设备及存储介质 |
CN112199031B (zh) * | 2020-10-15 | 2022-08-05 | 科大讯飞股份有限公司 | 输入方法、装置、设备及存储介质 |
CN114637407A (zh) * | 2020-12-15 | 2022-06-17 | 中国联合网络通信集团有限公司 | 汉字输入方法、系统、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2016197265A1 (zh) | 2016-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105425976A (zh) | 一种输入生僻字的方法 | |
US7256769B2 (en) | System and method for text entry on a reduced keyboard | |
CN101493727A (zh) | 语句输入法的自然分词和混合输入 | |
CN100462901C (zh) | Gb拼音输入法 | |
Lu | Computers and Chinese writing systems | |
CN104850240B (zh) | 一种基于手机20键位输入法的显示键盘及其输入方法 | |
US5137383A (en) | Chinese and Roman alphabet keyboard arrangement | |
WO2000043861A1 (en) | Method and apparatus for chinese character text input | |
KR100948124B1 (ko) | 단어 입력 방법 | |
CN1936791A (zh) | 一种基于音节的蒙古文数字键盘输入法 | |
CN103677302A (zh) | 手机中文快捷拼音输入的方法 | |
CN105183183A (zh) | 一种方块苗文的音形结合快速输入编码及其优化方法 | |
CN101587374A (zh) | 一种输入键盘及其拼音输入方法 | |
CN101533311A (zh) | 笔画类汉字输入法 | |
CN107943322A (zh) | 一种用于汉字拼音输入法的键盘及一种汉字拼音输入法 | |
CN103197768A (zh) | 一种形意文字输入法及输入键盘 | |
CN101071337A (zh) | 一种拼音字母、数字的汉字输入法及键盘和屏幕的显示方法 | |
CN101408807A (zh) | 一种输入中英文字符串的方法 | |
CN101533307B (zh) | 一种汉字输入方法、键盘及应用该键盘的终端 | |
CN100409153C (zh) | 分区汉字输入法 | |
CN104991657A (zh) | 一种中文和日文假名综合输入法及输入法系统 | |
US20240184381A1 (en) | Chinese character input method and system and keyboard | |
CN111831124A (zh) | 一种触摸屏拼音输入法的键位布置和输入方法 | |
CN103576891A (zh) | 一键快打字 | |
CN102156616A (zh) | 触摸屏写键输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160323 |
|
WD01 | Invention patent application deemed withdrawn after publication |