CN1434365A - 中文字形输入装置及中文字形输入法 - Google Patents

中文字形输入装置及中文字形输入法 Download PDF

Info

Publication number
CN1434365A
CN1434365A CN02140752A CN02140752A CN1434365A CN 1434365 A CN1434365 A CN 1434365A CN 02140752 A CN02140752 A CN 02140752A CN 02140752 A CN02140752 A CN 02140752A CN 1434365 A CN1434365 A CN 1434365A
Authority
CN
China
Prior art keywords
font
group
mentioned
input
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02140752A
Other languages
English (en)
Other versions
CN1237435C (zh
Inventor
菅野芩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1434365A publication Critical patent/CN1434365A/zh
Application granted granted Critical
Publication of CN1237435C publication Critical patent/CN1237435C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种中文字形输入装置及中文字形输入法。其中,所有的汉字分属于不考虑部件而考虑部首而被分类的字形小组。各字形小组被编入更上位的字形中组,各字形中组被编入更上位的字形大组。按照此字形分类的层结构引导输入。即,首先提示各字形大组,通过第一次击键选择其中的一个。接着,提示各字形中组,通过第二次击键选择其中的一个。然后,提示各字形小组,通过第三次击键选择其中的一个,确定输入对象汉字所属的字形小组。这样,根据对数字键等的三次击键就可以高效率地收敛得出候选汉字。

Description

中文字形输入装置及中文字形输入法
技术领域
本发明涉及根据中文文字字形输入中文的中文字形输入,特别涉及使用有限个数的键输入中文的中文字形输入装置及中文字形输入法。
背景技术
迄今为止,作为一种中文的输入法,具有将汉字根据其字形进行输入的字形输入法。如利用这种现有的字形输入法,要根据汉字字形将其分解为称为部件的部分,使用者通过将多个部件进行组合而指定所希望的汉字。这个所谓的部件概念,不是在学校的基础教育中使用的概念,而是为了进行中文输入而开发的概念。因此,在开发中文输入程序及装置时,部件也多半是适应设想的条件而单独生成的。
这样,分解汉字生成部件的字形分解法虽然没有统一,但任何一种字形分解法都将汉字分解为500种以上的部件。为了能将这样生成的500种以上的部件利用数十个键输入,将各部件编入数十种部件组中。即,各部件都属于某一个部件组。因此,使用者不仅事先要记忆全部500种以上的部件,而且必须同时记忆各部件属于哪一个部件组。
对于多数汉字而言,一个文字是由多个部件构成的。于是,使用者通过按照规定预定的组合的规则的顺序指定多个部件逐步收敛得出作为候选的汉字。因此,除了上述部件及部件组之外,使用者还必须事先记忆部件组合规则。图24是现有的字形输入法的说明图。如此图所示,通过按照规定预定的组合的规则的顺序指定各部件,可确定满足指定条件的汉字组。
最近,开发了面向便携式电话机或PDA(个人数字助理)的字形输入法。根据这一方法,对于生成的部件组,可通过对9个键进行两次击键而选择部件组。具体而言,就是生成81种部件组,各部件组按照其字形特征再分类成为9种。于是,通过第一击键选择应该最先输入的部件的字形特征,通过第二击键选择具有该字形特征的部件组中所希望的那个。之后,通过第三击键选择应该接着输入的部件的字形特征,通过第四击键及其后的击键从满足至此输入的条件的汉字组之中选择所希望的汉字。这种9键输入法,在不是利用一次击键而是利用两次击键选择一个部件组这一点上,与上述的利用数十个键的输入法是不同的,但其输入的基本概念则是共同的。
根据上述现有的字形输入法,首先输入的部件(第1部件)及接着输入的部件(第2部件),无论哪一个都是从利用同一字形分解法生成的各部件中进行选择。在这种字形输入法中,使用者对通过指定第1部件收敛得出的候选群很难通过其后的输入进行更有效地收敛。即,因为在进行最初收敛时利用的条件和在其后收敛时利用的条件是根据利用同一字形分解法生成的各部件指定的,因此很难将多量的汉字均等地划分到通过收敛确定的各汉字组。
例如,在此输入法中,在指定与“三点水”相当的部件作为第1部件的场合,满足这一指定条件的候选个数,在GB编码(GB2312)规定的6763字中可达到大约350字。另外,在指定与“草字头”相当的部件作为第1部件的场合,候选个数也同样为大约350字。
这样收敛得出的约350字的汉字,通过第三击键可再次收敛。假设将约350字的汉字对应9个键进行平均9等分,则每一个键分配到的汉字约为40个。但是,实际上,为第三击键设定的选择分支与第一击键设定的相同。因此,很难对各键均等地分配汉字。具体地说,有时对一个键可分配多达80个字的汉字。在这一点上,由于收敛不充分,要进行高效率的输入是很难的。
发明内容
本发明的目的是提供一种可使用有限个数的键高效地输入字形的中文字形输入装置及中文字形输入法。
为达到上述目的,本发明采用以下的字形分类法。该字形分类法是将作为输入对象所设想的全部汉字按照其字形特征分类为多个字形小组。此外,此字形分类法,通过将各字形小组编入上位组而形成多层的层结构。从此层结构的上位各组中选择一个组,同样地,通过从属于所选择的组的下位各组中选择一个组,来确定作为输入对象的汉字所属的字形小组。
例如,在将这些字形小组分类为大约1000个左右以使使用频率高的汉字分散到不同的组,将这些字形小组编入大约100个左右的中组中,将这些字形中组编入大约10个左右的字形大组中的场合,对大约10个左右的数字键等的输入键进行3次击键就可能确定一个字形小组。因此,就可以在具备10个左右的键的各种信息设备上进行中文字形输入。这种信息设备例如,可以是便携式电话机,也可以是PDA。
根据字形小组进行分类的汉字,可以是简体字,也可以是繁体字。另外,此处的汉字也可以是在日本、韩国或其他国家及地区使用的汉字。
附图的简要说明
图1为示出根据本发明的一实施方式的汉字分类的说明图。
图2为模式地示出本发明的一实施方式的中文字形输入的构成的方框图。
图3为示出触摸屏式的便携式电话机的外观的模式图。
图4为示出中文输入模式(大分类选择)的第2显示单元的显示例的模式图。
图5为示出中文输入程序的输入模块的构成的模式图。
图6为示出大分类表的模式图。
图7为示出中分类表的模式图。
图8为示出进行中分类选择时的第2显示单元的显示例的模式图。
图9为示出小分类表的模式图。
图10为示出进行小分类选择时的第2显示单元的显示例的模式图。
图11为示出进行小分类选择时的第2显示单元的显示例的模式图。
图12为示出进行小分类选择时的第2显示单元的显示例的模式图。
图13为示出进行小分类选择时的第2显示单元的显示例的模式图。
图14为示出进行小分类选择时的第2显示单元的显示例的模式图。
图15为示出进行小分类选择时的第2显示单元的显示例的模式图。
图16为示出进行小分类选择时的第2显示单元的显示例的模式图。
图17为示出进行小分类选择时的第2显示单元的显示例的模式图。
图18为示出进行小分类选择时的第2显示单元的显示例的模式图。
图19为示出进行小分类选择时的第2显示单元的显示例的模式图。
图20为示出本发明的一实施方式的处理的流程图。
图21为示出辞典数据的模式图。
图22为示出中文字形输入的具体示例的模式图。
图23为示出通常的便携式电话机的显示例的模式图。
图24为已有的字形输入法的说明图。
具体实施方式
首先,对根据本发明的字形分类法予以说明。该字形分类法,是根据汉字使用频率的统计调查结果对其进行分类,将使用频率高的汉字不集中于一个组内。即,考虑将使用频率高的汉字,分配到不同的组中。
另外,在该字形分类法中,不采用迄今为止一直采用的“部件”,而代之以采用在学校基础教育中的“部首”。因为通常使用汉字的人具有关于部首的知识,因此即使对部首不再进行学习,也可以理解这种字形分类法。另外,部首的种类与部件相比要少得多,多半具有固有的意义。因此,易于理解根据字形而被分类的各组的定义及其特征。另外,对不具有关于部首的知识的人来说,与部件的情况相比较,该知识掌握起来也简单得多。另外,因为所掌握的知识与学校的基础教育是一致的,所以采用此部首的字形分类法对汉字教育也能起到作用。
对所有的汉字都可确定部首。所以,对应于大约200种部首,可将汉字分类到大约200种组中。如设定为GB2312规定的汉字,则属于各部首的汉字,少的情况下为数个,多的情况下为数百个。这些部首中,对使用频率高的汉字数少的部首,是将多个这样的部首集合在一起组合成为一个字形组。另一方面,对使用频率高的汉字数多的部首,则根据部首以外的字形信息再进行细分类。另外,汉字中除部首以外的部分称为“部首外”,此部首外的字形信息用于对汉字进行进一步的细分。
作为此部首外的字形信息,可使用部首外的笔画及笔顺信息。具体而言,部首外信息可以是按照写字时的笔顺的第一笔画、第二笔画、第三笔画等信息。另外,至于利用到第几个笔画可根据细分的程度而定。即,在属于某一部首的使用频率高的汉字的个数多的场合,要根据多的笔画信息对这些汉字进行细分。
关于笔画,在中国,确定有标准化的基本笔画。此基本笔画,利用数字1~5表示如下。即,
1:横(从左向右的笔迹线),
2:竖(从上向下的笔迹线),
3:撇(从右上向左下的笔迹线),
4:点(从左上向右下的笔迹线),
5:折(各种折线)。
在本发明的字形分类法中,为了表现笔画,除了上述的数字1~5之外,还使用表示无笔画的数字0。另外,希望在字形分类法中利用基本笔画有助于此基本笔画的标准的普及及汉字教育。
更具体而言,基本笔画及笔顺,是通过将数字顺序排列而表现的。例如,“1”表示第一基本笔画是横,“12”表示第一基本笔画是横,第二基本笔画是竖。另外,关于基本笔画及笔顺,不仅可通过这种数字串表示,也可以通过部首及汉字本身表现。即,“十”表示第一基本笔画为横,第二基本笔画为呈十字交叉状的竖,而“口”表示第一基本笔画为竖,第二基本笔画为折以及第三基本笔画为横的口字状的笔迹线。
此外,字形组,也有根据汉字部首的位置信息定义的。例如,部首“山”在“峰”字中位于汉字的左侧,在“岩”字中位于汉字的上侧,在“岳”字中位于汉字的下侧。这些“峰”、“岩”、岳”可分别根据其部首信息表现为“山左”、“山上”及“山下”。这样,在汉字部首的位置为上侧、下侧、左侧、右侧或中侧的场合,通过在部首名的紧后方添加“上”、“下”、“左”、“右”或“中”就可以表示出该汉字所属的字形组的特征。另外,在汉字部首的位置为上、下、左、右或中以外的场合,通过在部首名的紧后方添加“*”,可以表示出该汉字所属的字形组的特征。例如,“岛”字,由于其部首“山”的位置在上、下、左、右或中以外,所以其对应的标为“山*”。此“*”为表示其他的意思的标。
如利用上述标法,“土左33”表示部首“土”位于汉字左侧,部首外的第一基本笔画是撇,第二基本笔画也是撇的汉字。另外,“土左34”表示部首“土”位于汉字左侧,部首外的第一基本笔画是撇,第二基本笔画是点的汉字。如果属于“土左33”的汉字及属于“土左34”的汉字都形成一个汉字组而汉字太少时,可以将两者合起来形成一个汉字组。此汉字组可标为“土左33/4”。此处记号“/”表示的意思是“或”。此记号的有效范围,原则上,是仅标分字符串的该记号前后1个文字。另外,记号“-”是表示范围的记号,意思是“至”。例如,“土左1-4”表示将“土左1”、“土左2”、“土左3”或“土左4”的汉字汇集到一个汉字组。
于是,在本实施方式中,将使用频率高的汉字适当分散而分类为约950个汉字组。按照上述标法这些汉字组的每一个都具有唯一的分辨特征。另外,以上述标法表示的汉字组称为字形小组。
图1为示出根据本发明的一实施方式的汉字分类的说明图。如此图1所示,这950个字形小组编入字形中组及字形大组的层结构以使其可以通过对10个键击键3次而确定。即,各字形小组属于10个(或10个以下)字形中组的某一个,各字形中组属于10个字形大组的某一个。这样,就可以根据由字形大组、字形中组及字形小组组成的树形结构进行分类。
图2为模式地示出有关本实施方式的便携式电话机的中文字形输入的部分的方框图。图3为此便携式电话机的外观的模式图。此便携式电话机备有第1显示单元11,第2显示单元12,输入单元13,模式切换按钮14以及控制单元20。第1显示单元11,例如,由液晶显示器组成,可显示文字、数字及记号。第2显示单元12,例如,由液晶显示器组成,其表面设置有作为透明触摸屏的输入单元13。模式切换按钮14系用于在电话号码输入模式(一次击键输入一个数字)、英文文字输入模式(两次击键确定输入一个文字)及中文输入模式(三次击键输入一个汉字字形信息)之间进行切换。
控制单元20与这些第1显示单元11、第2显示单元12、输入单元13及模式切换按钮14分别相连接。于是,控制单元20可在第1显示单元11中显示所要求的文字。并且,第2显示单元12被分割为4行3位的矩形区域。于是,控制单元20,可在这些矩形区域内分别显示所希望的数字、记号或字符串。
此外,控制单元20,在输入单元13被按下的场合,可检测出输入单元13的哪一部分被按下了。因此,在使用者通过输入单元13按下第2显示单元12的各矩形区域的场合,控制单元20可检测出对应于哪一矩形区域的部分被按下。所以,各矩形区域可分别作为独立的按钮(键)使用。
另外,控制单元20具有可存储数据的字形缓冲器21及指针缓冲器22。字形缓冲器21,在中文输入模式中,取得输入单元13的按押历史,存放有在按下后退键时返回到前一步骤的信息。此外,控制单元20,具有图中未示出的ROM及RAM作为存储单元,在其中的ROM内存储有中文字形输入程序23。此中文字形输入程序23,具有输入模块24及转换模块25。
另外,此便携式电话机,具有图中未示出的无线接收发送单元及收发话单元,使用者可进行与通常的便携式电话机同样的通话。此外,使用者可将包含英文文字及中文的文本数据输入并将输入的数据作为电子邮件发送出去。
这些英文文字及中文的输入分别在英文文字输入模式及中文输入模式下完成。另外,使用者通过操作模式切换按钮14可在英文文字输入模式和中文输入模式之间进行切换。于是,控制单元20,在设定为英文文字输入模式时可接受英文文字输入,在设定为中文输入模式时可接受中文输入。
图4为示出中文输入模式中的显示单元12的显示例的模式图。另外,此图4示出输入阶段设定为后述的大分类选择时的状态。利用模式切换按钮14,在设定为中文输入模式时,在第2显示单元12上显示图4示出的输入引导。
图5为示出中文字形输入程序23的输入模块24的构成的模式图。此输入模块24,包含有分别与大分类选择24a、中分类选择24b及小分类选择24c各输入阶段的处理相对应的代码段。大分类选择24a的处理对应第一次击键,中分类选择24b的处理对应第二次击键,而小分类选择24c对应第三次击键。
另外,在控制单元20的ROM中,存放有大分类表D、中分类表D0~D9以及小分类表D00~D99。大分类表D,供输入阶段为大分类选择24a时进行参照,中分类表D0~D9,供输入阶段为中分类选择24b时进行参照,而小分类表D00~D99,供输入阶段为小分类选择24c时进行参照。
图6为示出大分类表D的模式图。此大分类表D,具有多个记录。这些记录具有“按钮”、“引导”以及“指针”字段。在“指针”字段中,存放有在按下10个按钮(对应数字1~9、0)时生成的数字代码。
此大分类表D的各记录分别对应各字形大组,在“引导”字段中存放有表示对应的字形大组的符号。在“指针”字段中存放有指向中分类表D0~D9的指针。另外,在中分类选择24b中,只参照各中分类表D0~D9中的一个。即,在大分类选择24a中选择的字形大组所对应的记录的“指针”,指定中分类表D0~D9中的一个。
利用第一次击键,通过选择大分类表D的一个记录,完成大分类选择24a,输入阶段转移到中分类选择24b。在此中分类选择24b中,参照中分类表D0~D9。图7为示出中分类表D0~D9的模式图。各中分类表D0~D9每一个都具有多个记录。这些中分类表D0~D9的各记录,具有“按钮”、“引导”以及“指针”字段。在“按钮”字段中,存放有在按下10个按钮(对应数字1~9、0)时生成的数字代码。
此中分类表D0~D9的各记录分别对应各字形中组,在“引导”字段中存放有表示对应的字形中组的符号。在“指针”字段中存放有指向小分类表D00~D99的指针。另外,在小分类选择24c中,只参照各小分类表D00~D99中的一个。即,在中分类选择24b中选择的字形中组所对应的记录的“指针”,指定小分类表D00~D99中的一个。
图8为示出设定输入阶段为中分类选择24b时显示单元12的显示例的模式图。在前一阶段的大分类选择24a中,如按下图4示出的任何一个按钮,在中分类选择24b中,图8的(D0)~(D9)中的一个显示于第2显示单元12。另外,在图8中,显示的是配置为4行3列的多个显示例,各显示例分别对应于图4的4行3列的按钮。在图4中,12个按钮中只有10个为大分类选择所利用,如按下这10个按钮中的任何一个,就显示图8的显示例中的对应位置的内容。
利用第二次击键,通过选择中分类表D0~D9的一个记录,完成中分类选择24b,输入阶段转移到小分类选择24c。在此小分类选择24c中,参照小分类表D00~D99。
图9为示出小分类表D00~D99的模式图。各小分类表D00~D99每一个都具有多个记录。这些小分类表D00~D99的各记录,具有“按钮”、“引导”以及“字形代码”字段。在“按钮”字段中,存放有在按下10个按钮(对应数字1~9、0)时生成的数字代码。
此小分类表D00~D99的各记录分别对应各字形小组,在“引导”字段中存放有表示对应的字形小组的符号。在“字形代码”字段中存放有单纯地赋予对应的字形小组的字形代码。
图10至图19为示出在设定输入阶段为小分类选择24c时显示单元12的显示例的模式图。在前一阶段的中分类选择24b中,如按下图8示出的任何一个按钮,在小分类选择24c中,图10至图19中的各显示例中的一个显示于显示单元12。
另外,在图10中,显示的是配置为4行3列的多个显示例,各显示例分别对应于图8的(D1)的4行3列的按钮。如按下这10个按钮中的任何一个,就显示图10的显示例中的对应位置的内容。同样,图11与图8的(D2)对应,图12与图8的(D3)对应,图13与图8的(D4)对应,图14与图8的(D5)对应,图15与图8的(D6)对应,图16与图8的(D7)对应,图17与图8的(D8)对应,图18与图8的(D9)对应,图19与图8的(D0)对应。
利用第三次击键,通过选择小分类表D00~D99的一个记录,完成小分类选择24c,确定作为输入对象的汉字所属的字形小组。
下面参照图20的流程图,以中文字形输入程序23的输入模块24的处理为中心再予以说明。此流程图,以使用者操作模式切换按钮14设定中文输入模式开始,以设定其他的输入模式而结束。
另外,控制单元20,在执行此流程图中,参照指针缓冲器22,可识别在该定时的输入阶段是大分类选择、中分类选择及小分类选择中的哪一个阶段。即对于输入阶段,在指针缓冲器22为NULL时判定其为大分类选择,在指针缓冲器22中存放有D0~D9中的任何一个时判定其为中分类选择,而在指针缓冲器22中存放有D00~D99中的任何一个时判定其为小分类选择。
在最初的S1中,控制单元20,将指针缓冲器22设定为NULL,设定输入阶段为大分类选择。
在S2中,控制单元20参照大分类表D(图6),在第2显示单元12中显示作为候选的各字形大组。于是,显示单元12,切换为图4所示的状态。
在S3中,控制单元20等待使用者的输入。如检测出输入,处理就进入S4。
在S4中,控制单元20判断使用者的输入是按下输入单元13的输入,还是其他的输入。另外,其他的输入包括按下后退键、按下转换模块25使用的键等。在按下输入单元13的场合,进入S5,在其余场合处理进入S15。
在S5中,控制单元20参照指针缓冲器22,判断输入阶段是大分类选择、中分类选择及小分类选择中的哪一个。如是大分类选择,处理就进入S6,如是中分类选择,处理就进入S9,而如是小分类选择,处理就进入S12。
在S6中,控制单元20根据使用者在输入单元13上按下的位置,确定图4所显示的各按钮中的哪一个按钮被按下。即,控制单元20确定使用者选择的是大分类表D(图6)的哪一个记录。于是,控制单元20,在第1显示单元11上显示所确定的记录的“引导”的字形大组。例如,如“引导”确定的是“121/2”记录,则在显示单元11上显示“121/2”。另外,字形大组的“121/2”指示的是笔画是以横、竖、横(121)的笔顺开始的部首,或笔画以横、竖、横(122)的笔顺开始的部首的各字形中组。
在S7中,控制单元20通过设置指针缓冲器22,可将输入阶段设置为中分类选择。具体而言,控制单元20取得在S6中对大分类表D(图6)确定的记录的“指针”字段的值,并写入到指针缓冲器22。例如,“引导”是确定“121/2”记录的话,则在指针缓冲器22中存放“D1”。
在S8中,控制单元20参照各中分类表D0~D9(图7)中的指针缓冲器22中存放的值所对应的内容,在第2显示单元12上显示作为候选的各字形中组。于是,在显示单元12上显示图8的(D0)~(D9)中的一个。例如,如在指针缓冲器22中存放的是“D1”,则显示图8的(D1)。于是,处理返回到S3。
在S9中,因为在S5中判定的输入阶段是中分类选择,控制单元20根据使用者在输入单元13上按下的位置,确定如图8的某一个所示的那样所显示的各按钮中的哪一个按钮被按下。即,控制单元20确定使用者选择的是中分类表D0~D9(图7)的哪一个记录。于是,控制单元20,在第1显示单元11上显示所确定的记录的“引导”的字形中组来取代显示于显示单元11上的字形大组。例如,如“引导”确定的是“土左1-4”记录,则在显示单元11上显示“土左1-4”来代替此前显示于显示单元11上的字形大组“121/2”。另外,“土左1-4”指示的是部首是偏旁“土”,部首外的笔画以1至4开始的各字形小组。
在S10中,控制单元20通过设置指针缓冲器22,可将输入阶段设置为小分类选择。具体而言,控制单元20,取得在S9中对中分类表D1~D9(图7)确定的记录的“指针”字段的值,并写入到指针缓冲器22。例如,若中分类表D1的“引导”确定的是“土左1-4”记录,则在指针缓冲器22中存放“D11”。
在S11中,控制单元20参照各小分类表D00~D99(图9)中的指针缓冲器22中存放的值所对应的内容,在第2显示单元12上显示作为候选的各字形小组。于是,在显示单元12上显示图10至图19的各显示例中的一个。例如,如在指针缓冲器22中存放的是“D11”,则显示图10的(D11)。于是,处理返回到S3。
在S12中,因为在S5中判定的输入阶段是小分类选择,则控制单元20根据使用者在输入单元13上按下的位置,确定如图10至图19的某一个显示例所示的那样所显示的各按钮中哪一个按钮被按下。即,控制单元20确定使用者选择的是小分类表D00~D99(图9)的哪一个记录。所确定的记录的“字形代码”就被决定作为使用者输入的字形小组的字形代码。
此外,控制单元20,通过将决定的字形小组的字形代码转送到转换模块25而从此转换模块25取得与该字形代码相对应的汉字。另外,在作为候选的汉字有多个的场合,例如,在转换模块25中,作为第一候选登记的汉字。另外,转换模块25,也可考虑已经输入的字形代码来选择汉字。于是,控制单元20在第1显示单元11上显示从转换模块25取得的汉字来代替显示于显示单元11上的字形中组。
在S13中,控制单元20通过清除指针缓冲器22,将输入阶段设置为大分类选择。即,指针缓冲器22被设置为NULL为下一个输入做好准备。
在S14中,控制单元20参照大分类表D(图6),在第2显示单元12上显示作为候选的各字形大组。于是,显示单元12被切换为图4所示的状态。于是,处理返回到S3。
另一方面,在S15中,控制单元20根据使用者的操作执行相对应的处理。例如,如按下转换模块25使用的键,则按照对该键定义的功能,执行汉字选择及确定等的处理。于是,处理返回到S3。
如上所述,在本实施方式中,通过3次击键决定字形小组,根据此字形小组的字形代码,执行汉字转换。下面再对此汉字转换予以说明。
此汉字转换是通过参照预先存储于存储单元中的辞典数据而完成的。另外,此汉字转换也可以以单词为单位进行。即,也可以对作为构成输入对象的单词的所有的汉字,在确定各汉字分别所属的全部各字形小组之后,根据这些各字形小组的字形代码顺序排列而成的字形代码组,进行以单词为单位的转换。
图21为示出辞典数据的模式图。此辞典数据具有与字形代码组相对应的多个记录。具体而言,在各记录的“字形代码”的字段中存放字形代码组,在“单词群”的字段中按照使用频率存放具有由该字形代码组规定的特征的全部单词。于是,转换模块25参照此辞典数据,确定与输入模块24输出的字形代码组相对应的单词群,并在第1显示单元11中显示确定的单词群中使用频率最高的单词。
于是,在显示的单词与作为输入对象的单词不同的场合,使用者通过按下被定义为转换用的按键,也可以选择该单词群中其它的候选。也可以将单词群中的各单词的排列进行更新以反映此使用者对各单词的使用频率。换言之,单词群中的各单词的排列可以是固定的,也可以是可变的。
另外,在上述的“单词”中也包含在中文文法中通常不看作单词的“虚词”。另外,汉字转换不限于以单词为单位,也可以以由短语构成的字符串为单位进行转换。
下面,参照图22,更具体地对单词“砂糖”的输入予以说明。在图22的各显示例P01~P07中每一个都模式化地示出两显示单元11、12。
图22的P01是中文输入模式的初始画面。在此P01中,在第2显示单元12上显示大分类表D的各字形大组。另外,在第1显示单元11上无任何显示。“砂糖”的“砂”的部首是偏旁“石”,由于偏旁“石”的笔画是以13笔顺开始,所以属于字形大组“1*符”。如使用者按下“1*符”选择字形大组“1*符”,则两显示单元11、12切换为P02的状态。
在P02中,在第1显示单元11上显示“1*符”,在第2显示单元12上显示中分类表D3的各字形中组。因为在这些各字形中组之中有部首为偏旁“石”的组,如使用者按下示出偏旁“石”的“石”按钮而选择字形中组“石”,则两显示单元11、12切换为P03状态。
在P03中,在第1显示单元11上显示“石”,在第2显示单元12上显示小分类表D31的各字形小组。在此小分类表D31中部首为偏旁“石”的汉字还以其部首外的笔画的笔顺进行分类。因为“砂”的部首外是以笔画2(竖)开始,如使用者按下“石2/0”按钮而选择字形小组“石2/0”,则两显示单元11、12切换为P04状态。
在P04中,在第1显示单元11上显示与字形小组“石2/0”的字形代码314相对应的第一候选汉字“石”。另一方面,在第2显示单元12上,显示大分类表D的各字形大组供下面输入时使用。下一个汉字“糖”的部首是“米”,由于此“米”是以笔画43的笔顺开始而属于字形大组“41-43言”。如使用者按下“41-43言”按钮而选择字形大组“41-43言”,则两显示单元11、12切换为P05状态。
在P05中,在第1显示单元11上显示与输入完毕的字形小组“石2/0”相对应的汉字“石”,并且,显示新选择的字形大组“41-43言”。另一方面,在第2显示单元12上,显示中分类表D8的各字形中组。因为其中部首“米”包含在字形中组“羊米”中,如使用者按下“羊米”按钮而选择字形中组“羊米”,则两显示单元11、12切换为P06状态。
在P06中,在第1显示单元11上显示汉字“石”及字形中组“羊米”,在第2显示单元12上,显示小分类表D89的各字形小组。“糖”字,由于其部首外是以笔画4开始而属于字形小组“米4”。如使用者按下“米4”按钮而选择字形小组“米4”,则两显示单元11、12切换为P07状态。
在P07中,在第1显示单元11上显示“砂糖”。这是因为接着在P06中显示的“石”决定了字形小组“米4”,而转换模块25,考虑到先输入的字形小组“石2/0”的字形代码314和后输入的字形小组“米4”的字形代码898两方面进行再转换而得到它。即,显示与字形代码组“314898”相对应的第一候选单词“砂糖”。另一方面,在第2显示单元12上,显示大分类表D的各字形大组供下面输入时使用。
示于上述图2及图3的电话机是触摸屏式便携式电话机,但本发明也可应用于通常的便携式电话机。图23为示出通常的便携式电话机的外观的模式图。此便携式电话机只具有一个液晶显示屏31。在此场合,显示输入结果的第1显示单元11及显示候选按钮的第2显示单元12的显示内容,每一个都可以显示于液晶显示屏31的画面内。使用者可以一边观看液晶显示屏31上与显示单元12相对应的显示,一边通过按下输入单元13的数字键,与上述同样地进行中文输入。
如根据上述的本实施方式中的中文输入程序,通过对10个左右的有限的键进行3次击键就可以决定字形小组,另外,对各字形小组进行的分类使得使用频率高的汉字不集中。因此,通过3次击键就可以高效率地收敛得出候选汉字。
使用根据以上述字形分类法分类的字形小组生成的试验用辞典,对转换效率进行了验证。此试验用辞典中的单词群中的各单词按使用频率的排列是固定的,它是不包含有关词性和语法等属性信息的最基本的辞典,在将包含1068万字的一年期间的人民日报数据转换为各字形小组的第一候选的场合的正确率达87.8%。此外,如利用具有学习功能并且增加词性和语法等属性信息的单词辞典,对单词的前后连接关系进行分析,则正确率还可以提高。因而可以实现高转换精度及高效率的中文输入。
另外,根据本实施方式的字形分类法,可利用该汉字所属的字形小组指定所有的汉字。所以,使用者没有必要记忆在利用已有的部件进行中文输入时所必需的各部件的组合规则。此外,本实施方式的中文输入程序是按照分类的层结构对使用者进行引导而输入。所以,可实现易于使用的中文输入。
根据如上所述构成的本发明,通过对10个左右有限的键进行有限次数的击键就可以决定字形小组。即,可以高效率地收敛得出作为转换候选的汉字。

Claims (10)

1.一种中文字形输入装置,包括,具有可与汉字的字形特征相对应的多个按钮的输入单元及根据对此输入单元进行的操作输入中文的控制单元,其特征在于,
上述控制单元执行如下的处理过程,即基本选择过程和详细选择过程,其中基本选择过程根据通过将作为输入对象而设想的全部汉字按照其字形特征分类为多个字形小组,并将这些字形小组编入上位组而形成的多层的层结构,从此层结构的上位各组中选择一个组,详细选择过程根据上述层结构,从属于由上述基本选择步骤所选择的组的下位各组中选择一个组,来确定作为输入对象的汉字所属的字形小组。
2.一种中文字形输入装置,包括具有可与汉字的字形特征对应的多个按钮的输入单元及根据对此输入单元进行的操作输入中文的控制单元,其特征在于,
上述控制单元执行如下的处理过程,即,
第1提示过程,用于根据通过将作为输入对象而设想的全部汉字按照其字形特征分类为多个字形小组,并将这些字形小组编入多个字形中组,并将这些字形中组分别编入多个字形大组而形成的层结构,提示上述各字形大组,
第1确定过程,用于在上述第1提示过程中提示的各字形大组中,根据使用者对上述输入单元的操作确定一个字形大组,
第2提示过程,用于提示属于在上述第1确定过程中确定的字形大组的各字形中组,
第2确定过程,用于在上述第2提示过程中提示的各字形中组中,根据使用者对上述输入单元的操作确定一个字形中组,
第3提示过程,用于提示属于在上述第2确定过程中确定的字形中组的各字形小组,
第3确定过程,用于在上述第3提示过程中提示的各字形小组中,根据使用者对上述输入单元的操作确定作为输入对象的汉字所属的字形小组。
3.如权利要求2所述的中文字形输入装置,其特征在于
上述输入单元的按钮的个数为与数字键个数相同的有限的个数,
上述字形大组被分类为该有限的个数,从而可通过对上述输入单元一次击键而确定,
属于上述各字形大组的各字形中组被分类为上述有限的个数,
属于上述各字形中组的各字形小组被分类为上述有限的个数。
4.如权利要求2所述的中文字形输入装置,其特征在于,
上述第1提示过程通过显示代表属于该字形大组的各字形中组的字形特征的引导来提示上述各字形大组,
上述第2提示过程通过显示代表属于该字形中组的各字形小组的字形特征的引导来提示上述各字形中组,
上述第3提示过程通过显示代表属于该字形小组的各汉字的字形特征的引导来提示上述各字形小组。
5.如权利要求2所述的中文字形输入装置,其特征在于,使用汉字部首进行上述字形小组的分类。
6.如权利要求2所述的中文字形输入装置,其特征在于,使用汉字的笔画及笔顺进行上述字形小组的分类。
7.如权利要求5或6所述的中文字形输入装置,其特征在于,使用汉字部首以外的部分的笔画及笔顺进行上述字形小组的分类。
8.如权利要求1或2所述的中文字形输入装置,其特征在于,上述控制单元还执行转换过程,用于在对于输入对象为一个以上的汉字,确定了与该汉字分别对应的一个以上的字形小组的场合,通过参照将一个以上的字形小组和汉字的字符串对应起来的辞典数据,将与确定的一个以上的字形小组相对应的汉字字符串确定为输入对象字符串。
9.一种中文字形输入方法,用于根据对具有与汉字的字形特征对应的多个按钮的输入单元进行操作而输入汉字,其特征在于该方法包括步骤,
基本选择步骤,用于根据通过将作为输入对象而设想的全部汉字按照其字形特征分类为多个字形小组,并通过将这些字形小组编入上位组而形成的多层的层结构,从此层结构的上位各组中选择一个组,和
详细选择步骤,用于根据上述层结构,从属于由上述基本选择步骤所选择的组的下位各组中选择一个组,来确定作为输入对象的汉字所属的字形小组。
10.一种中文字形输入方法,用于根据对具有与汉字的字形特征对应的多个按钮的输入单元进行操作而输入汉字,其特征在于包括如下步骤,
第1提示步骤,用于根据通过将作为输入对象而设想的全部汉字按照其字形特征分类为多个字形小组,通过将这些字形小组编入多个字形中组,并将这些字形中组分别编入多个字形大组而形成的层结构,提示上述各字形大组,
第1确定步骤,用于在上述第1提示步骤中提示的各字形大组中,根据使用者对上述输入单元的操作确定一个字形大组,
第2提示步骤,用于提示属于在上述第1确定步骤中确定的字形大组的各字形中组,
第2确定步骤,用于在上述第2提示步骤中提示的各字形中组中,根据使用者对上述输入单元的操作确定一个字形中组,
第3提示步骤,用于提示属于在上述第2确定步骤中确定的字形中组的各字形小组,
第3确定步骤,用于在上述第3提示步骤中提示的各字形小组中,根据使用者对上述输入单元的操作确定作为输入对象的汉字所属的字形小组。
CNB021407525A 2002-01-21 2002-07-16 中文字形输入法 Expired - Fee Related CN1237435C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP011459/2002 2002-01-21
JP2002011459A JP2003216602A (ja) 2002-01-21 2002-01-21 中国語字形入力プログラム,中国語字形入力装置,及び中国語字形入力方法

Publications (2)

Publication Number Publication Date
CN1434365A true CN1434365A (zh) 2003-08-06
CN1237435C CN1237435C (zh) 2006-01-18

Family

ID=19191674

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021407525A Expired - Fee Related CN1237435C (zh) 2002-01-21 2002-07-16 中文字形输入法

Country Status (5)

Country Link
US (1) US7058900B2 (zh)
JP (1) JP2003216602A (zh)
CN (1) CN1237435C (zh)
HK (1) HK1057633A1 (zh)
TW (1) TWI238332B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503598A (zh) * 2015-01-11 2015-04-08 赵彬 12格主字母引导输入法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040085370A1 (en) * 2002-10-31 2004-05-06 Microsoft Corporation Input mode selector on a mobile device
JP2005078211A (ja) * 2003-08-28 2005-03-24 Fujitsu Ltd 中国語入力プログラム
US8428358B2 (en) * 2005-05-31 2013-04-23 Microsoft Corporation Radical-base classification of East Asian handwriting
JP4895352B2 (ja) * 2006-02-07 2012-03-14 任天堂株式会社 対象選択プログラム、対象選択装置、対象選択システム、および対象選択方法
US9086737B2 (en) * 2006-06-15 2015-07-21 Apple Inc. Dynamically controlled keyboard
KR100757372B1 (ko) * 2006-09-29 2007-09-11 박인기 표의문자를 위한 데이터베이스 시스템 및 처리 방법
CA2705904C (en) * 2006-12-18 2015-08-18 Semantic Compaction Systems An apparatus, method and computer readable medium for chinese character selection and output
US20090307578A1 (en) * 2008-06-05 2009-12-10 Microsoft Corporation Top down chinese character display on a computing device
WO2011105816A2 (ko) * 2010-02-23 2011-09-01 Park Taeun 9키 중문 입력 방법
US20110296347A1 (en) * 2010-05-26 2011-12-01 Microsoft Corporation Text entry techniques
CN101976119B (zh) * 2010-10-15 2012-05-23 苏州大学 一种数字键盘文字输入法
JP5787843B2 (ja) * 2012-08-10 2015-09-30 株式会社東芝 手書き描画装置、方法及びプログラム
CN104345897B (zh) * 2013-07-31 2017-06-20 北大方正集团有限公司 变形字符输入方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3134282A1 (de) * 1981-08-29 1983-03-10 Olympia Werke Ag, 2940 Wilhelmshaven Verfahren zur darstellung ideografischer zeichen und vergleichbarer graphiken
JPH04124715A (ja) 1990-09-14 1992-04-24 Fujitsu Ltd 2タッチ字形分解入力方式
US5923778A (en) * 1996-06-12 1999-07-13 Industrial Technology Research Institute Hierarchical representation of reference database for an on-line Chinese character recognition system
US6430314B1 (en) * 1999-01-20 2002-08-06 Sony Corporation Method and apparatus for entering data strings including hangul (Korean) and ASCII characters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503598A (zh) * 2015-01-11 2015-04-08 赵彬 12格主字母引导输入法

Also Published As

Publication number Publication date
US7058900B2 (en) 2006-06-06
US20030138145A1 (en) 2003-07-24
TWI238332B (en) 2005-08-21
CN1237435C (zh) 2006-01-18
HK1057633A1 (en) 2004-04-08
JP2003216602A (ja) 2003-07-31

Similar Documents

Publication Publication Date Title
CN1258132C (zh) 用于进行字母符号输入的小键盘布局
CN1024050C (zh) 对汉字进行编码和译码的方法和装置
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1237435C (zh) 中文字形输入法
CN1607491A (zh) 使用操纵杆输入中文的系统和方法
CN101424977A (zh) 采用键盘进行内容输入的输入方法及终端设备
CN1140868C (zh) 表意语言及非表意语言的文字输入系统
CN1095560C (zh) 修改汉字转换结果的系统
CN102478969A (zh) 候选汉字的筛选方法及装置
KR101099654B1 (ko) 중국어 입력 시스템 및 방법
CN1140282A (zh) 信息处理方法和装置
CN1101567C (zh) 汉字字符输入的方法和系统
CN1317664C (zh) 乱笔顺库建立方法及联机手写汉字识别评测系统
CN1097766C (zh) 汉字五键输入法
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1755589A (zh) 基于按键和语音识别的文字输入方法及装置
EP1875620B1 (en) Hangeul input keypad and methods using the same
CN1607492A (zh) 数字式电子设备及使用该设备的汉语拼音输入法
CN1556452A (zh) 数字键盘智能拼音汉字输入方法
CN100361054C (zh) 基于音码的汉字输入方法
CN101000625A (zh) 中文字型排序检索方法和装置以及一种信息系统
US7408537B2 (en) Using a matrix input to improve stroke-entry of Chinese characters into a computer
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN103218199A (zh) 带标识码输入的语音输入法
CN1257445C (zh) 音义码汉字输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060118

Termination date: 20100716