CN1080903C - 辨别键盘输入为中文或为英文的方法 - Google Patents

辨别键盘输入为中文或为英文的方法 Download PDF

Info

Publication number
CN1080903C
CN1080903C CN95116604A CN95116604A CN1080903C CN 1080903 C CN1080903 C CN 1080903C CN 95116604 A CN95116604 A CN 95116604A CN 95116604 A CN95116604 A CN 95116604A CN 1080903 C CN1080903 C CN 1080903C
Authority
CN
China
Prior art keywords
english
chinese
group block
radical
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN95116604A
Other languages
English (en)
Other versions
CN1143768A (zh
Inventor
刘明威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
E Ten Information Systems Co Ltd
Original Assignee
E Ten Information Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by E Ten Information Systems Co Ltd filed Critical E Ten Information Systems Co Ltd
Priority to CN95116604A priority Critical patent/CN1080903C/zh
Publication of CN1143768A publication Critical patent/CN1143768A/zh
Application granted granted Critical
Publication of CN1080903C publication Critical patent/CN1080903C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

辨别键盘输入为中文或为英文的方法,包含:(1)将一存储器的一第一区域规划为一中文字根组字区及一英文字根组字区;(2)若键盘输入同时包含一切换键Shift及一输入键,设定一英文旗标;(3)将输入键对应的英文字根存入英文字根组字区;(4)检测英文旗标是否为设定;(5)若步骤(4)的判断结果为设定,将英文字根组字区的信息输出。

Description

辨别键盘输入为中文 或为英文的方法
本发明有关一种辨别键盘输入为中文或为英文的方法。
在现今的所有中文输入法中,都是围着中文的特性、结构、笔画、声音等拆码方式来解决输入中文字的问题,而且各种智慧型的输入方式也比比皆是,无不是为了提升输入中文的速度。在今日工商发达的社会,信息的输入不再只有中文的输入,而是经常性的中英文夹杂混合输入。可是目前的输入法却只针对中文输入而设计,因此当我们要输入中英夹杂的文件时,将常要来回的切换输入法,而且这些中文输入法为了考虑中文输入特性,让英文的输入更加的困难,如此不但不会提升输入的速度,反而降低了整个输入的速度。许多人因常输入中英文夹杂的信息,所以常为英文输入所苦。
有鉴于此,本发明的目的是为了解决上述现有技术中的问题而提供一种辨别键盘输入为中文或为英文的方法,可自由的输入中文字或英文字。
在说明本发明之前,先定义本发明中的字根为可据以组成文字的单元,如水(拆码字根)、ㄉ(注音字根)、y(英文字根)。
本发明提供的辨别方法采用了九种辨识方式。
(1)空白辨识法
由于中文字与英文字的特性形状不同,在文件中如果将它们摆放在一起会感觉不太协调,所以大部分的人会将中文与英文字间保留一个或数个空白。因此空白可以来辨识英文字的开头。
(2)大小写(Shift键)辨识法
所谓大小写辨识法乃是利用英文有大小写的差别来加以辨识,因为中文输入法几乎不会运用到Shift键,而此键刚好是英文大小写的变换键,也因此只要有Shift为开头的字串,我们就可以将它识别成英文字串。
(3)非字根辨识法
现有的中文输入法的输入方式,皆是运用英文键盘编上中文字根或注音符号(字根)而成,使用者只要将各个字根组合就可得到一个或数个中文字。但是中文的输入法通常为了要让使用者免于记字根之苦,所以不会用太多的键位来定义字根。因此键盘上会有许多未被定义成字根的键位,而这些键就不属于中文的族群,也就是说以这些非中文字根开头的字串,就必须将它识为英文字或符号。
(4)中文输入码辨识法
中文字对所有中文输入法来说是一个或数个字根(或注音字根)的组合,所以每当我们要用键盘打出一个中文字时,就必须输入几个字根,然这些字根对英文来说是没有预定意义的,也就是说我们可以很容易的从字根的组合中,辨识中文字或英文字。
(5)字根长度辨识法
中文字为一个或数个字根所组成,所以我们又可推论到另一个辨识方式,也就是可以组成中文字的字根通常不大于五个(有些输入法更少),所以凡是大于组合字根数目的输入,将很容易被辨识为英文字。
上述五项的辨识法皆属可正确辨识的方式,而以下几种方式是可以当作辨识的参考使用。
(6)常用字与次常用字的辨识法
当输入字根与英文字串刚好是相同时,此法用以区分英文字或中文字的可能。也就是说,当英文字串与中文字根相同时,如果此中文字又属于次常用字的话,那此字串为英文的可能性就极高。反之,中文的可能性就很高。
(7)英文字库辨识法
此法与上述的常用字次常用字辨识法有异曲同工的效用。一个是以中文字为出发点,一个是以英文字为出发点。将英文字库做分析,找出常用的英文单字与不常用的英文字,来作为英文字或中文字的判断。
(8)中文词库辨识法
当输入的英文字串(字根)组合可以形成两个字或两个字以上的中文词句时,中文词库辨识法就判断这个词句可能是中文。
(9)经验辨识法
经验辨识法是属于一种较智慧型的辨识方式,此方式乃是利用一般人使用电脑来写文件时的特性。通常人们利用电脑来编写文件时,都会有一种倾向,这种倾向是偏中文或偏英文。也就是说,很少一篇文章中,中英文的比例差不多。不是中文文件中穿插几个英文字,就是英文文件中穿插几个中文字。因此本法则是在输入法内部安排一个计数器,来计算目前输出的中文字或英文字数差。如果碰到一个中英文很难辨识时,就可利用之前的计数器来判断英文计数较高就是英文,中文计数较高就是中文。
本发明提供的一种辨别键盘输入为中文或为英文的方法,包含:
(1)将一存储器的一第一区域规划为一中文字根组字区及一英文字根组字区;
(2)将输入键对应的中文字根存入中文字根组字区;
(3)将输入键对应的英文字根存入英文字根组字区;
(4)判断中文字根组字区中的字根数是否大于一预定值;
(5)如果步骤(4)的判断结果大于预定值,设定一英文旗标;
(6)检测英文旗标是否为设定;
(7)若步骤(6)的判断结果为设定,将英文字根组字区的信息输出。
本发明提供的又一种辨别键盘输入为中文或为英文的方法,包含:
(1)将一存储器的一第一区域规划为一中文字根组字区及一英文字根组字区;
(2)将输入键对应的中文字根存入中文字根组字区;
(3)将输入键对应的英文字根存入英文字根组字区;
(4)判断输入键对应的中文字根是否为一中文结束字根;
(5)如果步骤(4)判断结果为是,判断中文字根组字区内信息是否可组成中文字;
(6)如果步骤(5)判断结果为是,依一预定法则求得一中文权数及一英文权数;
(7)判断中文权数是否大于英文权数;
(8)如果步骤(7)判断结果为是,将中文字根组字区的信息输出。
本发明的目的、特点及优点将参考附图结合实施例描述如下:
附图简要说明:
图1(A)、图1(B)是本发明的辨别键盘输入为中文或为英文的流程。
图2是第一输入例及对应流程。
图3是第二输入例及对应流程。
图4是第三输入例及对应流程。
图5是第四输入例及对应流程。
本发明于流程执行之前先在存储器规划一中文组字区及英文组字区。以下则先以流程说明本发明的一具体实施例。
如图1流程所示,本发明于步骤101接收键盘的输入,于步骤102检测是否按了“Enter”键,如果按了则至步骤106,如果未按则至步骤103。步骤103检测是否按了字根结束键。以仓颉输入法而言,空白键(space bar)为其字根结束键;以注音输入法而言,四声键
Figure C9511660400081
Figure C9511660400082
Figure C9511660400084
为其字根结束键。
如果按了字根结束键,则至步骤201。如果步骤103中并未按了字根结束键,则至步骤104检验是否按了空白键,如果按了,至步骤105将英文旗标(flag)取消(OFF)。英文旗标为设定(ON)时,代表输入键被判定为英文,英文旗标为取消时,则无法判定输入键是否为英文。步骤104的目的在于提供前述空白辨识法则,其详细结果可如下述说明。
步骤104的结果若为非,至步骤109检验是否为特殊结束字根,例如“[”或“]”等等符号。如果未按至步骤128,如果按了至步骤110将英文旗标(flag)取消(OFF),之后至步骤125。
128检测是否按了切换(Shift)键。如果按了,则至步骤111将英文旗标设定,然后经步骤125,检测字根旗标是否为取消(OFF)。字根旗标被设定(ON)时,代表所按下的键是一个非英文、非中文字根的符号键。字根旗标取消时,则按压键则可能为英文也可能为中文字根。
如果步骤125的结果为非,代表前一个输入为符号键,至步骤126将英文权数减少B点,然后至步骤127将字根旗标取消,并至步骤117。如果为是,则直接至步骤117。
步骤117检测空白旗标是否为取消。空白旗标被设定时,代表已按压空白键。
如果步骤117的结果为非,代表此输入键之前已按压空白键,至步骤118将英文权数减少A点后,至步骤119将空白旗标取消,然后至步骤120将组字区中的信息,其包含输入键所对应的英文字根、中文字根、符号,依照英文旗标及字根旗标的状态选择所对应的,输出至编辑区。举例言之,若英文旗标为设定则选择英文字根输出至编辑区。若英文旗标为取消且字根旗标为设定则选择符号键输出至编辑区。若英文旗标为取消、字根旗标为取消,则选择中文字根输出至编辑区。如果所使用的输入法并未提供编辑区,则直接输出至编辑的内文中。
如果步骤128的结果为非,则至步骤129检测英文旗标是否为设定。如果不是,则至步骤112将输入的英、中文字根、或符号放入组字区。如果是,至步骤125。
步骤104的结果为是时,至步骤105将英文旗标取消,之后至步骤114检测空白旗标是否为设定。
如果非设定,至步骤115将英文权数增加A点,至步骤116将空白旗标设定后,至步骤120。
于步骤112之后,至步骤113检测输入键是否为中文的字根键,如果是,至步骤300检测组字行中字根数是否超出此输入法(如仓颉、大易......)输入码的最大长度。
如果不是中文的字根键,至步骤122检测字根旗标是否为设定。如果非设定,至步骤123将英文权数增加B点,至步骤124将字根旗标设定后,至步骤117。如果为设定,则直接至步骤117。
于步骤120之后,步骤121将组字区的信息全部消除,以接受新的输入键所对应的中、英文字根及符号。之后,再回到步骤S(开始)等候键盘另一个输入。
于步骤102若为是时,至步骤106将所有编辑区的信息输出至文书处理软件贮存信息的区域,并显示于内文中。步骤107计算编辑区中英文字的字数及中文字字数。步骤108将编辑区的信息消除后,回到步骤S等待另一个输入。
步骤201检验组字行中的字根是否可以组出中文字。若于步骤201的结果为非时,至步骤303检测组字行中是否有字根存在,如果有,至步骤302将英文旗标设定,并至步骤125。如果没有,直接至步骤125。
于步骤201的结果为是时,至步骤202检测组字区中文字根组出的中文字是否为常用字。如果不是,至步骤214将英文权数增加D点。如果是,步骤203将中文权数增加C点,至步骤204。
步骤204检测前一个被输出至编辑区的字是否为中文字。
如果不是中文字,至步骤207检测组字区的英文字根是否可组成英文字库的单字。如果是,至步骤205检验前一个输出中文字与此字结合后是否为词库的词。步骤205若为非,至步骤207,步骤205若为是,至步骤206将中文权数增加E点后,至步骤207。
步骤207若为非,则至步骤209比较中文权数与英文权数何者大。步骤207若为是,则至步骤208将英文权数增加F点。
步骤209中若英文权数大于中文权数,至步骤212将组字区中的英文字根组合输出至编辑区。若中文权数大于英文权数,至步骤211记录此字根行组出的中文字供步骤204、205之用。之后,至步骤213将组字区中的中文字根组合成中文输出至编辑区。若中文权数与英文权数相近,至步骤210比较累积的中、英输入何者较多。如果英文多,至步骤212,如果中文多,至步骤211。
于步骤300中若为是,至步骤302将英文旗标设定。
于步骤300中若为非,至步骤301检测组字区中的字根组合是否为一输入码的一部分字根。若为非,至步骤302。若为是,至回到开始位置(S)。上述的权数A、B、C、D、E、F分别具有其值,例如可等于五、十或其它值,完全依中文输入法设计者的需求及经验而定。
配合以下的输入例,即可完全了解本发明的运行方式。参考图2、图3其中虽并未揭露中文输入的对应流程,但吾人假设是以仓颉输入法做输入。
如图2所示。第一列为使用者欲键入的一段句子。右边直行为使用者分别键入空白、T、V......,而所对应的流程揭示于其左方。即,当使用者键入空白时,本发明执行步骤101、102、103、104、105、114、115、116、120、121回到步骤S等待下一个输入。此时组字区中只有一个空白符号。当使用者键入大写T键(同时按切换键及T)后,本发明执行101、102、103、104、109、128、111、125、117、118、119、120、121,回到步骤S,使用者按压大写V后,本发明执行101、102、103、104、109、128、111、125、117、120、121后回到S。当使用者按压“-”键,本发明执行101、102、103、104、109、128、129、125、117、120、121回到S。其余的流程,可参照图2。
如图3所示。第一列为使用者欲键入的一段句子。右边直行为使用者分别键入T、V......,而所对应的流程揭示于其左方。当使用者键入大写T键(同时按切换键及T)后,本发明执行101、102、103、104、109、128、111、125、117、118、119、120、121,回到步骤S,使用者按压大写V后,本发明执行101、102、103、104、109、128、111、125、117、120、121后回到S。当使用者按压“-”键,本发明执行101、102、103、104、109、128、129、125、117、120、121回到S。其余的流程,可参照图3。当使用者键入最后一个空白键时,本发明执行步骤101、102、103、104、105、114、115、116、120、121回到步骤S等待下一个输入。
以下以注音输入法为例说明本发明。
如图4所示,第一列为使用者欲键入的一段句子。右边直行为使用者分别键入t、v、-、......,而所对应的流程则揭示于其左方。即,t被键入时,本发明执行步骤101、102、103、104、109、128、129、112、113、300、301、S。此时组字区中有对应的英文字根、中文字根。
当v被键入时,本发明执行步骤101、102、103、104、109、128、129、112、113、300、301、302、125、117、120、121、S。此时tv两字根被输出至编辑行,而其它对应的中文字根则在步骤121中被消除。其余-game的产生流程如图4所示。
当“[”键被输入时,本发明执行101、102、103、104、109、110、125、117、120、121、S。此时“[”被输出至编辑区。
当ㄉ、一、ㄢ键被输入时,流程分别如图所示。但此时,组字区分别存有ㄉ键对应的英文字根(即2)及ㄉ注音字根,同理一、ㄢ键亦同。但当
Figure C9511660400131
键被输入时,本发明执行101、102、103、201、202、203、204、207、209、211、213、125、117、120、121、S。此时ㄉ一ㄢ
Figure C9511660400132
所对应的中文字根被确定为真正的输入而被输出至编辑区。而其它对应的英文字根则在步骤121中被消除。其余的中文输入可参照对应的流程。
由以上的说明不难了解,当使用者以注音输入法键入图5第一列的句子时,所详细对应的流程如图5所示。
须说明的是,上述图4、图5之所以用注音输入法来说明本发明的流程,是因如此较易了解右方中文输入的内容。否则如果以仓颉输入码一、月、田、山来代表“电”输入,比较看不出所对应为“电”。
综上所述,本发明,如实施例图1的流程,于方框104采用一空白辨识法,于方框128采用大小写辨识法,于方框113采用非字根辨识法,于方框300采用长度辨识法,于方框301采用中文输入码辨识法,于方框202采用常用字辨识法,于方框205采用中文词库辨识法,于方框207采用英文字库辨识法,于方框209采用中英文权数辨识法,而利用方框210构成一个经验辨识法。
须说明的是,本发明须配合相关的输入法,如大易、仓颉、注音等而运作,能辨别使用者键入的是中文、符号亦或英文,为中文输入法下的一个非常实用的中英文输入辨识方法。

Claims (6)

1、一种辨别键盘输入为中文或为英文的方法,包含:
(1)将一存储器的一第一区域规划为一中文字根组字区及一英文字根组字区;
(2)将输入键对应的中文字根存入中文字根组字区;
(3)将输入键对应的英文字根存入英文字根组字区;
(4)判断中文字根组字区中的字根数是否大于一预定值;
(5)如果步骤(4)的判断结果大于预定值,设定一英文旗标;
(6)检测英文旗标是否为设定;
(7)若步骤(6)的判断结果为设定,将英文字根组字区的信息输出。
2、根据权利要求1所述的方法,其中,步骤(5)、(6)之间进一步包含:
(8)如果步骤(4)的判断结果小于预定值,判断中文字根组字区中的字根组合是否为一输入码的一部分;
(9)如果步骤(8)的判断结果为否,设定一英文旗标。
3、一种辨别键盘输入为中文或为英文的方法,包含:
(1)将一存储器的一第一区域规划为一中文字根组字区及一英文字根组字区;
(2)将输入键对应的中文字根存入中文字根组字区;
(3)将输入键对应的英文字根存入英文字根组字区;
(4)判断输入键对应的中文字根是否为一中文结束字根;
(5)如果步骤(4)判断结果为是,判断中文字根组字区内资料是否可组成中文字;
(6)如果步骤(5)判断结果为是,依一预定法则求得一中文权数及一英文权数;
(7)判断中文权数是否大于英文权数;
(8)如果步骤(7)判断结果为是,将中文字根组字区的信息输出。
4、根据权利要求3所述的方法,其中,步骤(7)后进一步包含:
(9)如果步骤(7)判断结果为非,将英文字根组字区的信息输出。
5、根据权利要求3所述的方法,其中,所述的预定法则包含:
(1)判断中文字根组字区的信息是否为常用字;
(2)若步骤(1)判断结果为是,将中文权数增加C点,若步骤(1)判断结果为非,将英文权数增加D点;
(3)判断前一个输出是否为中文;
(4)若步骤(3)判断结果为是,判断此最后一字与中文字根组字区的常用字结合是否为一词库中的词;
(5)若步骤(4)判断结果为是,将中文权数增加E点后,执行步骤(7);
(6)若步骤(4)判断结果为非,执行步骤(7);
(7)判断英文组字区中的字是否为一英文字库的单字;
(8)若步骤(7)判断结果为是,将英文权数增加F点。
6、根据权利要求3所述的方法,其中,步骤(7)判断的结果为两者约略相等时,执行下列步骤:
(1)比较中文输入字数与英文输入字数何者较多;
(2)若英文输入字数较多,将英文字根组字区的信息输出;
(3)若中文输入字数较多,将中文字根组字区的信息输出。
CN95116604A 1995-08-21 1995-08-21 辨别键盘输入为中文或为英文的方法 Expired - Fee Related CN1080903C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN95116604A CN1080903C (zh) 1995-08-21 1995-08-21 辨别键盘输入为中文或为英文的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN95116604A CN1080903C (zh) 1995-08-21 1995-08-21 辨别键盘输入为中文或为英文的方法

Publications (2)

Publication Number Publication Date
CN1143768A CN1143768A (zh) 1997-02-26
CN1080903C true CN1080903C (zh) 2002-03-13

Family

ID=5080978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95116604A Expired - Fee Related CN1080903C (zh) 1995-08-21 1995-08-21 辨别键盘输入为中文或为英文的方法

Country Status (1)

Country Link
CN (1) CN1080903C (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN85100868A (zh) * 1985-04-01 1986-03-10 李金铠 多文种电脑
CN1054498A (zh) * 1990-02-22 1991-09-11 徐鹤鸣 一种计算机
CN1059794A (zh) * 1990-09-10 1992-03-25 张逶 文字速打键盘、系统、键盘专用显示键

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN85100868A (zh) * 1985-04-01 1986-03-10 李金铠 多文种电脑
CN1054498A (zh) * 1990-02-22 1991-09-11 徐鹤鸣 一种计算机
CN1059794A (zh) * 1990-09-10 1992-03-25 张逶 文字速打键盘、系统、键盘专用显示键

Also Published As

Publication number Publication date
CN1143768A (zh) 1997-02-26

Similar Documents

Publication Publication Date Title
CN1120436C (zh) 用于识别孤立、非相关汉字的语音识别方法和系统
CN1080903C (zh) 辨别键盘输入为中文或为英文的方法
CN1144354A (zh) 增强的字符录入系统
CN1645356A (zh) 多维汉语学习系统
CN1041661A (zh) 中文输入装置及其键盘
CN1111373A (zh) 一种以汉语拼音为基础的计算机汉字输入方案
CN1222860C (zh) 适用于多种输入法的文字输入方法及系统
CN1026271C (zh) 智能拼音汉字输入系统
CN1068444C (zh) 一种汉字编码输入方法
CN1043381C (zh) 汉字四笔画数码输入法
CN1116336A (zh) 替调式汉语拼音汉字、词输入编码法及键盘
CN1040702C (zh) 语言再现装置
KR101106398B1 (ko) 키패드에서의 알파벳 입력장치 및 그 방법
CN1034030C (zh) 简易汉字输入方法
CN1048341C (zh) 模糊汉字变换装置
CN1039512C (zh) 计算机中文单笔划输入系统
CN1087733A (zh) 汉字前续码
CN1105463A (zh) 汉字输入码的编码方法
CN1114066A (zh) 意群输入、编辑和字词语码
CN1049418A (zh) 统一码计算机汉字键盘输入方法
CN1151540A (zh) 四合一码计算机汉字编码输入法
CN1026036C (zh) 音调快速汉字输入法
CN1350223A (zh) 一种遥控器中文拼音输入方法
CN1567158A (zh) 拼音笔画排序汉字输入键盘及其输入方法
CN1135056A (zh) 高频无理汉字字形编码及其键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee