CN102236423B - 一种字符自动补充的方法、装置和输入法系统 - Google Patents

一种字符自动补充的方法、装置和输入法系统 Download PDF

Info

Publication number
CN102236423B
CN102236423B CN201010164451.0A CN201010164451A CN102236423B CN 102236423 B CN102236423 B CN 102236423B CN 201010164451 A CN201010164451 A CN 201010164451A CN 102236423 B CN102236423 B CN 102236423B
Authority
CN
China
Prior art keywords
character
fragment
predicted
word
input character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010164451.0A
Other languages
English (en)
Other versions
CN102236423A (zh
Inventor
杨磊
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201010164451.0A priority Critical patent/CN102236423B/zh
Publication of CN102236423A publication Critical patent/CN102236423A/zh
Application granted granted Critical
Publication of CN102236423B publication Critical patent/CN102236423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种字符自动补充的方法、装置和输入法系统,其中所述方法包括:从用户的已输入字符中获取待预测片段,所述用户已输入字符包括非补充部分和需要补充的待预测片段;针对所述待预测片段,匹配获取相应的补充结果;组合非补充部分和补充结果,输出组合结果。本发明能够从用户的已输入字符中找到需要补充的片段,即并不是简单的从用户已输入字符的开头进行补充,而是定位到用户已输入字符的某个位置,将其之后的字符作为待预测片段进行补充;或者,定位到用户已输入字符的某两个位置,将其之间的字符作为待预测片段进行补充。

Description

一种字符自动补充的方法、装置和输入法系统
技术领域
本发明涉及输入法技术领域,特别是涉及一种字符自动补充的方法、装置和输入法系统。
背景技术
用户欲输入一个英文单词,需要输入该单词的每一个字母,因而是一件非常麻烦的事情;针对上述情形,很多输入法软件提供了英文补全功能,也即,当用户输入该单词的前几个字母时,软件会提示以这些字母开头的单词,以方便用户直接选择;这样,用户可以不必输入该单词的所有字母,能够减少击键次数,从而提高输入效率;同时,对于某些难以记忆的单词,用户可以不必输入单词的全部内容,提高单词输入的准确性。
参照图1,在用户输入“conv”时,软件会给出补全选项:“convenient”、“convert”、“converse”,供用户选择,其中,文本用下划线标出用户的“已输入字符”。
传统的英文补全技术大多基于词典实现,其中,所述词典是一个常见单词的集合;这样,在补全时,可以从所述词典中检索包含该“已输入字符”内容的单词,例如,图1中的补全选项:“convenient”、“convert”和“converse”等均以用户输入的“conv”开头。
通常,英文单词之间用空格进行分隔,也即,空格是前一个单词与后一个单词的分界线,从空格后的第一个字母开始对后一个英文单词进行补全,这也是传统的英文补全技术能够正常工作的基础。
但是,实际应用中,用户还可能需要输入英文复合词。英文复合词通常均由若干单词按一定的规则组合起来,例如,某购物网站的网址为www.goshopping.com,其中的goshopping由go和shopping组合得到,用以表示“购物”的意思;论坛中的注册账号crossrainbow,由cross和rainbow组合得到,用以表示“跨越彩虹”的意思;程序代码中的变量命名NewLinePoint,由new、line和point组合得到,用以表示“新建的线段端点”的意思。
通用词典中会存储一些常用的复合词,如secondhand、handwriting、software等等,但是,对于上述举例的复合词,如goshopping、crossrainbow、NewLinePoint等等,由于其用于在特殊场合进行表意,不经常被使用,故通常不会在通用词典中直接出现;这样,当用户输入前缀goshop(已输入字符)时,传统的英文补全技术无法从词典中找到以上述“已输入字符”开头的单词,从而导致补全失败。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够更好地对英文复合词进行自动补充。
发明内容
本发明所要解决的技术问题是提供一种字符自动补充的方法、装置和输入法系统,用以更好地适合英文等语言的复合词输入,提高输入效率。
为了解决上述问题,本发明公开了一种字符自动补充的方法,包括:从用户的已输入字符中获取待预测片段,所述用户已输入字符包括非补充部分和需要补充的待预测片段;针对所述待预测片段,匹配获取相应的补充结果;组合非补充部分和补充结果,输出组合结果。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:查找所述已输入字符中的特征字符;将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。优选的,所述特征字符为所述已输入字符中的最后一个大写字母,所述待预测片段为该大写字母及其之后的字符;或者,所述特征字符为所述已输入字符中的最后一个标识符号,所述待预测片段为该标识符号之后的字符。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:将光标所在位置之后的字符作为待预测片段。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:查找所述已输入字符中的特征字符;对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段,或者,将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段。优选的,所述特征字符为所述已输入字符中的标识符号,所述待预测片段为两个相邻标识符号之间的字符;或者,所述特征字符为所述已输入字符中的大写字母,所述待预测片段包括两个相邻大写字母之间的字符,以及前一个大写字母。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:查找所述已输入字符中的特征字符;将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;将所述前缀单词之后的字符确定为待预测片段。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;查找所述前缀单词之后的第一个特征字符;将所述前缀单词之后,该特征字符之前的字符确定为待预测片段。
优选的,所述从用户的已输入字符中获取待预测片段的步骤包括:从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段包括一个或多个字符。
优选的,所述字符补充方法还可以包括:对组合结果进行排序;根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
优选的,通过以下步骤对所述组合结果进行排序:根据待预测片段的长度对相应的组合结果进行排序;或者,根据所述补充结果的属性信息,对相应的组合结果进行排序;或者,根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
优选的,所述补充结果的属性信息包括所述补充结果的长度,或者,所述补充结果的词频信息。
优选的,所述非补充部分包括一个或多个拆分单词;所述根据已输入字符中的非补充部分,对相应的组合结果进行排序的步骤包括:根据拆分单词的数量,或长度,或词频信息,对相应组合结果进行排序;或者,根据非补充部分的完整性,对相应组合结果进行排序;或者,根据非补充部分与待预测片段的关联关系,对相应组合结果进行排序。
依据本发明的另一实施例,还公开了一种字符自动补充的装置,包括:
片段获取单元,用于从用户的已输入字符中获取待预测片段,所述用户已输入字符包括非补充部分和需要补充的待预测片段;
补充结果获取单元,用于针对所述待预测片段,匹配获取相应的补充结果;
输出单元,用于组合非补充部分和补充结果,得到组合结果并输出。
优选的,所述片段获取单元包括:第一查找子单元,用于查找所述已输入字符中的特征字符;第一确定子单元,用于将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。
优选的,所述片段获取单元具体用于将光标所在位置之后的字符作为待预测片段。
优选的,所述片段获取单元包括:第二查找子单元,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;第二确定子单元,用于将所述前缀单词之后的字符确定为待预测片段。
优选的,所述片段获取单元包括:第三查找子单元,用于查找所述已输入字符中的特征字符;第三确定子单元,用以对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段,或者,将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段。
优选的,所述片段获取单元包括:第四查找子单元,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;第五查找子单元,用于查找所述前缀单词之后的第一个特征字符;第四确定子单元,用于将所述前缀单词之后,该特征字符之前的字符确定为待预测片段。
优选的,所述片段获取单元包括:第六查找子单元,用于查找所述已输入字符中的特征字符;第五确定子单元,用以将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
优选的,所述片段获取单元包括:截取子单元,用于从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段包括一个或多个字符。
优选的,所述输出单元包括:排序子单元,用于对组合结果进行排序;显示子单元,用于根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
优选的,所述排序子单元包括:第一排序模块,用于根据待预测片段的长度对相应的组合结果进行排序;或者,第二排序模块,用于根据所述补充结果的属性信息,对相应的组合结果进行排序;或者,第三排序模块,用于根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
优选的,所述非补充部分包括一个或多个拆分单词;所述第三排序模块具体用于根据拆分单词的数量,或长度,或词频信息,对相应组合结果进行排序;或者,所述第三排序模块具体用于根据非补充部分的完整性,对相应组合结果进行排序;或者,所述第三排序模块具体用于根据非补充部分与待预测片段的关联关系,对相应组合结果进行排序。
本发明还要求保护一种输入法系统,其包括了前述的各种字符自动补充装置。
与现有技术相比,本发明具有以下优点:
本发明能够从用户的已输入字符中找到需要补充的片段,即并不是简单的从用户已输入字符的开头进行补充,而是定位到用户已输入字符的某个位置,将其之后的字符作为待预测片段进行补充;或者,定位到用户已输入字符的某两个位置,将其之间的字符作为待预测片段进行补充。
例如,用户已输入字符为英文复合词的一部分,假设该复合词由两个单词组成,本发明可以对该复合词的第二个单词进行补充,再将第一个单词和第二个单词组合得到所需的复合词。即本发明对复合词分解后,无需对现有词库进行大幅度改进,补充仍然可以采用通用词典、本地/远程服务器中收录的单词或常用复合词等,再与非补充部分进行组合,从而可以得到各种结构的复合词。
总之,无论所述英文等语言文字的复合词的通用性和结构组成如何,本发明都能够在利用通用词典、本地/远程服务器的情况下,通过定位、匹配方式给出用户所需的补充结果,帮助用户更好的输入各种英文复合词。
附图说明
图1是现有技术一种英文补全的示例;
图2是本发明一种字符自动补充的方法实施例的流程图;
图3是本发明一种英文复合词、已输入字符、待预测片段的结构示意;
图4是本发明一种字符自动补充的装置实施例的结构框图;
图5是本发明一种包括字符自动补充装置的输入法系统实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
对于复合词goshopping,构成它的两个单词go和shopping经常被使用,故被收录在词典中;如果用户单独输入shop,现有的输入法软件是能够实现自动补充功能从而得到单词shopping的,其中,下划线“shop”用于标识用户的已输入字符。
本发明不像现有技术那样对所有的已输入字符进行自动补充输出,而是对所述已输入字符的一部分(例如shop或者Shop)进行自动补充输出,那么可以完成从用户已输入字符goshop到组合结果goshopping的自动补充输出。
本发明实施例的核心构思之一在于,抽象出一种待预测片段的定义,也即所述待预测片段用来标明用户的已输入字符中需要进行自动补充的对象,而所述已输入字符中的非补充部分可以照原样保留;这样,在获取所述待预测片段的补充结果后,可以对所述非补充部分和所述补充结果进行组合,得到用户所需的组合结果(复合词)。
本发明的字符自动补充技术方案可以应用在各种罗马字符语言中,例如,英文、法文、德文等等,下面仅仅以英文为例进行说明,其他语言请参照即可。
另外,还需要说明的是,本发明的自动补充方式可以为“补全”,即将待预测片段补充为一个完整的词;同时,本发明的自动补充方式也可以仅仅向待预测片段补充一个词根,即补充结果并不一定是一个完整的词。
参照图2,示出了本发明一种字符自动补充的方法实施例的流程图,具体可以包括:
步骤201、从用户的已输入字符中获取待预测片段,所述待预测片段为所述已输入字符的一部分;具体的,所述用户已输入字符包括非补充部分和需要补充的、字词拼写不完整的待预测片段。
本实施例可以适用于英文字符的自动补充过程,用于将用户的已输入字符自动补充为英文复合词,因此可以适用于各种输入法系统。当然,也可以不限定在输入法系统中应用,还可以应用在其他需要自动补充的场景,例如,网址栏输入、信息搜索框输入、甚至word输入中等等;自动补充功能可以作为后者的一个附加功能。
一般来说,所述用户的已输入字符是指用户输入的,位于一个英文复合词中前面部分的字符。
例如,对于复合词goshopping,用户输入的goshop、gosho、gosh、gos、go都是本发明的已输入字符,并且,这些已输入字符已覆盖一个单词go;又如,对于复合词crossrainbow,用户输入的crossrainbo、crossrainb、crossrain也可以作为本发明的已输入字符,且这些已输入字符已覆盖两个单词cross和rain。
因此,可以认为本发明的已输入字符是针对复合词而言的,可以说它是一个复合词的一部分;而所述待预测片段是已输入字符的一部分。
参照图3,示出了本发明一种英文复合词、已输入字符、待预测片段的结构示例,其中,所述英文复合词由单词1、单词2和单词3按一定的规则组合而成,这里没有示出某些复合词中各个单词之间的连接符号,如下划线“_”、连字符“-”等;另外,为达到复合词自动补充的目的,斜线矩形框代表的已输入字符35已覆盖2个单词,也即,用户没有输入单词3的全部字符,图中的输入法光标31停在在单词3的某个字符处。
由于所述已输入字符中的单词1和单词2已经完整,无需补充,故本发明优先选取单词1和单词2之后的字符,也即已输入字符中最后一个单词的字符,作为待预测片段;图3中,从单词2的结束字符到单词3的已输入字符,构成了本发明一种待预测片段34的示例;其他字符构成了所述已输入字符35的非补充部分32;对应于待预测片段34,本发明对其进行补充预测(即将图3中的空白部分进行补充),得到和单词3相对应的补充结果33。即应用本发明,用户无需输入完整的复合词(单词1+2+3),就可以得到单词3相对应的补充结果33,进而得到整个复合词。
对应此例,假设用户的已输入字符为NewLinePoin,则所述待预测片段34的内容为Poin,所述非补充部分32的内容为NewLine,所述补充结果33为Point。
因此,对于包括三个单词的复合词,本发明可以只对其中的单词3进行自动补充,再将单词1+单词2和补充结果(单词3)进行组合得到所需的复合词;即在本发明将复合词分解为待预测片段和非补充部分后,自动补充所采用的仍然是通用词典中收录的单词(无需对现有词库进行大幅度改进),再与非补充部分进行拼接,从而可以得到所需的复合词。
可以理解,本发明还可以对其中的单词2+单词3(例如LinePoin)进行自动补充,再将单词1和补充结果(单词2+单词3;LinePoint)进行组合得到所需的复合词(NewLinePoint),这里单词2+单词3为该复合词的待预测片段;即本发明对复合词分解后,自动补充所采用的还可以是词典中收录的常用复合词,再与非补充部分进行拼接,从而可以得到所需的复合词。
当然,本发明的复合词不限定于三单词结构,还可以为其它的结构组成,例如两单词结构、四单词结构等等。
总之,将已输入字符中的一部分作为待预测片段,无论所述英文复合词的通用性和结构组成如何,本发明都能够在利用通用词典的情况下,通过词典搜索方式给出用户所需的补充结果。
步骤202、针对所述待预测片段匹配获取相应的补充结果;
由于输入法的词典中会存储常用的单词和复合词,因此,本步骤的匹配过程可以为,搜索所述词典并将所述待预测片段与词典中储存的单词或复合词相匹配,然后根据匹配结果得到包含所述待预测片段的单词或复合词,也即本发明的补充结果。
例如,对于用户的已输入字符goshop,假设步骤201获取到的待预测片段为shop,那么,本步骤的执行过程可以包括:shop→shopped,shop→shopper,shop→shopping,其中,“→”在本发明中代表补充动作或者补充过程。即,可以得到3个补充结果,shopped、shopper和shopping。
又如,对于用户的已输入字符crossrainbo,假设步骤201获取到的待预测片段为bo,那么,本步骤可以通过以下过程获取补充结果:bo→boat,bo→book,bo→bow;或者,步骤201获取到的待预测片段为rainb,本步骤可以通过以下过程获取补充结果:rainb→rainbow。
可以理解,本步骤的词典仅仅为示例,可以用词库等其它具有单词/复合词存储功能的数据结构来代替,本发明并不需要对此加以限制;例如,所述数据结构可以位于本地或远程服务器上。
还需要说明的是,前述的例子中,补充结果为包含所述待预测片段的单词或复合词;在实际应用中,本发明的补充结果也可以不是完整的单词或者复合词,而仅仅是在待预测片段上增加了一个词根而已,以帮助用户继续往下输入;其中的补充结果(待预测片段+词根)并不构成一个完成的单词。
步骤203、组合所述已输入字符中的非补充部分和补充结果,得到组合结果;
由于本发明中待预测片段通常位于已输入字符后面的部分,因此,所述非补充部分通常是指在已输入字符中位于待预测片段前面的部分,不参与自动补充的其他字符。
对于用户的已输入字符goshop,假设其对应的待预测片段为shop,那么,所述非补充部分应是go;进一步假设,该待预测片段为shop的补充结果包括shopping,那么,go与shopping的组合结果goshopping,则是已输入字符goshop的一个组合结果。
实际上,本发明中待预测片段还可以位于已输入字符的中间部分,则将补充结果组合至相应位置,可以得到所需的组合结果。例如,用户已输入字符为:NewLi*ePoint,则待预测片段为Li*e,得到的补充结果为line,组合后的组合结果为NewLinePoint。
步骤204、输出组合结果。
在得到所述组合结果后,本发明可以输出所述组合结果。
例如直接上屏至文字处理软件,或者,仅仅展现补充结果,待用户确认后将整个组合结果输出。
在本发明的另一实施例中,也可以将所述组合结果以候选项的形式,反馈展现给用户进行选择,再对用户选择的组合结果进行输出。
在某些应用场景下,“展现组合结果”也可以作为本发明输出的一个示例。
由于所述待预测片段用来标明用户的已输入字符中需要进行补充的对象,故所述待预测片段的获取是本发明的关键所在,本发明可以提供如下获取待预测片段的方案:
方案一、
在对组成英文复合词的若干单词进行组合时,通常会使用大写字母,主要有两种情况:
情况A,很多英文复合词会将其中每个单词的第一个字母大写,以表示一个新单词的开始,例如,用于表意某购物网站的复合词GoShopping,这时,英文复合词中可以包含多个大写字母。
情况B,某些英文复合词也可能将其中的第一个单词的第一个字母小写,这时,英文复合词中仍包含有大写字母,所述大写字母可以为一个或多个,但并不位于英文复合词的开头,例如goShopping,newLinePoint等。
如果将已输入字符中最后一个单词的字符作为待预测片段,则所述待预测片段的终止位置为所述已输入字符的最后一个字符,所述待预测片段的起始位置为最后一个单词的开头,而无论欲补充的英文复合词属于情况A还是情况B,所述最后一个单词的开头都是所述已输入字符中的大写字母;这样,只需从所述已输入字符中找出最后一个大写字母,即可确定所述待预测片段。
在对组成英文复合词的若干单词进行组合时,有些用户还习惯使用标识符号,具体可以包括:
如下划线“_”、连字符“-”等,所述连接符号用于表示连接所述若干单词,并将所述单词分割开来;例如,go_shopping,new_line_point等等。
还可能应用英文句号“.”等,例如,A.number。
再例如,用户在输入过程中,单词go和shopping通过“+”组合成复合词go+shopping;
扩展而言,用户在输入复合词时,也可能采用$、%、、&等符号,例如,用户输入supportsina。
通常情况下,用户希望对复合词中的最后一个单词进行补充,即所述已输入字符中最后一个连接符号之后的内容即是待预测片段;这样,只需从所述已输入字符中找出最后一个标识符号,即可确定所述待预测片段。
对于最后一个大写字母,或者最后一个标识符号,其均可作为所述已输入字符中标识最后一个单词的特征字符,因此,本方案的核心思想在于,根据从所述已输入字符中查找得到的特征字符,来确定待预测片段。
相应地,所述步骤201可以包括以下子步骤:
子步骤R1、查找所述已输入字符中的特征字符;
子步骤R2、将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。
具体而言,本方案的特征字符可以包括两种情形:
情形1、在所述特征字符为所述已输入字符中的最后一个大写字母时,所述待预测片段为该大写字母及其之后的字符;
例如,复合词GoShopping的已输入字符为GoShop,从所述已输入字符GoShop中找出最后一个大写字母S,即确定本发明的待预测片段Shop;假设接下来的步骤202获取的补充结果为Shopping,那么,步骤203拼接得到最终的组合结果则为GoShopping。
情形2、在所述特征字符为所述已输入字符中的最后一个标识符号时,所述待预测片段为该标识符号之后的字符。
例如,复合词new_line_point的已输入字符为new_line_poi,从所述已输入字符GoShop中找出最后一个连接符号“_”,即可将该连接符号之后的字符poi确定为本发明的待预测片段;假设步骤202获取的补充结果为point,那么,步骤203拼接得到最终的组合结果则为new_line_point。
在实际应用中,用户也可能在中间单词的拼写过程中存在困难,例如,用户欲输入TotalRecorderPro,其中,Pro为professional的简写,但不会拼写中间单词Records。
针对上述情形,本方案也可以对中间单词进行补充。此时,所述步骤201可以包括以下子步骤:
子步骤T1、查找所述已输入字符中的特征字符;
子步骤T2、对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段;
例如,在用户输入total+rec+pro时,可以将两个相邻“+”之间的字符rec作为待预测片段;又如,在用户输入total+recPro时,可以将特征字符“+”与特征字符“P”之间的字符rec作为待预测片段。
或者子步骤T2、将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段;
例如,用户的已输入字符为TotalRec-pro,本情形可以将特征字符“R”,以及“R”与“-”之间的字符ec,也即Rec确定为待预测片段。
在本发明的一个优选实施例中,标识符也可以通过光标实现。
例如,光标所在的位置视为待预测片段的起始点,则光标之后的字符就构成了待预测片段。
再例如,光标所在的位置作为待预测片段的结束点,采用本发明其他方法得到待预测片段的起始点,则起始点和结束点之间的字符就构成了待预测片段。又或者,光标所在的位置作为待预测片段的起始点,采用本发明其他方法得到待预测片段的结束点,则起始点和结束点之间的字符就构成了待预测片段。例如,所述从用户的已输入字符中获取待预测片段的步骤具体可以包括:查找所述已输入字符中的特征字符;将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
方案二、
在英文复合词采用上述大写字母、连接符号等特征字符的组合规则时,方案一能够得到好的组合结果,例如,方案一能够很好地分别将已输入字符GoShop和go-shop自动补充为复合词GoShopping和go-shopping;但是,在英文复合词未采用上述组合规则时,方案一无法解决问题,例如,方案一无法解决goshop到goshopping的自动补充问题。
从图3可以看出,所述已输入字符可以包括:单词1、单词2和单词3的字符,而其中的单词1和单词2是完整的单词,因而在词典中有所收录;以已输入字符NewLinePoi为例,它包括有单词1(New)、单词2(Line)和单词3的字符(Poi),而所述New和Line均为完整的单词,这样,在所述已输入字符中剥离所述完整单词,即可得到所述单词3的字符,也即本发明的待预测片段。
因而,本方案的核心思想在于,通过匹配查找所述已输入字符中的前缀单词(完整单词),并将所述已输入字符中位于所述前缀单词之后的字符确定为待预测片段;此时,所述步骤201可以包括以下子步骤:
子步骤S1、从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
在实际中,所述前缀单词可以包括单词或者词根,且所述前缀单词的数目可以为一个,也可以为多个。
例如,对于已输入字符NewLinePoi,从字母N开始,首先在词典中查找得到被覆盖的前缀单词New,而New与后面的L、Li、Lin、Line、LineP、LinePo、LinePoi均无法构成单词,故New可以作为一个前缀单词;同理,可以在已输入字符中位于单词New以后的字符LinePoi中,查找得到单词Line;也即,这里的前缀单词为两个,分别为New、Line。
再例如,常用词根“e”表示“电子”的意思,故可作为一些常见复合词的前缀;例如,单词email即由该前缀与单词mail组合而成;另外还有ebay(“电子港湾”,网络购物网站)也是由该前缀与单词bay组合而成。
子步骤S2、将所述前缀单词之后的字符确定为待预测片段。
以已输入字符goshop为例,其前缀单词为go,故可将go之后的字符shop确定为待预测片段;以NewLinePoi为例,其前缀单词为New、Line,故可将Line之后的字符Poi确定为待预测片段。
在本发明的另一些实施例中,对于已输入字符goshop,可以从字母g开始,在词典中查找被覆盖的前缀单词,由于go与后面的s或者sh无法构成词典词,故单词go可以作为一个前缀单词;而对于已输入字符中位于单词go以后的字符,虽然可以在词典中查找得到单词shop,但由于该单词shop的最后一个字母与所述已输入字符的最后一个字符重合,如果剥离该单词shop,所述已输入字符中不再有字符,也即无法进行接下来的组合结果,因而单词shop不能作为已输入字符goshop的前缀单词,应该作为待预测片段。
当然,如果自动补充之前就知道所需复合词所包含单词或词根的数量N(N为自然数),那么,子步骤S1所述前缀单词的数目则为N-1;此时对于前缀单词的识别效率和准确的会更好,则本发明能够起到更好的效果。
对于需要对中间片段进行补充的情况,本发明可以将前缀单词之后的第一个字母字符作为待预测片段的起始点,而将该字母字符之后的下一个特征字符作为待预测片段的结束点;此时,所述步骤201可以包括以下子步骤:
子步骤U1、从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
子步骤U2、查找所述前缀单词之后的第一个特征字符;
子步骤U3、将前缀单词之后,该特征字符之前的字符确定为待预测片段。
例如,对于用户的已输入字符为TotalRec-pro,查找得到的前缀单词为Total,子步骤U2查找得到特征字符“-”;子步骤U3则是将Rec确定为待预测片段。
方案三、
本方案的核心思想在于,从所述已输入字符中的末尾截取待预测片段;此时,所述步骤201的执行过程可以为:
从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段可以包括一个或多个字符。
以已输入字符goshop为例,从最后一个字符p开始,可以截取得到3个待预测片段op、hop、shop;进一步,获取所述3个待预测片段的补充结果的过程可以为:op→opera,hop→hope,shop→shopping;这样,将所述非补充部分与所述补充结果进行拼接,即可得到多个组合结果:goshopera,goshope,goshopping。
以上对获取待预测片段的几种方案进行了详细介绍,所述几种方案对于不会在通用词库中直接出现的英文复合词,能够达到较好的补充效果;可以理解,本领域技术人员可以根据需要联合使用所述几种方案,或者,使用其中任一种方案,本发明对此不加以限制。
当然,除了上述几种方案,本领域技术人员还可以采用其它获取待预测片段的方案,例如,只需在所述已输入字符中找到待预测片段的两个边界:起始点和结束点即可,本发明对此不加以限制。
还需要说明的是,对于一个待预测片段,其对应的组合结果可能为多个;以已输入字符goshop为例,假设步骤201获取到的待预测片段为shop,那么,其对应的补充结果可以包括:shopped,shopper,shopping,也即,其对应的组合结果可以为多个:goshopped,goshopper,goshopping;这些组合结果可以全部提供给用户进行选择。
但是,在步骤201获取到多个待预测片段时,最终得到的组合结果的数量繁多,如果将这些组合结果杂乱无章地提供给用户,会给用户的选择带来不便,同时还会影响用户的输入效率。
针对上述情形,在本发明的一种优选实施例中,在所述步骤204前,可以按照一定的规则对所述组合结果进行排序,或者仅提供最佳组合结果,此时,本发明还可以包括以下步骤:
步骤V1、对所述一个或多个待预测片段的组合结果进行排序;
步骤V2、根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
在实际中,可以将排序后的组合结果以候选项的形式展现给用户,供用户选择;或者,只显示最佳组合结果,其中,所述最佳组合结果也即排在第一位的组合结果。当然,在排序展现中,也可以仅仅排序展现补充结果,用户针对补充结果进行选择后,将相应的组合结果上屏输出。
在具体实现中,本发明可以包括如下排序方法:
方法一、根据待预测片段的长度对相应的组合结果进行排序;
例如,可以认为较长的待预测片段更优,也即,较长待预测片段的组合结果排在前面;以上述3个待预测片段op、hop、shop为例,假设其对应的组合结果分别为:goshopera,goshope,goshopping,根据本方法,可认为goshopping优于goshope优于goshopera,这样,所述3个组合结果在候选项中的顺序则为:goshopping,goshope,goshopera。
方法二、根据所述待预测片段的补充结果的属性信息,对相应的组合结果进行排序;
在具体实现中,本方法可以包括两种情形:
情形1、针对多个待预测片段的情形;
以上述3个待预测片段op、hop、shop为例,假设其对应的补充结果分别为:op→opera,hop→hope,shop→shopping,对应的组合结果分别为:goshopera,goshope,goshopping,具体可以包括两种排序策略:
策略A、按照补充结果的长度;
例如,可以认为较长的补充结果更优,这样,可认为shopping优于opera优于hope,进一步,这些个组合结果在候选项中的顺序可以为:goshopping,goshopera,goshope。
策略B、按照补充结果在词典中的词频信息。
补充结果词频高的,组合结果排序靠前。
情形2、针对一个待预测片段的情形;
在待预测片段的数量为1时,可以采用上述策略A和策略B来对该待预测片段的多个补充结果或组合结果进行排序。
同时可以注意到,由于对同一个待预测片段进行补充,故该待预测片段的多个补充结果具有相同的字符部分——待预测片段,这样,还可以按照字母排序,便于用户查找所要的组合结果。
例如,对于待预测片段bo,假设获取到3个补充结果:bo→boat,bo→book,bo→bow,按照字母排序,a在o前面,o在w前面,故可认为boat优于book优于bow。当然,在排序展现中,可以仅仅排序展现补充结果,也可以排序展现组合结果。
方法三、根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
在将已输入字符中最后一个单词的字符作为待预测片段时,所述已输入字符中的非补充部分可能包括完整的单词,如单词1或者单词1+单词2等。如果所述非补充部分具有可拆分性,则其对应的待预测片段被自动补充为单词或者常用复合词的可能性比较大,因而该待预测片段是较优的,其中,所述可拆分性是指所述非补充部分为一个或多个拆分单词的组合。
例如,对于已输入字符goshop,假设其在补充过程中自动识别了3个待预测片段op、hop、shop,在其对应的3个非补充部分gosh、gos、go中,只有go能够独立成词,即具有可拆分性,故待预测片段shop优于其它两个待预测片段。
进一步,在所述非补充部分为一个或多个拆分单词的组合时,本方法还可以根据所述拆分单词的数量,或者,所述拆分单词的长度,或者,所述拆分单词的词频信息,对所述待预测片段的组合结果进行排序。
以已输入字符NewLinePoi为例,假设其在补充过程中识别了3个待预测片段Poi、ePoi、LinePoi,则所述3个待预测片段对应的非补充部分分别为NewLine、Newlin、New,那么,本方法的排序过程可以包括:
首先,经判断得知,NewLine具有2个拆分单词New和Line,NewLin不具有拆分性,New具有1个拆分单词,故NewLine和New都优于NewLin,即待预测片段Poi和待预测片段LinePoi的补充结果优于待预测片段ePoi的补充结果;
进而,如果认为拆分单词数量多的非补充部分较优,则可得出,NewLine优于New,即待预测片段Poi的补充结果优于待预测片段LinePoi的补充结果。
另外,在排序时,还可以考虑到所述非补充部分与待预测片段的关联关系,例如go和shop是具有上下文关联关系的,或者是符合语法关系的,即主谓宾关系等,即具有关联关系的情况,更符合用户的实际需求,对该待预测片段的识别更为准确。
另外,还可以考虑到非补充部分的完整性,例如gos不够完整,所以非补充部分为go,待预测片段为sh符合用户实际需求的可能性更大。
以上对组合结果的几种排序方法进行了详细介绍,可以理解,本领域技术人员可以根据需要使用其中一种或多种方案,本发明对此不加以限制。
考虑到英文中常遇到的大小写字母转换问题,本发明的英文自动补充方法能够支持特定的大小写匹配规则,可以给出适合需求的候选项。具体可以包括:
一、小写匹配大写原则;
因为大写字母输入不方便,很多用户喜欢用小写代替大写,例如,在用户输入“engl”时,本发明可以自动匹配得到候选项:“English”;
二、大写匹配小写原则;
假设步骤201获取得到的待预测片段为Shop,那么,在获取Shop的补充结果时,如果词典中已经存在大写的Shopping,则可以直接进行补充;如果不存在,则首先需要将Shop转换为shop再执行补充,获得组合结果shopping后再还原大写部分得到Shopping。
另外,某些输入法系统具有记录用户使用过的词条的功能,当用户首次输入某个复合词时,可以使用本发明的英文自动补充方法得到想要的复合词词条,同时该词条会被记录;这样,当用户第二次使用该复合词时,就可以使用常规的词典搜索方法直接进行匹配。
与前述方法实施例相对应,本发明还给出了一种字符自动补充的装置,具体可以包括:
片段获取单元401,用于从用户的已输入字符中获取待预测片段,所述待预测片段为所述已输入字符的一部分;
补充结果获取单元402,用于针对所述待预测片段匹配获取相应的补充结果;
输出单元403,用于组合非补充部分和补充结果,得到组合结果并输出。
由于所述待预测片段用来标明用户的已输入字符中需要进行自动补充的对象,故所述待预测片段的获取是本发明的关键所在,本发明可以提供如下片段获取单元的结构设计方案:
设计方案一、
本方案的设计思想在于,根据所述已输入字符中的标识字符来确定待预测片段。
如果利用标识最后一个单词的特征字符,来确定待预测片段;相应地,可以在所述片段获取单元中设计如下子单元:
第一查找子单元C1,用于查找所述已输入字符中的特征字符;
第一确定子单元C2,用于将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。
具体而言,本方案的两个子单元可以包括两种工作情形:
情形1、在第一查找子单元C1查找得到的特征字符为所述已输入字符中的最后一个大写字母时,第一确定子单元C2则将该大写字母及其之后的字符确定为待预测片段;
情形2、在第一查找子单元C1查找得到的特征字符为所述已输入字符中的最后一个标识符号时,第一确定子单元C2则将该标识符号之后的字符确定为待预测片段。
当利用用户已输入字符中的标识字符对中间部分进行自动补充时,需要识别位于中间部分的待预测片段,则所述片段获取单元也可以包括:
第三查找子单元,用于查找所述已输入字符中的特征字符;
第三确定子单元,用以对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段,或者,将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段。
具体的,当所述特征字符为所述已输入字符中的标识符号,所述待预测片段为两个相邻标识符号之间的字符;或者,所述特征字符为所述已输入字符中的大写字母,所述待预测片段包括两个相邻大写字母之间的字符,以及前一个大写字母。
设计方案二、
本方案的设计思想在于,可以通过词典或本地/远程服务器的词库数据查找所述已输入字符中的前缀单词,并将所述已输入字符中位于前缀单词之后的字符确定为待预测片段;相应地,可以在所述片段获取单元中设计如下子单元:
第二查找子单元D1,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,在词典中查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
第二确定子单元D2,用于将所述前缀单词之后的字符确定为待预测片段。
当利用用户已输入字符中的标识字符对中间部分进行自动补充时,则我们可以利用上述方案得到待预测片段的起始点,进而通过紧邻的下一个特征字符,来确定所需的待预测片段。
具体的,所述片段获取单元也可以包括:
第四查找子单元,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
第五查找子单元,用于查找所述前缀单词之后的第一个特征字符;
第四确定子单元,用于将所述前缀单词之后,该特征字符之前的字符确定为待预测片段。
如果将光标应用到待预测片段的获取过程中,则所述片段获取单元具体可以包括:
第六查找子单元,用于查找所述已输入字符中的特征字符;
第五确定子单元,用以将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
设计方案三、
本方案的设计思想在于,从所述已输入字符中的末尾截取待预测片段。当然,基于本方案,可能得到多个待预测片段。
基于上述思想,可以在所述片段获取单元中设计截取子单元E1,用于从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段可以包括一个或多个字符。
可以理解,本领域技术人员可以根据需要使用所述几种方案中的一种或几种,本发明对此不加以限制。
针对组合结果的数量繁多,导致给用户的选择带来不便,同时影响用户输入效率的情形,在本发明的一种优选实施例中,可以在所述输出单元中设计如下结构:
排序子单元H1,用于对所述一个或多个待预测片段的组合结果进行排序;
显示子单元H2,用于根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
当然,在实际配置中,也可以将上述的排序、显示单元作为一个新的独立模块存在,而不位于输出单元中,本发明对此无需加以限制。在本发明的另一实施例中,上述的排序、显示单元也可以针对补充结果进行排序展示,当用户选择所需的补充结果后,可以直接将相应的组合结果上屏输出。
具体的,所述排序子单元H1可以包括下述三种模块中的一种或者多种:
第一排序模块H11,用于根据待预测片段的长度对相应的组合结果进行排序;
第二排序模块H12,用于根据所述待预测片段的补充结果的属性信息,对相应的组合结果进行排序;
第三排序模块H13,用于根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
其中,在所述非补充部分为一个或多个拆分单词的组合时,所述第三排序模块H13可以具体用于根据所述拆分单词的数量,或者,所述拆分单词的长度,或者,所述拆分单词的词频信息,对所述待预测片段的组合结果进行排序。
在本发明的一实施例中,所述第三排序模块具体也可以用于根据非补充部分的完整性,对所述待预测片段的组合结果进行排序;或者,所述第三排序模块具体用于根据非补充部分与待预测片段的关联关系,对所述待预测片段的组合结果进行排序。
上述自动补充装置可以应用在各种需要字符自动补充的硬件环境和网络环境中。例如,可以应用于各种输入法系统中,所述包括自动补充装置的输入法系统可以运行在多种计算设备上,例如,个人电脑、个人数字助理、移动终端设备等等。
例如,参照图5,示出了本发明一种输入法系统实施例,其可以包括:
输入接口单元501,用于接收用户的输入信息;
信息转换单元502,用于依据所接收的输入信息,在词库中进行检索,得到相应的候选项并排序;
展现单元503,用于依序展现候选项;
结果输出单元504,用于接收用户的选择信息,输出指定的候选项;
其还可以包括:
片段获取单元505,用于从用户的已输入字符中获取待预测片段,所述待预测片段为所述已输入字符的一部分;
补充结果获取单元506,用于针对所述待预测片段匹配获取相应的补充结果;
组合单元507,用于组合非补充部分和补充结果,得到组合结果并通过展现单元503进行展现。
图5所示的输入法实施例既可以用于普通的文字输入过程(例如中文拼音输入),也可以用于字符自动补充方式的文字输入过程。
本发明还可以提供一种专用于字符自动补充的输入法系统实施例,其可以包括:
输入接口单元,用于接收用户的输入信息;所述输入信息包括字符;
片段获取单元,用于从用户的已输入字符中获取待预测片段,所述待预测片段为所述已输入字符的一部分;
补充结果获取单元,用于针对所述待预测片段匹配获取相应的补充结果;
展现单元,用于对补充结果进行展现;或者,用于对组合非补充部分和补充结果得到的组合结果进行展现;
输出单元,用于接收用户的选择信息,输出指定的组合结果。
对于上述字符自动补充装置及包括字符自动补充装置的输入法系统,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种字符自动补充的方法、装置和输入法系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (24)

1.一种字符自动补充的方法,其特征在于,包括:
从用户的已输入字符中获取待预测片段,所述用户已输入字符包括非补充部分和需要补充的待预测片段;
针对所述待预测片段,匹配获取相应的补充结果;其中,所述补充结果包括所述待预测片段和所述待预测片段对应的词根;
组合非补充部分和补充结果,输出组合结果;
其中,所述从用户的已输入字符中获取待预测片段的步骤包括:
从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段包括一个或多个字符。
2.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
查找所述已输入字符中的特征字符;
将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。
3.如权利要求2所述的方法,其特征在于,
所述特征字符为所述已输入字符中的最后一个大写字母,所述待预测片段为该大写字母及其之后的字符;
或者,所述特征字符为所述已输入字符中的最后一个标识符号,所述待预测片段为该标识符号之后的字符。
4.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
将光标所在位置之后的字符作为待预测片段。
5.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
查找所述已输入字符中的特征字符;
对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段,或者,将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段。
6.如权利要求5所述的方法,其特征在于,
所述特征字符为所述已输入字符中的标识符号,所述待预测片段为两个相邻标识符号之间的字符;
或者,所述特征字符为所述已输入字符中的大写字母,所述待预测片段包括两个相邻大写字母之间的字符,以及前一个大写字母。
7.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
查找所述已输入字符中的特征字符;
将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
8.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
将所述前缀单词之后的字符确定为待预测片段。
9.如权利要求1所述的方法,其特征在于,所述从用户的已输入字符中获取待预测片段的步骤还包括:
从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
查找所述前缀单词之后的第一个特征字符;
将所述前缀单词之后,该特征字符之前的字符确定为待预测片段。
10.如权利要求1所述的方法,其特征在于,还包括:
对组合结果进行排序;
根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
11.如权利要求10所述的方法,其特征在于,通过以下步骤对所述组合结果进行排序:
根据待预测片段的长度对相应的组合结果进行排序;
或者,
根据所述补充结果的属性信息,对相应的组合结果进行排序;
或者,
根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
12.如权利要求11所述的方法,其特征在于,所述补充结果的属性信息包括所述补充结果的长度,或者,所述补充结果的词频信息。
13.如权利要求11所述的方法,其特征在于,所述非补充部分包括一个或多个拆分单词;
所述根据已输入字符中的非补充部分,对相应的组合结果进行排序的步骤包括:
根据拆分单词的数量,或长度,或词频信息,对相应组合结果进行排序;
或者,根据非补充部分的完整性,对相应组合结果进行排序;
或者,根据非补充部分与待预测片段的关联关系,对相应组合结果进行排序。
14.一种字符自动补充的装置,其特征在于,包括:
片段获取单元,用于从用户的已输入字符中获取待预测片段,所述用户已输入字符包括非补充部分和需要补充的待预测片段;
补充结果获取单元,用于针对所述待预测片段,匹配获取相应的补充结果;其中,所述补充结果包括所述待预测片段和所述待预测片段对应的词根;
输出单元,用于组合非补充部分和补充结果,得到组合结果并输出;
其中,所述片段获取单元包括:
截取子单元,用于从所述已输入字符的最后一个字符开始,按照从后往前的顺序,在所述已输入字符中截取得到一个或多个待预测片段,其中,所述待预测片段包括一个或多个字符。
15.如权利要求14所述的装置,其特征在于,所述片段获取单元还包括:
第一查找子单元,用于查找所述已输入字符中的特征字符;
第一确定子单元,用于将所述特征字符及其之后的字符确定为待预测片段,或者,将所述特征字符之后的字符确定为待预测片段。
16.如权利要求14所述的装置,其特征在于,所述片段获取单元具体用于将光标所在位置之后的字符作为待预测片段。
17.如权利要求14所述的装置,其特征在于,所述片段获取单元还包括:
第二查找子单元,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
第二确定子单元,用于将所述前缀单词之后的字符确定为待预测片段。
18.如权利要求14所述的装置,其特征在于,所述片段获取单元还包括:
第三查找子单元,用于查找所述已输入字符中的特征字符;
第三确定子单元,用以对于两个相邻特征字符,将所述两个相邻特征字符之间的字符确定为待预测片段,或者,将前一特征字符以及所述两个相邻特征字符之间的字符确定为待预测片段。
19.如权利要求14所述的装置,其特征在于,所述片段获取单元包括:
第四查找子单元,用于从所述已输入字符的第一个字母开始,按照从前往后的顺序,查找被所述已输入字符所覆盖的单词或词根,并将所述单词或词根作为前缀单词;
第五查找子单元,用于查找所述前缀单词之后的第一个特征字符;
第四确定子单元,用于将所述前缀单词之后,该特征字符之前的字符确定为待预测片段。
20.如权利要求14所述的装置,其特征在于,所述片段获取单元还包括:
第六查找子单元,用于查找所述已输入字符中的特征字符;
第五确定子单元,用以将光标与特征字符之间的字符确定为待预测片段,或者,将光标与特征字符之间的字符以及该特征字符本身确定为待预测片段。
21.如权利要求14所述的装置,其特征在于,所述输出单元包括:
排序子单元,用于对组合结果进行排序;
显示子单元,用于根据排序结果对所述组合结果进行排序显示,或者,显示最佳组合结果。
22.如权利要求21所述的装置,其特征在于,所述排序子单元包括:
第一排序模块,用于根据待预测片段的长度对相应的组合结果进行排序;
或者,
第二排序模块,用于根据所述补充结果的属性信息,对相应的组合结果进行排序;
或者,
第三排序模块,用于根据所述已输入字符中的非补充部分,对相应的组合结果进行排序。
23.如权利要求22所述的装置,其特征在于,所述非补充部分包括一个或多个拆分单词;
所述第三排序模块具体用于根据拆分单词的数量,或长度,或词频信息,对相应组合结果进行排序;
或者,所述第三排序模块具体用于根据非补充部分的完整性,对相应组合结果进行排序;
或者,所述第三排序模块具体用于根据非补充部分与待预测片段的关联关系,对相应组合结果进行排序。
24.一种输入法系统,其特征在于,包括前述权利要求14至23中任一项所述的字符自动补充装置。
CN201010164451.0A 2010-04-30 2010-04-30 一种字符自动补充的方法、装置和输入法系统 Active CN102236423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010164451.0A CN102236423B (zh) 2010-04-30 2010-04-30 一种字符自动补充的方法、装置和输入法系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010164451.0A CN102236423B (zh) 2010-04-30 2010-04-30 一种字符自动补充的方法、装置和输入法系统

Publications (2)

Publication Number Publication Date
CN102236423A CN102236423A (zh) 2011-11-09
CN102236423B true CN102236423B (zh) 2016-01-20

Family

ID=44887141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010164451.0A Active CN102236423B (zh) 2010-04-30 2010-04-30 一种字符自动补充的方法、装置和输入法系统

Country Status (1)

Country Link
CN (1) CN102236423B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629160B (zh) 2012-03-16 2016-08-03 华为终端有限公司 一种输入法、输入装置及终端
CN102722315A (zh) * 2012-05-10 2012-10-10 奇智软件(北京)有限公司 一种用于移动终端的提示框展示方法和装置
DE102013004239A1 (de) * 2013-03-12 2014-09-18 Audi Ag Einem Fahrzeug zugeordnete Vorrichtung mit Buchstabiereinrichtung Vervollständigungs-Vorschlag
US20150169537A1 (en) * 2013-12-13 2015-06-18 Nuance Communications, Inc. Using statistical language models to improve text input
CN104102720B (zh) * 2014-07-18 2018-04-13 上海触乐信息科技有限公司 高效输入的预测方法和装置
CN104281275B (zh) 2014-09-17 2016-07-06 北京搜狗科技发展有限公司 一种英文的输入方法和装置
CN104462465A (zh) * 2014-12-17 2015-03-25 百度在线网络技术(北京)有限公司 一种输入提示方法和装置
CN106021280A (zh) * 2016-04-28 2016-10-12 周奇 一种查询关键词的方法和装置
CN107526527B (zh) * 2016-06-22 2022-04-15 北京搜狗科技发展有限公司 一种输入方法和装置、及一种用于输入的装置
CN107977089B (zh) * 2016-10-21 2021-12-14 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN109725738A (zh) * 2017-10-31 2019-05-07 北京金山安全软件有限公司 一种基于命名实体的信息展示方法、装置及系统
CN108600084A (zh) * 2018-04-03 2018-09-28 Oppo广东移动通信有限公司 信息传输方法、装置、存储介质及移动终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1338068A (zh) * 1999-01-04 2002-02-27 字原技术有限公司 表意语言及非表意语言的文字输入系统
CN101436198A (zh) * 2008-12-12 2009-05-20 腾讯科技(深圳)有限公司 提高搜索准确率的方法和装置
CN101576876A (zh) * 2009-03-03 2009-11-11 杜小勇 一种自动拆分英文复合词组的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1338068A (zh) * 1999-01-04 2002-02-27 字原技术有限公司 表意语言及非表意语言的文字输入系统
CN101436198A (zh) * 2008-12-12 2009-05-20 腾讯科技(深圳)有限公司 提高搜索准确率的方法和装置
CN101576876A (zh) * 2009-03-03 2009-11-11 杜小勇 一种自动拆分英文复合词组的系统和方法

Also Published As

Publication number Publication date
CN102236423A (zh) 2011-11-09

Similar Documents

Publication Publication Date Title
CN102236423B (zh) 一种字符自动补充的方法、装置和输入法系统
US7149971B2 (en) Method, apparatus, and system for providing multi-language character strings within a computer
US9400775B2 (en) Document data entry suggestions
CN101520786B (zh) 一种输入法词典的实现方法和输入法系统
EP3879427A2 (en) Information extraction method, extraction model training method, apparatus and electronic device
CN101876878A (zh) 单词预测输入系统及方法
CN108932218B (zh) 一种实例扩展方法、装置、设备和介质
CN108897869B (zh) 语料标注方法、装置、设备和存储介质
CN104808806A (zh) 根据不确定性信息实现汉字输入的方法和装置
CN102542042A (zh) 一种在移动设备上搜索应用程序的方法及系统
CN101561725B (zh) 一种手写快速输入的方法和系统
CN103970751A (zh) 多国语言网页转换系统及方法
CN103778124A (zh) 一种树形结构查询方法及装置
US20160371251A1 (en) English input method and input device
CN115687655A (zh) 一种基于pdf文档的知识图谱构建方法、系统、设备及存储介质
CN114003843A (zh) 一种页面生成方法、装置、设备及存储介质
CN112764734B (zh) 代码编辑的辅助方法、装置及电子设备
CN101882025A (zh) 手写输入方法及系统
CN112397050B (zh) 韵律预测方法、训练方法、装置、电子设备和介质
CN111309872B (zh) 搜索处理方法、装置及设备
CN105955986A (zh) 一种字符的转换方法及装置
CN110362691B (zh) 一种句法树库构建系统
CN102722490B (zh) 一种电子阅读器的取词方法、取词装置及电子阅读器
CN102014199A (zh) 一种信息显示方法及终端
CN104123378A (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant