CN102810095B - 一种学词方法和装置 - Google Patents

一种学词方法和装置 Download PDF

Info

Publication number
CN102810095B
CN102810095B CN201110147255.7A CN201110147255A CN102810095B CN 102810095 B CN102810095 B CN 102810095B CN 201110147255 A CN201110147255 A CN 201110147255A CN 102810095 B CN102810095 B CN 102810095B
Authority
CN
China
Prior art keywords
content
user
word
buffer memory
upper screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110147255.7A
Other languages
English (en)
Other versions
CN102810095A (zh
Inventor
查文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201110147255.7A priority Critical patent/CN102810095B/zh
Publication of CN102810095A publication Critical patent/CN102810095A/zh
Application granted granted Critical
Publication of CN102810095B publication Critical patent/CN102810095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种学词方法和装置,其中的学词方法具体包括:记录用户输入的至少一次上屏内容;如果所述记录的某次上屏内容的部分内容被用户更改,对更改后的该次上屏内容进行学词。本发明能够提高学词的智能性,从而提高用户的输入效率。

Description

一种学词方法和装置
技术领域
本发明涉及输入法技术领域,特别是涉及一种学词方法和装置。
背景技术
随着计算机技术以及互联网技术的普及与发展,输入法已经成为用户与计算机交互的重要手段,不同专业领域、不同兴趣以及使用习惯的用户对于输入法的智能性要求越来越高。
现有的输入法一般通过提高系统词库中词条的更新程度以及词频信息的准确度,来提高用户输入字符时的效率。
但是由于系统词库是相对固定的,针对每一个用户而言,难以达到精确匹配;为了增强个性化的输入效率,用户词库应运而生,具体地,输入法通过学词,将用户输入的上屏词(通过上屏动作后上屏的词)存储至用户词库中。这里,上屏动作是指,在用户通过输入法确认输入内容后,将输入内容输出到应用程序的动作。对于用户词库中的词条,输入法还会根据用户输入这个词条的次数和最后一次输入这个词条的时间来对词条赋予一个属性,称为用户词频。
在用户进行输入的时候,首先会从用户词库中查找与输入的编码字符串相匹配的词条,如果能直接命中,就返回用户词库中的词,否则再到系统词库中查找。因此,用户词库的学词可以在一定程度上调整候选项的排序,使其逐渐适应该用户,从而提高输入效率。
然而,在实际应用中,用户词库的学词会存在如下情况:用户输入编码字符串后,由于候选词选择失误而将错误的候选词作为词条学入用户词库。例如,用户欲通过编码字符串“zhanglianfeng”输入“张连凤”,下意识按空格键上屏首选项“张连峰”,却发现打错字了;于是,按退格键删除错误的“峰”字,以及,通过编码字符串“feng”输入正确的“凤”字。
对于上述情况,是不应该将错误的候选词作为词条学入用户词库的。于是,现有技术中,一种输入法对学词过程作了改进,参照图1,所述学词过程具体可以包括:
步骤101、接收用户的上屏词;
步骤102、将所述上屏词作为词条学入词库,并进行调频;
步骤103、监视用户的下一步动作;
步骤104、判断用户的下一步动作是否为退格键,若是,在执行步骤105,否则,执行步骤106;
步骤105、将用户词库还原至上次上屏动作前的状态;
步骤106、保留用户词库中步骤102学入的词条。
虽然上述学词过程避免将错误的候选词进入用户词库。但由于其在判断用户输入失误后,就将用户词库还原至上次上屏动作前的状态,故抛弃了用户真正输入的内容。
对应前例,如果用户欲输入“张连凤”,其在首次输入上屏词为“张连峰”,然后,通过删除“峰”,补上“凤”达到更正目的。在这种情况下,输入法在删除“峰”时对用户词库进行了还原,本次输入的“张连峰”不会学习到用户词库中;同时,输入“凤”后会提高“凤”的用户词频;该用户下次输入“张连凤”时,还会遇到困难,从而影响该用户的输入效率和输入法的智能性。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何改变现有输入法的智能性不高的现状,提供一种能够准确记录用户真正想要输入的内容的学词方法,大大提高用户的输入效率。
发明内容
本发明所要解决的技术问题是提供一种学词方法和装置,能够提高学词的智能性,从而提高用户的输入效率。
为了解决上述问题,本发明公开了一种学词方法,包括:
记录用户输入的至少一次上屏内容;
如果所述记录的某次上屏内容的部分内容被用户更改,对更改后的该次上屏内容进行学词。
优选的,所述方法还包括:识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
优选的,所述记录用户输入的至少一次上屏内容包括:在缓存中保存用户输入的至少一次上屏内容;
所述方法还包括:如果识别出用户更改了所述某次上屏内容的部分内容,则对应更改缓存中保存的该次上屏内容;
所述对更改后的上屏内容进行学词包括:对缓存中更改后的该次上屏内容进行学词。
优选的,所述识别用户动作进一步包括:
记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;或者
将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
优选的,所述方法还包括:删除缓存中已进行学词的所述上屏内容。
优选的,所述对缓存中更改后的上屏内容进行学词包括:在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词。
优选的,所述对缓存中更改后的上屏内容进行学词包括:在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
所述方法还包括:按照设定规则删除缓存中已输出的上屏内容。
优选的,所述方法还包括:如果对用户动作的识别结果为补充输入、终止输入或切换输入环境,则对缓存中保存的各次上屏内容进行学词。
优选的,所述更改包括至少一次替换部分内容和/或至少一次删除部分内容。
另一方面,本发明还公开了一种学词装置,具体可以包括:
记录单元,用于记录用户输入的至少一次上屏内容;及
学词单元,用于在所述记录的某次上屏内容的部分内容被用户更改时,对更改后的该次上屏内容进行学词。
优选的,所述装置还包括:
用户动作识别单元,用于识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
优选的,所述装置还包括:
缓存单元,用于保存用户输入的至少一次上屏内容;
更改单元,用于在识别出用户更改了所述某次上屏内容的部分内容时,对应更改缓存中保存的该次上屏内容;
所述学词单元,具体用于对缓存中更改后的该次上屏内容进行学词。
优选的,所述用户动作识别单元进一步包括:
第一用户动作识别子单元,用于记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;或者
第二用户动作识别子单元,用于将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
优选的,所述装置还包括:
第一删除单元,用于按照设定规则删除缓存中已进行学词的所述上屏内容。
优选的,所述学词单元包括:
第一学词子单元,用于在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词。
优选的,所述学词单元包括:
第二学词子单元,用于在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
所述装置还包括:
第二删除单元,用于删除缓存中已输出的上屏内容。
优选的,所述装置还包括:
确认学词单元,用于在对用户动作的识别结果为补充输入、终止输入或切换输入环境时,对缓存中保存的各次上屏内容进行学词。
优选的,所述更改包括至少一次替换部分内容和/或至少一次删除部分内容。
与现有技术相比,本发明具有以下优点:
在输入一个性化词语的过程中,用户首次上屏的内容往往既包括正确部分内容又包括错误部分内容,于是,通过更改错误部分内容,以输入真正想要的个性化词语;现有技术中,一旦发现删除了部分内容,则不再对首次上屏的内容和更正后的该次上屏内容进行学词,导致浪费了一次学词的机会;
而本发明在某次上屏内容的部分内容被用户更改时,即对更改后的该次上屏内容进行学词;由于更改后的该次上屏内容为真正反映用户意图的上屏内容;因此,本发明能够真正根据用户习惯和意图进行学词,可以提高学词的智能性,从而使得目标词库能够与用户习惯同步,使其逐渐适应该用户;这样,在该用户进行之后相应编码字符串的输入时,候选项的排序能够顺应用户习惯,从而提高输入效率。
附图说明
图1是现有技术一种学词过程的流程图;
图2是本发明一种学词方法实施例1的流程图;
图3是本发明一种学词方法实施例2的流程图;
图4是本发明一种学词方法实施例3的流程图;
图5是本发明一种学词装置的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图2,示出了本发明一种学词方法实施例1的流程图,具体可以包括:
步骤201、记录用户输入的至少一次上屏内容;
本发明可以应用于各种输入方式的输入法系统,包括键盘符号、手写信息等等,即用户可以通过编码字符串、手写输入信息等输入上屏内容。下面仅以编码字符串的输入方式为例进行说明,其它输入方式相互参见即可。
在输入法领域,无论是中文、日文、韩文还是其它语言的输入法,都是把用户输入的编码字符串转换成相应语言的候选项,然后由用户来选择输出至应用程序的内容,这里输出至应用程序的内容也即上屏内容。
在用户的连续输入过程中,一旦通过上屏动作输出上屏内容,这些上屏内容都可被记录。例如:李纲|事件|过去|后(“|”表示用户上屏动作),四次上屏内容都会被依次被记录。
步骤202、如果记录的某次上屏内容的部分内容被用户更改,对更改后的该次上屏内容进行学词。
在输入一个性化词语的过程中,用户首次上屏的内容往往既包括正确部分内容又包括错误部分内容,于是通过更改错误部分内容,以输入真正想要的个性化词语;这里,所述更改主要可以包括至少一次替换部分内容和/或至少一次删除部分内容。
对于替换部分内容,本发明可以提供如下应用示例:
示例A1、
实际输入过程中,经常会输入人名,例如:“周永彬”。但是输入法中编码字符串“zhouyongbin”的默认首选候选项可能是“周永斌”;用户下意识按空格键上屏首选项“周永斌”,却发现打错字了;于是,按退格键删除错误的“斌”字,以及,通过编码字符串“bin”输入正确的“彬”字。
示例A2、
实际输入过程中,还经常会输入物名(品牌名称等),例如,用户输入句子“叫|金克拉|的|钾肥”,上屏后,用户发现实际品牌应为“金坷垃”;于是,移动光标到“金”后面,按删除键删除“拉(la)”和“克(ke)”,然后输入“坷(ke)垃(la)”。
可以发现,上述示例中,替换了某次上屏内容的部分内容:“彬”替换了“周永斌”中的“斌”,“坷垃”替换了“金克拉”中的“克拉”,而由于替换后的该次上屏内容为用户真正想要(真正反映用户意图)的上屏内容,故本发明针对替换后的该次上屏内容(“周永彬”和“金坷垃”)进行学词。
还有一些应用场景中,用户的某次上屏内容中包含有错误部分内容的原因,并不是选择了错误的候选项,而是因为失误输入了多余的编码字符串,此处对应删除部分内容的应用示例:
应用示例B1、用户输入“zhouyongb”并下意识按空格键上屏首选项“周永斌”,却发现多敲了一个“b”(“斌”);于是,按退格键删除错误的“斌”字。
可以发现,上述示例中,删除了某次上屏内容的部分内容后,即能够得到用户真正想要的上屏内容,例如,删除了“周永斌”中的“斌”后,就能够针对删除后的该次上屏内容(“周永”)进行学词。
需要说明的是,上述某次上屏内容可以是用户最后一次上屏的内容,也可以是用户以往上屏的内容,本发明可以分别提供相应的应用示例:
应用示例C1、
用户欲通过编码字符串“zhanglianfeng”输入“张连凤”,下意识按空格键上屏首选项“张连峰”,却发现打错字了;于是,按退格键删除错误部分内容——“峰”,以及,通过编码字符串“feng”输入正确的“凤”字。
本示例中,用户通过替换部分内容,对某次上屏内容“张连峰”进行更改,因此,本示例中,所述某次上屏内容为用户最后一次上屏的内容。
应用示例C2、
在用户输入“李纲|事件|过去|后”后,发现“纲”字有误,于是,首先通过移动光标删除“纲”,再继续输入“gang”并选择“刚”。
本示例中,用户在选择了某次上屏内容“李纲”后,间隔三个上屏内容(“事件”、“过去”、“后”)后,才通过替换部分内容进行更改,因此,本示例中,所述某次上屏内容是指用户以往上屏的内容。
需要说明的是,本实施例将某次上屏内容划分为正确部分内容和错误部分内容,主要是为了说明错误部分内容为所述某次上屏内容的部分内容,而不会对正确部分内容和错误部分内容各自在所述某次上屏内容中的位置关系和各自的数目作出规定和限制。
总之,本发明在某次上屏内容的部分内容被用户以替换或删除的方式更改时,即对更改后的该次上屏内容进行学词;由于更改后的该次上屏内容为真正反映用户意图的上屏内容;因此,本发明能够真正根据用户习惯和意图进行学词,可以提高学词的智能性,从而使得用户词库能够与用户习惯同步,使其逐渐适应该用户。
本发明实施例中,学词主要是指将更改后的某一上屏内容存储至目标词库的过程,这里的目标词库可以是系统词库,也可以是用户词库,或者,还可以是人名词库、历史词库等其它词库,本发明对具体的词库不加以限制。
对于目标词库中的词条,输入法还会根据用户输入这个词条的次数和最后一次输入这个词条的时间来对词条赋予一个属性,称为词频,且词频为候选项的主要排序因素。因此,本发明针对目标词库的智能学词,能够使得目标词库能够与用户习惯同步,使其逐渐适应该用户;这样,在该用户进行之后相应编码字符串的输入时,候选项的排序能够顺应用户习惯,从而提高输入效率。
在本发明的一种优选实施例中,所述方法还可以包括:识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
在用户的连续输入过程中,本发明可以持续捕获用户动作,其中,所述用户动作可以包括如下动作中的一种或多种:移动光标、选择、退格、插入、继续输入等。
例如,应用示例C1中,针对某次上屏内容“张连峰”,可对相应的用户动作(退格、继续输入和选择)进行识别,经识别发现于“张连峰”相应的用户动作是为了达到替换部分内容的意图,故确定用户对所述某次上屏内容的部分内容进行了更改。
又如,应用示例C2中,针对某次上屏内容“李纲”,可对相应的用户动作——通过移动光标删除“纲”,再继续输入“gang”并选择“刚”上屏(退格、继续输入和选择),发现这些用户动作的目的是为了将“纲”更新为“刚”,故确定用户对所述某次上屏内容的部分内容进行了更改。
参照图3,示出了本发明一种学词方法实施例2的流程图,具体可以包括:
步骤301、在缓存中保存用户输入的至少一次上屏内容;
步骤302、识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改;
步骤303、如果识别出用户更改了所述某次上屏内容的部分内容,则对应更改缓存中保存的该次上屏内容;
步骤304、对缓存中更改后的该次上屏内容进行学词。
相对于实施例1,本实施例引入缓存的概念,不仅能够在学词前,使用缓存来保存用户输入的至少一次上屏内容,而且,能够通过操作(更改和学词)缓存中保存的某次上屏内容,来达到学词目的。
在用户的连续输入过程中,一旦通过上屏动作输出一次上屏内容,这些上屏内容都被存入缓存。例如:李纲|事件|过去|后(“|”表示用户上屏动作),四次上屏内容都会被依次保存至缓存。
在本发明实施例中,可以基于缓存维护思想,来涉及所述识别用户动作的执行时机,具体可以包括:
情形D1、基于某次上屏内容在缓存中的生命周期,具体可以包括:
记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;
这里,生命周期可以指某次上屏内容在缓存中的存放时间;假设设置某次上屏内容在缓存中的生命周期为M(M为自然数),那么,在其生命周期M内识别用户针对该次上屏内容的动作都是可以的。
情形D2、基于缓存的容量限制,具体可以包括:
将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
由于缓存容量是有限的,故为了保障充足的缓存空间,可针对某次上屏内容,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。这里,可以依据实际情形,设置N的大小,如20、100等,本发明对自然数N的取值不加以限制。
在本发明的一种优选实施例中,为了进一步保障充足的缓存空间,所述方法还可以包括:按照设定规则删除缓存中已进行学词的所述上屏内容。
这里,删除动作的执行规则可以由输入法系统或者用户根据需要来设定,可以是在学词完一个上屏内容后,立即将这个上屏内容在缓存中删除,或者,间隔若干时钟周期后将其删除,本发明对具体的删除规则不加以限制。
针对缓存中保存的上屏内容,本发明可以提供如下学词方案:
学词方案一、
在缓存中保存的该次上屏内容更改完成后,直接将该次上屏内容学入词库;
学词方案二、
在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
此时,所述方法还可以包括:删除缓存中已输出的上屏内容。
这里,输出主要是指根据上屏内容更新至预备词条所在存储空间的动作,假设预备词条所在存储空间为第一词库缓存,则在缓存第二次输出与预备词条相同的上屏内容时,才会对这个预备词条进行学词。
对应应用示例C1,在将“张连峰”更改为“张连凤”后,缓存第一次将“张连凤”输出至第一词库缓存;然后,“张连凤”会一直在第一词库缓存中,直至缓存第二次输出“张连凤”,才会将“张连凤”学入目标词库。
学词方案三、
在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词;
所述方法还可以包括:删除缓存中已进行学词的所述上屏内容。
对应应用示例C1,在将“张连峰”更改为“张连凤”后,并不是立即对“张连凤”进行学词,而是在检测到用户输入了下一个上屏内容(如“女士”),才会将“张连凤”学入目标词库。
可以理解,本领域技术人员可以根据需要使用上述任一种学词方案,或者根据实际需要采用其它学词方案,本发明对此不加以限制。
在本发明的一种应用示例中,所述目标词库可以为用户词库,用户词库的记录可以包括:用户输入的已有字词及相应的属性参数;和/或,用户输入的自造字词及相应的属性参数。用户词库记录的数据存储结构可以表示为:
(词条:属性参数1;属性参数2;......;属性参数n)
其中,属性参数可以包括:最后记忆、词频信息、分类信息、级别或权重信息等等。每次将缓存中保存的上屏内容学入用户词库时,本发明都可以依据预置规则对用户词库进行自动更新,其中,所述预置规则可由用户设置。例如,将这个上屏内容作为相应编码字符串的最后记忆进行存储,并且,判断用户词库中是否存在与这个上屏内容相同的词条,若是,则将用户词库中相应词条的词频加一,否则,将这个上屏内容作为新的词条添加到用户词库中。可以理解,本领域技术人员还可以根据需要,设计除最后记忆、词频信息、分类信息、级别或权重信息之外的属性参数,下面仅以最后记忆、词频信息为例进行说明,其它属性参数请相互参照即可。
在该用户进行之后的输入时,输入法系统首先会从用户词库中查找与输入的编码字符串相匹配的词条,如果能直接命中,则会将命中的候选项进行排序,其中,在排序的过程中,输入法系统会优先考虑该编码字符串的最后记忆,然后进一步根据候选项的词频进行排序,词频高的候选项排在前面,词频低的排在后面。
对应应用示例C1,在将“张连凤”学入用户词库时,输入法会判断用户词库中是否存在“张连凤”,若是,则将用户词库中“张连凤”的词频加一,否则,将“张连凤”作为新的词条添加到用户词库中;同时,还会将编码字符串“zhanglianfeng”的最后记忆更新为“张连凤”。
总之,由于用户词库的学词能够反映用户习惯,而本实施例能够依据用户动作的识别结果,确定用户对所述某次上屏内容的部分内容进行更改,并对更改后的该次上屏内容进行学词,从而使得用户词库能够与用户习惯同步,使其逐渐适应该用户;这样,在该用户进行之后相应编码字符串的输入时,候选项的排序能够顺应用户习惯,从而提高输入效率。
对应应用示例C1,由于将“张连凤”学入了用户词库,在该用户下次输入“zhanglianfeng”时,会将候选项“张连凤”排在前面,相对于现有技术漏掉“张连凤”的学词,从用户角度讲,能够减少用户的动作(如选词、退格、继续输入等),从而能够大大降低用户在输入过程中的动作难度,提高用户的输入效率,使用户的文字输入更加轻松化和便利化;从输入法角度讲,则能够提高输入法的智能性。
需要说明的是,通过缓存记录用户输入的至少一次上屏内容只是本发明的一种优选记录方式,实际上,本领域技术人员还可以根据实际需要,采用其它记录方式,如文档记录,等等,本发明对具体的记录方式不加以限制。
对于实施例2而言,由于其与实施例1基本相似,所以描述的比较简单,相关之处参见实施例1的部分说明即可。
参照图4,示出了本发明一种学词方法实施例3的流程图,具体可以包括:
步骤401、在缓存中保存用户输入的至少一次上屏内容;
步骤402、识别用户动作,得到的识别结果具体可以包括:更改部分内容、补充输入、终止输入和切换输入环境,其中,所述更改部分内容为对所述某次上屏内容的部分内容进行的更改;
步骤403、判断所述识别结果,如果是部分内容更改,则执行步骤404,如果是补充输入、终止输入或切换输入环境,则执行步骤405;
步骤404、对应更改缓存中保存的该次上屏内容,并按照某种学词方案,对更改后的该次上屏内容进行学词;具体的学词方案可参见前述实施例;
步骤405、对缓存中保存的各次上屏内容进行学词。
相对于实施例2,本实施例增加了识别结果的种类,其中,补充输入主要指在同一个应用程序(如WORD)中的继续输入,终止输入主要指在终止在一个应用程序中的输入,切换输入环境主要指输入法从一个应用程序(如WORD)切换到另一个应用程序(如EXCEL);对于补充输入、终止输入和切换输入环境的识别结果,相当于用户确认了已经输入的内容,无需对缓存中的各次上屏内容进行更新,直接进行学词即可。
在实际中,所述更改部分内容主要可以包括替换部分内容和/或至少一次删除部分内容,其中,替换后的部分内容可以与被替换的部分内容对应于相同的编码字符串,也可以对应于不同的编码字符串。以拼音输入法为例,替换部分内容又可以进一步包括:同音纠正和异音替换等。
例如,人名示例中,“彬”和“周永斌”中的“斌”是同音字,二者具有同样的编码字符串“bin”;物名示例中,“坷垃”和“金克拉”中的“克拉”是同音词,二者的编码字符串均为“kela”。因此,本实施例可以将上述两个示例中该次上屏内容相应的用户动作识别为同音纠正,并对缓存中该次上屏内容进行相应的替换。
又如,在一些应用场景中,用户并不是选择了错误的候选项,而是因为失误输入了多余的或者错的编码字符串:用户输入“zhouyongbin”并下意识按空格键上屏首选项“周永兵”,却发现将“bing”错敲为“bin”;于是,按退格键删除错误的“斌”字,并且,通过编码字符串“bing”输入“兵”一字;此时,该次上屏内容相应的用户动作识别为异音替换,并对缓存中该次上屏内容进行相应的替换。
可以理解,除了同音纠正、异音替换、删除、补充输入、终止输入和切换输入环境外,本领域技术人员还可以根据实际需要,设置其它识别结果,本发明意在增加学词机会,提高学词的智能性,而不会对具体的识别结果种类加以限制。
与前述学词方法实施例相应,本发明还公开了一种学词装置,参照图5,具体可以包括:
记录单元501,用于记录用户输入的至少一次上屏内容;及
学词单元502,用于在所述记录的某次上屏内容的部分内容被用户更改时,对更改后的该次上屏内容进行学词。
在输入一个性化词语的过程中,用户首次上屏的内容往往既包括正确部分内容又包括错误部分内容,于是通过更改错误部分内容,以输入真正想要的个性化词语;这里,所述更改主要可以包括至少一次替换部分内容和/或至少一次删除部分内容。
在本发明的一种优选实施例中,所述装置还可以包括:
用户动作识别单元,用于识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
在本发明实施例中,更为优选的是,还可以引入缓存的概念,这样,不仅能够在学词前,使用缓存来保存用户输入的至少一次上屏内容,而且,能够通过操作(更改和学词)缓存中保存的某次上屏内容,来达到学词目的。
相应地,所述装置还可以包括:
缓存单元,用于保存用户输入的至少一次上屏内容;
更改单元,用于在识别出用户更改了所述某次上屏内容的部分内容时,对应更改缓存中保存的该次上屏内容;
所述学词单元,具体用于对缓存中更改后的该次上屏内容进行学词。
在使用缓存的情况下,所述装置的用户动作识别单元可以进一步包括:
第一用户动作识别子单元,用于记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;或者
第二用户动作识别子单元,用于将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
在使用缓存的情况下,为了保障充足的缓存空间,在本发明的一种优选实施例中,所述装置还可以包括:
第一删除单元,用于按照设定规则删除缓存中已进行学词的所述上屏内容。
在本发明实施例中,优选的是,所述学词单元501可以进一步包括:
第一学词子单元,用于在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词。
在使用缓存的情况下,为了保障充足的缓存空间,在本发明的一种优选实施例中,所述学词单元501可以进一步包括:
第二学词子单元,用于在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
相应地,所述装置还可以包括:
第二删除单元,用于删除缓存中已输出的上屏内容。
在使用缓存的情况下,在本发明的一种优选实施例中,所述装置还可以包括:
确认学词单元,用于在对用户动作的识别结果为补充输入、终止输入或切换输入环境时,对缓存中保存的各次上屏内容进行学词。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种学词方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种学词方法,其特征在于,包括:
记录用户输入的至少一次上屏内容;
如果所述记录的某次上屏内容的部分内容被用户更改,对更改后的该次上屏内容进行学词;其中,所述更改包括至少一次替换部分内容和/或至少一次删除部分内容;所述部分内容为系统词库中已有的词条。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
3.如权利要求2所述的方法,其特征在于,所述记录用户输入的至少一次上屏内容包括:在缓存中保存用户输入的至少一次上屏内容;
所述方法还包括:如果识别出用户更改了所述某次上屏内容的部分内容,则对应更改缓存中保存的该次上屏内容;
所述对更改后的上屏内容进行学词包括:对缓存中更改后的该次上屏内容进行学词。
4.如权利要求3所述的方法,其特征在于,所述识别用户动作进一步包括:
记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;或者
将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:按照设定规则删除缓存中已进行学词的所述上屏内容。
6.如权利要求5所述的方法,其特征在于,所述对缓存中更改后的上屏内容进行学词包括:在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词。
7.如权利要求3所述的方法,其特征在于,所述对缓存中更改后的上屏内容进行学词包括:在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
所述方法还包括:删除缓存中已输出的上屏内容。
8.如权利要求3所述的方法,其特征在于,所述方法还包括:如果对用户动作的识别结果为补充输入、终止输入或切换输入环境,则对缓存中保存的各次上屏内容进行学词。
9.一种学词装置,其特征在于,包括:
记录单元,用于记录用户输入的至少一次上屏内容;及
学词单元,用于在所述记录的某次上屏内容的部分内容被用户更改时,对更改后的该次上屏内容进行学词;其中,所述更改包括至少一次替换部分内容和/或至少一次删除部分内容;所述部分内容为系统词库中已有的词条。
10.如权利要求9所述的装置,其特征在于,还包括:
用户动作识别单元,用于识别用户动作,根据识别结果确定用户是否对所述某次上屏内容的部分内容进行更改。
11.如权利要求10所述的装置,其特征在于,还包括:
缓存单元,用于保存用户输入的至少一次上屏内容;
更改单元,用于在识别出用户更改了所述某次上屏内容的部分内容时,对应更改缓存中保存的该次上屏内容;
所述学词单元,具体用于对缓存中更改后的该次上屏内容进行学词。
12.如权利要求11所述的装置,其特征在于,所述用户动作识别单元进一步包括:
第一用户动作识别子单元,用于记录将某次上屏内容保存至缓存的时间,在所述时间后的设定时钟周期内识别用户针对该次上屏内容的动作;或者
第二用户动作识别子单元,用于将某次上屏内容保存至缓存后,记录其后用户输入的上屏内容的次数N,在N小于设定数量时识别用户针对该次上屏内容的动作。
13.如权利要求11所述的装置,其特征在于,还包括:
第一删除单元,用于按照设定规则删除缓存中已进行学词的所述上屏内容。
14.如权利要求13所述的装置,其特征在于,所述学词单元包括:
第一学词子单元,用于在用户输入下一个上屏内容后,对所述更改后的上屏内容进行学词。
15.如权利要求11所述的装置,其特征在于,所述学词单元包括:
第二学词子单元,用于在缓存中保存的某次上屏内容更改完成后,将缓存中保存的该次上屏内容输出为预备词条存储,在缓存二次输出与预备词条相同的上屏内容时,对所述二次输出的上屏内容进行学词;
所述装置还包括:
第二删除单元,用于删除缓存中已输出的上屏内容。
16.如权利要求11所述的装置,其特征在于,还包括:
确认学词单元,用于在对用户动作的识别结果为补充输入、终止输入或切换输入环境时,对缓存中保存的各次上屏内容进行学词。
CN201110147255.7A 2011-06-02 2011-06-02 一种学词方法和装置 Active CN102810095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110147255.7A CN102810095B (zh) 2011-06-02 2011-06-02 一种学词方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110147255.7A CN102810095B (zh) 2011-06-02 2011-06-02 一种学词方法和装置

Publications (2)

Publication Number Publication Date
CN102810095A CN102810095A (zh) 2012-12-05
CN102810095B true CN102810095B (zh) 2016-01-13

Family

ID=47233802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110147255.7A Active CN102810095B (zh) 2011-06-02 2011-06-02 一种学词方法和装置

Country Status (1)

Country Link
CN (1) CN102810095B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103941979B (zh) * 2014-04-10 2018-05-04 北京搜狗科技发展有限公司 一种在移动设备中输入文字的方法和装置
CN105373236B (zh) * 2015-10-09 2020-09-08 北京搜狗科技发展有限公司 一种学词方法和装置
CN106959766A (zh) * 2017-03-16 2017-07-18 努比亚技术有限公司 输入法联想方法及联想装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556452A (zh) * 2003-12-31 2004-12-22 哈尔滨工业大学 数字键盘智能拼音汉字输入方法
WO2005036413A1 (en) * 2003-09-19 2005-04-21 America Online, Inc. Contextual prediction of user words and user actions
CN101178741A (zh) * 2007-12-24 2008-05-14 腾讯科技(深圳)有限公司 一种更新用户词库的方法及装置
CN101727200A (zh) * 2009-12-02 2010-06-09 腾讯科技(深圳)有限公司 基于输入行为的处理方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334774B (zh) * 2007-06-29 2013-08-14 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
US8773358B2 (en) * 2007-08-31 2014-07-08 Blackberry Limited Handheld electronic device and associated method providing advanced text editing function in a text disambiguation environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036413A1 (en) * 2003-09-19 2005-04-21 America Online, Inc. Contextual prediction of user words and user actions
CN1556452A (zh) * 2003-12-31 2004-12-22 哈尔滨工业大学 数字键盘智能拼音汉字输入方法
CN101178741A (zh) * 2007-12-24 2008-05-14 腾讯科技(深圳)有限公司 一种更新用户词库的方法及装置
CN101727200A (zh) * 2009-12-02 2010-06-09 腾讯科技(深圳)有限公司 基于输入行为的处理方法和装置

Also Published As

Publication number Publication date
CN102810095A (zh) 2012-12-05

Similar Documents

Publication Publication Date Title
US11928434B2 (en) Method for text generation, device and storage medium
CN103329122B (zh) 使用多个表示的文档存储
CN101369216B (zh) 文字输入方法和文字输入系统
CN110134760A (zh) 一种搜索方法、装置、设备及介质
CN107220300B (zh) 信息挖掘方法、电子装置及可读存储介质
CN105378606A (zh) 用于手势键入的备选假设错误修正
US20130061139A1 (en) Server-based spell checking on a user device
CN103049458B (zh) 一种修正用户词库的方法和系统
CN105431809A (zh) 用于国际语言的虚拟键盘输入
US11361002B2 (en) Method and apparatus for recognizing entity word, and storage medium
US8140533B1 (en) Harvesting relational tables from lists on the web
CN110427614B (zh) 段落层级的构建方法、装置、电子设备及存储介质
CN104808806A (zh) 根据不确定性信息实现汉字输入的方法和装置
CN113011168B (zh) 填空字补齐系统
US20130060560A1 (en) Server-based spell checking
CN105094368A (zh) 一种对输入法候选项进行调频排序的控制方法及控制装置
CN111858905B (zh) 模型训练方法、信息识别方法、装置、电子设备及存储介质
US8572062B2 (en) Indexing documents using internal index sets
CN102915122B (zh) 基于语言模型的智能移动平台拼音输入法
CN104916177B (zh) 电子设备和电子设备的数据输出方法
CN102810095B (zh) 一种学词方法和装置
CN105164669A (zh) 信息处理设备、信息处理方法以及程序
CN114860942A (zh) 文本意图分类方法、装置、设备及存储介质
CN114399772A (zh) 样本生成、模型训练和轨迹识别方法、装置、设备和介质
CN105373236A (zh) 一种学词方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant