CN112416141A - 针对输入字符串的处理方法、装置、设备和介质 - Google Patents

针对输入字符串的处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN112416141A
CN112416141A CN202011115409.XA CN202011115409A CN112416141A CN 112416141 A CN112416141 A CN 112416141A CN 202011115409 A CN202011115409 A CN 202011115409A CN 112416141 A CN112416141 A CN 112416141A
Authority
CN
China
Prior art keywords
error correction
candidate word
input
correction candidate
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011115409.XA
Other languages
English (en)
Inventor
费腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chenxing Software Technology Co ltd
Original Assignee
Shanghai Chenxing Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chenxing Software Technology Co ltd filed Critical Shanghai Chenxing Software Technology Co ltd
Priority to CN202011115409.XA priority Critical patent/CN112416141A/zh
Publication of CN112416141A publication Critical patent/CN112416141A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了针对输入字符串的处理方法、装置、设备和介质。该方法包括:接收用户输入的字符串;确定字符串的第一候选词集,第一候选词集包括目标纠错候选词;若目标纠错候选词满足预设条件,在字符串输入的界面显示第二候选词集,第二候选词集为去掉目标纠错候选项的第一候选词集;其中,预设条件包括:历史输入的字符串对应的目标纠错候选词在界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。根据本申请实施例提供的方案,可以提高输入法的智能性。

Description

针对输入字符串的处理方法、装置、设备和介质
技术领域
本申请涉及输入法技术领域,尤其涉及针对输入字符串的处理方法、装置、设备和介质。
背景技术
随着输入法技术的发展,人们对输入法的智能性的要求也越来越高。
在现有技术的一些输入法中,为了提高智能性,考虑到存在用户输入错误的可能性,在输入字符串之后,可以对输入字符串进行纠错后显示输入字符串对应的纠错候选词。例如,如果用户输入“hrw”,则显示的候选词中包括该字符串的纠错候选词“和我”。
然而,对于没有错误输入的用户情况,显示该纠错候选词,也显得输入法不够智能。因此,需要一种能够提高输入法智能性的技术方案。
发明内容
本申请实施例提供的针对输入字符串的处理方法、装置、设备和介质,可以提高输入法的智能性。
第一方面,提供一种针对输入字符串的处理方法,包括:
接收用户输入的字符串;
确定字符串的第一候选词集,第一候选词集包括目标纠错候选词;
若目标纠错候选词满足预设条件,在字符串输入的界面显示第二候选词集,第二候选词集为去掉目标纠错候选项的第一候选词集;
其中,预设条件包括:历史输入的字符串对应的目标纠错候选词在界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
在一种可选的实施方式中,预设条件还包括:
目标时刻与当前时刻的时间差小于预设时间差阈值,其中,目标时刻为最近一次显示目标纠错候选词的时刻。
在一种可选的实施方式中,方法还包括:
若目标纠错候选词不满足预设条件,在界面显示第一候选词集。
在一种可选的实施方式中,方法还包括:
接收用户从第一候选词集中选择目标纠错候选词的输入;
响应于输入,将未被选中的次数清零。
在一种可选的实施方式中,第一候选词集包括多个类别的纠错候选词,目标纠错候选词为多个类别中预设类别的纠错候选词。
在一种可选的实施方式中,第一候选词包括利用多个纠错方式获取的纠错候选词,方法还包括:
按照纠错方式对第一候选词集分类,得到利用多个纠错方式获取的纠错候选词;
将利用多个纠错方式中预设纠错方式得到的纠错候选词,确定为预设类别的纠错候选词;
其中,预设纠错方式为:添加字符的方式、或者删除字符的方式、或者交换字符位置的方式、或者替换字符的方式。
第二方面,提供一种针对输入字符串的处理装置,包括:
接收模块,用于接收用户输入的字符串;
词集确定模块,用于确定字符串的第一候选词集,候选词集包括目标纠错候选词;
显示模块,用于若目标纠错候选词满足预设条件,在字符串输入的界面显示第二候选词集,第二候选词集为去掉目标纠错候选项的第一候选词集;
其中,预设条件包括:历史多次输入的字符串对应的目标纠错候选词在界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
在一种可选的实施方式中,预设条件还包括:
目标时刻与当前时刻的时间差小于预设时间差阈值,其中,目标时刻为最近一次显示目标纠错候选词的时刻。
第三方面,提供一种针对输入字符串的处理设备,包括:存储器,用于存储程序;
处理器,用于运行存储器中存储的程序,以执行第一方面或第一方面的任一可选的实施方式提供的针对输入字符串的处理方法。
第四方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或第一方面的任一可选的实施方式提供的针对输入字符串的处理方法。
根据本申请实施例中的针对输入字符串的处理方法、装置、设备和介质,在接收到用户输入的字符串之后,可以根据前面连续多次输入该字符串且在界面显示目标纠错候选词的情景下、用户对目标纠错候选项的选中行为,确定在本次显示的候选词集中是否隐藏目标纠错候选项,从而提高了输入法的智能性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种示例性地针对输入字符串对应显示第一候选词集的场景示意图;
图2是本申请实施例提供的一种示例性地针对输入字符串对应显示第二候选词集的场景示意图;
图3是本申请实施例提供的一种针对输入字符串的处理方法的示意流程图;
图4是本申请实施例提供的另一种针对输入字符串的处理方法的流程示意图;
图5是本申请实施例提供的一种针对输入字符串的处理装置的结构示意图;
图6是本申请实施例提供的一种针对输入字符串的处理设备的示例性硬件结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在一种相关技术中,用户每一次在键盘上输入字符串后,键盘均会对应显示该字符串的纠错候选词。然而,所显示的纠错候选词可以并不是用户所希望看到的,也就是说,显示了无效的纠错候选词。这种显示方式较为单一。
基于此,本申请实施例提供了针对输入字符串的处理方法、装置、设备和介质,在历史多次输入该字符串且在界面显示目标纠错候选词的情景下,若用户均未选中目标纠错候选词,则在本次展示的候选词集中隐藏目标纠错候选项,提高了输入法的智能性。
本申请实施例提供的技术方案,可应用于在电子设备的键盘上进行字符串输入的场景中。示例性地,可以适用于在输入法具有纠错功能的键盘上进行字符串输入。
其中,本申请实施例中的电子设备可以是诸如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等的移动电子设备,也可以为诸如电视机(television,TV)、柜员机或者自助机等的非移动电子设备,对此不作具体限定。
为了更好的理解本申请,图1是本申请实施例提供的一种示例性地针对输入字符串对应显示第一候选词集的场景示意图。本实施例的下述部分将结合图1对涉及的第一候选词集、纠错候选词、普通候选词等概念作具体解释说明。
如图1所示,图1中字符串输入界面包括:字符串的输入栏11、候选词集显示栏12。当用户在输入栏11输入字符串“hrw”后,在候选词集显示栏12显示该字符串的候选词集。其中,所显示的第一候选词集包括“还让我”、“会让我”等普通候选词,以及“和我”、“忽然间”等纠错候选词。可选地,如图1所示,为了与普通候选词相区分,纠错候选词的右上方可以添加有相应的标识。其中,标识的具体图标、标识的位置可根据具体场景和实际需求进行设置,对此不作限制。
具体地,用户期望输入某个词时,会在输入栏11输入一个字符串。然而,键盘根据输入的字符串可能无法准确用户期望输入的词,因此会在显示栏12显示多个用户可能输入的词,即显示多个候选词,以供从中选择自己期望的词。
相应地,在显示栏12所显示的多个候选词的集合即为第一候选词集。对于第一候选词集,第一候选词集包括输入字符串对应的多个候选词,其中候选词可以是字、词语、短语、短句等,对候选词的形式不作具体限制。可选地,第一候选词集除了包括纠错候选词之外,还可以包括普通候选词。
其中,对于普通候选词,普通候选词可以是输入字符串在词库中对应的词。其中,词库可以是普通词库和/或智能词库,词库可以存储于本地和/或云端,对词库的具体类型和存储位置等不作具体限制。
对于纠错候选词,纠错候选词的获取步骤可以如下:(1)先通过诸如添加字符、删除字符、交换字符位置、或者替换字符等纠错方式,得到输入字符串对应的纠错字符串。(2)在词库中确定纠错字符串对应的词,并将所确定的词作为纠错候选词。
考虑到在每次输入字符串的过程中均显示包括纠错候选词的第一候选词集的方式较为单一,在本申请实施例中,若目标纠错候选词满足预设条件,则可以对应显示去除了目标纠错候选词的第二词集。
图2是本申请实施例提供的一种示例性地针对输入字符串对应显示第二候选词集的场景示意图。本实施例的下述部分将结合图2对涉及的目标纠错候选词和第二候选词集等概念作具体解释说明
首先,目标纠错候选词包括输入字符串的纠错候选词中的部分或全部纠错候选词。例如,可以将全部纠错候选词作为目标纠错候选词,或者,可以将某一个或者某几个纠错候选词作为目标纠错候选词,又或者,可以将某一类候选词作为目标纠错候选词。其中,图2中的目标纠错候选词为“和我”。
然后,对于第二候选词集,第二候选词集为去掉目标纠错候选项的第一候选词集。示例性地,通过图1和图2对比可知,两个场景的不同之处在于,图2中显示栏12未显示目标纠错候选词“和我”,除目标纠错候选词“和我”之外的普通候选词和其他纠错候选词则正常显示。
需要说明的是,若所有纠错候选词均为目标纠错候选词,则显示栏12显示的第二候选词集可以仅包括普通候选词。
在介绍完本申请实施例涉及的几个概念之后,本申请实施例的下述部分将对针对输入字符串的处理方案展开具体说明。
下面首先对本申请实施例所提供的针对输入字符串的处理方法进行介绍。
图3是本申请实施例提供的一种针对输入字符串的处理方法的示意流程图。如图3所示,本实施例中的针对输入字符串的处理方法300可以包括以下步骤S310至S330。
S310,接收用户输入的字符串。
其中,用户输入的字符串由一个或多个字符组成。具体地,可以由用户输入的一个或多个字母、数字、符号组成。可选地,在用户输入正确时,输入的字符串应由一个或多个字母组成。
可选地,字符串可以是在中文输入模式下的多个字符,又或者,可以是英文等外文输入模式下的字符,对字符串的输入模式不作限定。
可选地,用户可以直接在电子设备的触控屏上输入字符串,又或者用户可以通过实体键盘、虚拟键盘等外围设备输入字符串,对输入字符串的具体方式不作限定。
S320,确定字符串的第一候选词集。
可选地,第一候选词集包括多个普通候选词和包括目标纠错候选词在内的多个纠错候选词。其中,第一候选词集、普通候选词、纠错候选词的具体内容可以参见本申请上述实施例的相关说明,对此不再赘述。
可选地,若字符串为中文输入模式的多个字符,则第一候选词集中的候选词可以包括中文字词。若字符串为外文输入模式下的字符,则第一候选词集中的候选词可以包括外文词句。示例性地,若在英文输入模式下输入“hrllo”,则候选词可以包括“hello”。或者,若字符串为中文输入模式的多个字符,则第一候选词集中的候选词也可以包括外文字词。比如,若在中文输入模式下输入“nice”,则候选词可以包括“你猜”、“nice”等,对字符串和候选词的语言不作限制。
S330,若目标纠错候选词满足预设条件,在字符串输入的界面显示第二候选词集。
其中,预设条件包括条件A:条件A、历史多次输入的字符串对应的目标纠错候选词在界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
也就是说,若未被选中的次数表示为n,预设次数阈值表示为N,则预设条件可以表示为n>N。
示例性地,在执行S210前,用户针对同一字符串已进行过m次输入,也就是说S210是用户针对同一字符串的第m+1次输入。若在已进行的m次输入的过程中,若其中有n次输入对应显示第一候选词集,也就是说有n次输入均对应显示了目标纠错候选词。若用户在n次输入的过程中均未在第一候选词集中选择目标纠错候选词,且n大于预设次数阈值N,则确定目标候选词满足预设条件。其中,m、n、N为正整数,预设次数阈值N可以根据具体场景和实际需求设置,对此不作限制。
作一个具体的示例,若N为5,在本次输入之前,已进行过10次输入。若在前10次输入的过程中对应显示第一候选词集且目标纠错候选词均未被选中。对于第11次输入,n=10,n大于N,则第11输入对应的目标纠错候选词满足预设条件,在第11次输入的过程中对应显示去除掉目标纠错候选词的第二候选词集。
作另一个具体的示例,若N为5,在本次输入之前,已进行过10次输入。若在前6次输入的过程中对应显示第一候选词集且目标纠错候选词均未被选中,第7-10次输入的过程中显示第二候选词集。对于第11次输入,n=6,n大于N,则第11输入对应的目标纠错候选词满足预设条件,在第11次输入的过程中对应显示去除掉目标纠错候选词的第二候选词集。
根据本申请实施例中的针对输入字符串的处理方法,在接收到用户输入的字符串之后,可以根据前面连续多次输入该字符串且在界面显示目标纠错候选词的情景下、用户对目标纠错候选项的选中行为,确定在本次显示的候选词集中是否隐藏目标纠错候选项,从而提高了输入法的智能性。
需要说明的是,在每一次输入的过程中,若用户在显示的第一候选词集中未选中目标纠错候选词,则针对此次输入字符串的用户行为,用户并没有错误的将目标纠错候选词错输为该字符串。若用户连续多次均未错误输入,则表征该目标纠错候选词对于用户来说,可能是无效纠错词,为了提高显示效率,以及改善用户使用体验,可以对该目标纠错候选词进行隐藏。
在一些实施例中,预设条件还包括条件B:
条件B、目标时刻与当前时刻的时间差小于预设时间差阈值。其中,目标时刻为最近一次显示目标纠错候选词的时刻。
也就是说,若未被选中的次数表示为n,预设次数阈值表示为N,目标时刻表示为t,当前时刻表示为curTime,预设时间差阈值表示为T。则预设条件可以表示为:n>N&&curTime-T≤t。其中,在本申请实施例中符号“&&”表示和的意思,也就是说需要同时满足n>N以及curTime-T≤t。可选地,预设时间差阈值T可以根据具体场景和实际需求设置,对此不再赘述。
示例性地,若N为5,在本次输入之前,已进行过10次输入。若在前6次输入的过程中对应显示第一候选词集且目标纠错候选词均未被选中,第7-10次输入的过程中显示第二候选词集。则目标时刻可以为在第6次输入的过程中对应显示目标纠错候选词的时刻。
通过本实施例,考虑到用户连续多次未错输对短时间内的用户是否错输的行为分析具有指导意义。经过一段时间之后,用户可能仍会存在错输,若此时不显示目标纠错候选词,则可能会使得输入法表现的不是很智能。因为,通过设置预设时间差阈值,目标纠错时间段可以在隐藏一段时间之后,再次进行显示,这种显示方式更加贴合用户行为习惯,进一步提高了输入法的智能性。
图4是本申请实施例提供的另一种针对输入字符串的处理方法的流程示意图。如图4所示,方法400基本相同于方法300,二者相同的步骤在此不再赘述。不同之处在于,方法400还包括S340。
S340,若目标纠错候选词不满足预设条件,在界面显示第一候选词集。
也就是说,若预设条件包括上述条件A,则在目标纠错候选词未被选中的次数小于或等于预设次数阈值时,则显示第一候选词集。也就是说,显示目标纠错候选词。
又或者,若预设条件包括上述条件A和条件B,则在下述两种情况中,显示第一词集:
情况一、在目标纠错候选词未被选中的次数小于或等于预设次数阈值时,此时无论目标时刻的取值,均对应显示第一候选词集。
情况二、若目标时刻与当前时刻的差值大于预设时间差阈值,此时无论目标纠错候选词未被选中的次数的取值,均对应显示第一候选词集。示例性地,若前6次输入字符串的过程中对应显示第一候选词集,在第7-10次输入字符串的过程中当前时刻与第6次显示第一候选词集的时刻均小于预设时间差阈值,显示第二候选词集。若第11次输入字符串的过程中当前时刻与第6次显示第一候选词集的时刻大于预设时间差阈值,则显示第一候选词集。
另外,根据S340可知,由于历史多次输入的字符串对应显示目标纠错候选词,则表征在历史多次输入字符串的过程中,目标纠错候选词均不满足预设条件。
此外,需要说明的是,若本次显示第一候选词集,若用户未对本次显示的第一候选词集中的目标候选词选择,则用户再次输入该字符串时,未被选中的次数加1。
在一些实施例中,上述方法中还可以包括下述步骤A1和步骤A2。
步骤A1、接收用户从第一候选词集中选择目标纠错候选词的输入。
可选地,用户的选择输入可以是用户在电子设备的触控屏上的触发操作,又或者可以是用户通过实体鼠标、虚拟鼠标等外围设备的选择输入,对输入的方式不作限制。
可选地,用户选择输入可以是点击、长按、滑动、拖动等操作,选择输入的具体动作可以根据具体场景和实际需求设置,对此不作限制。
步骤A2、响应于该选择输入,将未被选中的次数清零。
示例性地,若在前4次输入的过程中对应显示第一候选词集、且目标纠错候选词均未被选中。若在第5次输入的过程中对应显示第一候选词集、但目标纠错候选词被选中,则对于第6次输入,未被选中的次数为0。
通过本实施例,若用户在某一次选中了目标纠错候选词,则表征用户在本次在输入目标纠错候选词的过程中错输了字符串。无关于前面的输入情况,用户在后面的输入过程中可能会再次出现此类型的错输,将未被选中的次数清零,可以排除前面多次输入结果的影响,这种显示方式更加贴合用户行为习惯,进一步提高了输入法的智能性。
为了更进一步了解本申请实施例提供的技术方案,本申请实施例的下述部分将分为三个示例,分别结合不同的目标纠错候选词对本申请实施例提供的针对输入字符串的处理方法进行具体说明。
在一个示例中,目标纠错候选词可以是全部纠错候选词,此时,若选择任意一个纠错候选词,则表示目标纠错候选词被选中。若本次输入过程中目标纠错候选词满足预设条件,则全部纠错候选词均不进行显示。也就是说,只显示本输入字符串的普通候选词。
在另一个示例中,目标纠错候选词可以一个或多个特定的纠错候选词,此时,若选择特定的纠错候选词,则表示目标纠错候选词被选中。若本次输入过程中目标纠错候选词满足预设条件,则目标纠错候选词均不进行显示。也就是说,除目标纠错候选词之外的其他纠错候选词、以及普通候选词均进行显示。
在又一个示例中,第一候选词集包括多个类别的纠错候选词,目标纠错候选词为多个类别中预设类别的纠错候选词。
示例性地,可以按照纠错方式可以对纠错候选词进行分类。此时,方法还可以包括下述步骤B1和步骤B2。
步骤B1、按照纠错方式对第一候选词集分类,得到利用多个纠错方式获取的纠错候选词。
比如,可以将第一候选词集中的纠错候选词分为下述四类:
(1)按照添加字符的方式生成的纠错候选词。比如,若输入字符串为“hrw”,则纠错字符串可以是“htrw”、“hrwj”等。“htrw”、“hrwj”对应的纠错候选词划分为一类。
(2)按照删除字符的方式生成的纠错候选词。示例性地,若输入字符串为“hrw”,则对应的纠错字符串可以是“hw”、“rw”等。
(3)按照交换字符位置的方式生成的纠错候选词。示例性地,若输入字符串为“hrw”,则对应的纠错字符串可以是“rhw”、“hwr”等。
(4)按照替换字符的方式生成的纠错候选词。示例性地,若输入字符串为“hrw”,则对应的纠错字符串可以是“hew”、“grw”。
步骤B2、将利用多个纠错方式中预设纠错方式得到的纠错候选词,确定为预设类别的纠错候选词。
其中,预设纠错方式为:添加字符的方式、或者删除字符的方式、或者交换字符位置的方式、或者替换字符的方式。
需要说明的是,除此之外还可以是其他分类方式,比较将“h”对应为“好”的纠错候选词分为一类,对候选字符串的分类方式不作限定。
通过本实施例,由于存在用户一些打字习惯,可能会经常漏输入字符,或者连打时两个字符容易错位等,因此,通过对纠错方式进行分类,可以反映出用户的打字习惯,从而能够根据用户打字习惯来决定目标纠错候选词的显示与否,进一步提高了输入法的智能性。
基于相同的申请构思,本申请实施例除了提供了针对输入字符串的处理方法之外,还提供了与之对应的针对输入字符串的处理装置。下面结合附图,详细介绍根据本申请实施例的装置。
本申请实施例提供了一种针对输入字符串的处理装置。图5是本申请实施例提供的一种针对输入字符串的处理装置的结构示意图。如图5所示,针对输入字符串的处理装置500包括:接收模块510、词集确定模块520和显示模块530。
接收模块510,用于接收用户输入的字符串。
词集确定模块520,用于确定字符串的第一候选词集,候选词集包括目标纠错候选词。
显示模块530,用于若目标纠错候选词满足预设条件,在字符串输入的界面显示第二候选词集,第二候选词集为去掉目标纠错候选项的第一候选词集。
其中,预设条件包括:历史多次输入的字符串对应的目标纠错候选词在界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
根据本申请实施例的针对输入字符串的处理装置,可以在接收到用户输入的字符串之后,可以根据前面连续多次输入该字符串且在界面显示目标纠错候选词的情景下、用户对目标纠错候选项的选中行为,确定在本次显示的候选词集中是否隐藏目标纠错候选项,从而提高了输入法的智能性。
在本申请的一些实施方式中,预设条件还包括:目标时刻与当前时刻的时间差小于预设时间差阈值,其中,目标时刻为最近一次显示目标纠错候选词的时刻。
在本申请的一些实施方式中,显示模块530还用于若目标纠错候选词不满足预设条件,在界面显示第一候选词集。
在本申请的一些实施方式中,接收模块510还用于接收用户从第一候选词集中选择目标纠错候选词的输入;
装置还包括:处理模块,用于响应于输入,将未被选中的次数清零。
在本申请的一些实施方式中,第一候选词集包括多个类别的纠错候选词,目标纠错候选词为多个类别中预设类别的纠错候选词。
在本申请的一些实施方式中,第一候选词包括利用多个纠错方式获取的纠错候选词,装置还包括:
分类模块,用于按照纠错方式对第一候选词集分类,得到利用多个纠错方式获取的纠错候选词;
候选词确定模块,用于将利用多个纠错方式中预设纠错方式得到的纠错候选词,确定为预设类别的纠错候选词;
其中,预设纠错方式为:添加字符的方式、或者删除字符的方式、或者交换字符位置的方式、或者替换字符的方式。
根据本申请实施例的针对输入字符串的处理装置的其他细节,与以上结合图3至图4所示实例描述的针对输入字符串的处理方法类似,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图6是本申请实施例提供的一种针对输入字符串的处理设备的示例性硬件结构示意图。
在针对输入字符串的处理设备可以包括处理器601以及存储有计算机程序指令的存储器602。
具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在针对输入字符串的处理设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种针对输入字符串的处理方法。
在一个示例中,针对输入字符串的处理设备还可包括通信接口606和总线610。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
通信接口603,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线610包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该针对输入字符串的处理设备可以执行本申请实施例中的针对输入字符串的处理方法,从而实现结合图3至图5描述的针对输入字符串的处理方法和装置。
另外,结合上述实施例中的针对输入字符串的处理方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种针对输入字符串的处理方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置、设备及和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种针对输入字符串的处理方法,其特征在于,所述方法包括:
接收用户输入的字符串;
确定所述字符串的第一候选词集,所述第一候选词集包括目标纠错候选词;
若所述目标纠错候选词满足预设条件,在所述字符串输入的界面显示第二候选词集,所述第二候选词集为去掉所述目标纠错候选项的第一候选词集;
其中,所述预设条件包括:历史输入的所述字符串对应的所述目标纠错候选词在所述界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
2.根据权利要求1所述的方法,其特征在于,所述预设条件还包括:
目标时刻与当前时刻的时间差小于预设时间差阈值,其中,所述目标时刻为最近一次显示所述目标纠错候选词的时刻。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
若所述目标纠错候选词不满足所述预设条件,在所述界面显示所述第一候选词集。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户从所述第一候选词集中选择目标纠错候选词的输入;
响应于所述输入,将所述未被选中的次数清零。
5.根据权利要求1所述的方法,其特征在于,
所述第一候选词集包括多个类别的纠错候选词,所述目标纠错候选词为所述多个类别中预设类别的纠错候选词。
6.根据权利要求5所述的方法,其特征在于,
所述第一候选词包括利用多个纠错方式获取的纠错候选词,所述方法还包括:
按照纠错方式对所述第一候选词集分类,得到利用多个纠错方式获取的纠错候选词;
将利用所述多个纠错方式中预设纠错方式得到的纠错候选词,确定为预设类别的纠错候选词;
其中,所述预设纠错方式为:添加字符的方式、或者删除字符的方式、或者交换字符位置的方式、或者替换字符的方式。
7.一种针对输入字符串的处理装置,其特征在于,所述装置包括:
接收模块,用于接收用户输入的字符串;
词集确定模块,用于确定所述字符串的第一候选词集,所述候选词集包括目标纠错候选词;
显示模块,用于若所述目标纠错候选词满足预设条件,在所述字符串输入的界面显示第二候选词集,所述第二候选词集为去掉所述目标纠错候选项的第一候选词集;
其中,所述预设条件包括:历史多次输入的所述字符串对应的所述目标纠错候选词在所述界面显示且均未被选中,以及未被选中的次数大于预设次数阈值。
8.根据权利要求7所述的装置,其特征在于,所述预设条件还包括:
目标时刻与当前时刻的时间差小于预设时间差阈值,其中,所述目标时刻为最近一次显示所述目标纠错候选词的时刻。
9.一种针对输入字符串的处理设备,其特征在于,所述设备包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以执行权利要求1-6任一权利要求所述的针对输入字符串的处理方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1-6任一权利要求所述的针对输入字符串的处理方法。
CN202011115409.XA 2020-10-19 2020-10-19 针对输入字符串的处理方法、装置、设备和介质 Pending CN112416141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011115409.XA CN112416141A (zh) 2020-10-19 2020-10-19 针对输入字符串的处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011115409.XA CN112416141A (zh) 2020-10-19 2020-10-19 针对输入字符串的处理方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN112416141A true CN112416141A (zh) 2021-02-26

Family

ID=74840877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011115409.XA Pending CN112416141A (zh) 2020-10-19 2020-10-19 针对输入字符串的处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112416141A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113238664A (zh) * 2021-05-14 2021-08-10 北京百度网讯科技有限公司 一种字符确定方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN109002183A (zh) * 2017-06-07 2018-12-14 北京搜狗科技发展有限公司 一种信息输入的方法及装置
CN109408796A (zh) * 2017-08-17 2019-03-01 北京搜狗科技发展有限公司 一种信息处理方法、装置及电子设备
CN110069143A (zh) * 2018-01-22 2019-07-30 北京搜狗科技发展有限公司 一种信息防误纠方法、装置和电子设备
CN111125302A (zh) * 2019-11-29 2020-05-08 海信视像科技股份有限公司 用户输入语句检错方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN109002183A (zh) * 2017-06-07 2018-12-14 北京搜狗科技发展有限公司 一种信息输入的方法及装置
CN109408796A (zh) * 2017-08-17 2019-03-01 北京搜狗科技发展有限公司 一种信息处理方法、装置及电子设备
CN110069143A (zh) * 2018-01-22 2019-07-30 北京搜狗科技发展有限公司 一种信息防误纠方法、装置和电子设备
CN111125302A (zh) * 2019-11-29 2020-05-08 海信视像科技股份有限公司 用户输入语句检错方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113238664A (zh) * 2021-05-14 2021-08-10 北京百度网讯科技有限公司 一种字符确定方法、装置及电子设备
CN113238664B (zh) * 2021-05-14 2023-07-25 北京百度网讯科技有限公司 一种字符确定方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US10671281B2 (en) Neural network for keyboard input decoding
CN105009064B (zh) 使用语言和空间模型的触摸键盘
AU2014212844B2 (en) Character and word level language models for out-of-vocabulary text input
US20140082545A1 (en) Posture-adaptive selection
CN105308551A (zh) 用于连续手势输入的多图形键盘
CN107341143A (zh) 一种句子连贯性判断方法及装置和电子设备
CN105074643A (zh) 非词典字符串的手势键盘输入
KR101476229B1 (ko) 수식 입력 방법 및 장치
CN104769530A (zh) 用于字符串替换的键盘手势
CN112765319B (zh) 一种文本的处理方法、装置、电子设备及存储介质
CN112580299A (zh) 智能评标方法、评标设备及计算机存储介质
CN114998881A (zh) 深度学习模型的训练方法、文本识别方法、装置和设备
US9298276B1 (en) Word prediction for numbers and symbols
CN104680196A (zh) 手写字符识别方法和系统
CN112416141A (zh) 针对输入字符串的处理方法、装置、设备和介质
CN111046627B (zh) 一种中文文字显示方法及系统
EP2410405A2 (en) Methods and apparatuses for statistically sorting characters for multi-tap keyboards
CN112949290A (zh) 文本纠错方法、装置及通信设备
CN111090341A (zh) 输入法候选结果展示方法、相关设备及可读存储介质
CN112699780A (zh) 对象识别方法、装置、设备及存储介质
CN110956034B (zh) 词语的获取方法及装置、商品搜索方法
CN103853468A (zh) 汉字拼音输入法的纠错方法及移动终端
CN113064497A (zh) 语句识别的方法、装置、设备及计算机存储介质
CN111966267A (zh) 应用评论方法、装置和电子设备
CN115017904B (zh) 一种基于大数据的信息处理方法和信息处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210226

WD01 Invention patent application deemed withdrawn after publication