CN108241440A - 一种候选词展示方法和装置 - Google Patents

一种候选词展示方法和装置 Download PDF

Info

Publication number
CN108241440A
CN108241440A CN201611227858.7A CN201611227858A CN108241440A CN 108241440 A CN108241440 A CN 108241440A CN 201611227858 A CN201611227858 A CN 201611227858A CN 108241440 A CN108241440 A CN 108241440A
Authority
CN
China
Prior art keywords
input
character
interval
user
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611227858.7A
Other languages
English (en)
Other versions
CN108241440B (zh
Inventor
涂畅
张扬
王砚峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201611227858.7A priority Critical patent/CN108241440B/zh
Publication of CN108241440A publication Critical patent/CN108241440A/zh
Application granted granted Critical
Publication of CN108241440B publication Critical patent/CN108241440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种候选词展示方法和装置,在获取用户输入字符时,计算该用户在输入时,两个相邻输入字符的输入间隔,并根据所述输入间隔确定出停顿间隔,也就是用户在输完一个音节组合后可能停顿的时刻。根据停顿间隔来划分由用户输入字符组成的字符串时,所得到的音节组合可以更贴近用户的实际输入需求,使得根据这种划分方式得到的音节组合来展示该字符串对应的候选词时,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。

Description

一种候选词展示方法和装置
技术领域
本发明涉及输入法领域,特别是涉及一种候选词展示方法和装置。
背景技术
输入法是一种常见的文字输入工具,可以将用户输入的字符串转化为候选词输入到计算机或其他设备。
在用户使用输入法进行输入的过程中,输入法会识别用户所输入字符串可能的音节组合,并将识别出的音节组合所对应的候选词展示给用户。以移动终端的输入法键盘为九键键盘为例,若用户通过按键依次输入“54264”,其对应的音节组合可以包括“jiang”,也可以包括“jiami”,输入法可以根据识别出的音节组合向用户展示这些音节组合所对应的候选词“将”、“加密”等。用户可以从中选择其目标词来确定输入。
发明内容
然而,目前输入法对输入字符串的音节识别中,只针对输入字符串本身可能出现的音节组合进行识别,并未考虑到用户输入想法,即用户实际想要输入什么。使得优先向用户展示的候选词中可能并没有用户实际想要输入的,导致用户可能需要多次翻页后才能找到自己实际想要输入的候选词,从而降低了用户输入体验。
为了解决上述技术问题,本发明提供了一种候选词展示方法和装置,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。
本发明实施例公开了如下技术方案:
第一方面,本发明提供了一种候选词展示方法,所述方法包括:
获取用户输入的字符;
根据输入顺序,计算相邻字符之间的输入间隔;
根据所述输入间隔确定出停顿间隔;
根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
根据所述音节组合展示所述字符串对应的候选词。
可选的,所述根据所述输入间隔确定出停顿间隔,包括:
计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值;
将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
可选的,所述第一阈值是通过所述用户在历史输入字符串中相邻音节组合之间的停顿间隔所确定的,所述第二阈值是通过所述用户在历史输入字符串中相邻字符之间的输入间隔所确定的。
可选的,所述历史输入字符串包括距离执行所述获取用户输入的字符的步骤之前最近的,由所述用户输入的至少一个字符串。
可选的,还包括:
根据所述用户的历史输入字符串的更新而动态调整所述第一阈值和所述第二阈值。
可选的,在所述根据划分的音节组合展示所述字符串对应的候选词之前,还包括:
判断划分的音节组合是否具有对应的候选词;
若具有,执行所述根据划分的音节组合展示所述字符串对应的候选词的步骤;
若不具有,根据所述字符串的字符组成对所述字符串划分音节组合;
根据由所述字符组成划分的音节组合展示所述字符串对应的候选词。
可选的,所述根据由停顿间隔划分的音节组合展示所述字符串对应的候选词,包括:
将由停顿间隔划分的音节组合所对应的至少一个候选词展示在所述字符串的优先展示位置。
第二方面,本发明提供了一种候选词展示装置,所述装置包括获取单元、计算单元、确定单元、划分单元和展示单元:
所述获取单元,用于获取用户输入的字符;
所述计算单元,用于根据输入顺序,计算相邻字符之间的输入间隔;
所述确定单元,用于根据所述输入间隔确定出停顿间隔;
所述划分单元,用于根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
所述展示单元,用于根据所述音节组合展示所述字符串对应的候选词。
可选的,所述确定单元具体包括计算子单元和标识子单元:
所述计算子单元,用于计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值;
所述标识子单元,用于将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
可选的,所述第一阈值是通过所述用户在历史输入字符串中相邻音节组合之间的停顿间隔所确定的,所述第二阈值是通过所述用户在历史输入字符串中相邻字符之间的输入间隔所确定的。
可选的,所述历史输入字符串包括距离执行所述获取用户输入的字符的步骤之前最近的,由所述用户输入的至少一个字符串。
可选的,还包括调整单元:
所述调整单元,用于根据所述用户的历史输入字符串的更新而动态调整所述第一阈值和所述第二阈值。
可选的,所述装置还包括判断单元和执行单元:
所述判断单元,用于判断划分的音节组合是否具有对应的候选词;
若划分的音节组合具有对应的候选词,所述执行单元用于执行所述根据划分的音节组合展示所述字符串对应的候选词的步骤;
若划分的音节组合不具有对应的候选词,所述执行单元用于根据所述字符串的字符组成对所述字符串划分音节组合;根据由所述字符组成划分的音节组合展示所述字符串对应的候选词。
可选的,所述展示单元具体用于将由停顿间隔划分的音节组合所对应的至少一个候选词展示在所述字符串的优先展示位置。
第三方面,本发明提供了一种用于候选词展示的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的字符;
根据输入顺序,计算相邻字符之间的输入间隔;
根据所述输入间隔确定出停顿间隔;
根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
根据所述音节组合展示所述字符串对应的候选词。
由上述技术方案可以看出,在获取用户输入字符时,计算该用户在输入时,两个相邻输入字符的输入间隔,并根据所述输入间隔确定出停顿间隔,也就是用户在输完一个音节组合后可能停顿的时刻。根据停顿间隔来划分由用户输入字符组成的字符串时,所得到的音节组合可以更贴近用户的实际输入需求,使得根据这种划分方式得到的音节组合来展示该字符串对应的候选词时,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种候选词展示方法的流程图;
图2为本发明实施例提供的一种候选词展示装置的装置结构图;
图3为本发明实施例提供的一种用于候选词展示的装置的框图;
图4为本发明实施例提供的一种用于候选词展示的服务器的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
输入法是一种常见的文字输入工具,可以将用户输入的字符串转化为候选词输入到计算机或其他设备。目前输入法对输入字符串的音节识别中,只针对输入字符串本身可能出现的音节组合进行识别,并将这些音节组合所对应的候选词展示给用户。
但在实际应用中,很多用户在使用输入法输入字符串的过程中,潜意识的会在不同的音节组合之间有明显的停顿行为,从而产生停顿间隔,一个音节组合可以理解为一个输入汉字所对应的字符组合,例如输入汉字“好”所对应的音节组合可以为“hao”,输入汉字“人”所对应的音节组合可以为“ren”。
该停顿间隔往往会体现出用户的输入想法,也就是说,用户在输入完一个音节组合后,开始下一个音节组合之前,潜意识的会去回忆下一个音节组合的内容,这种潜意识的回忆过程在输入过程中,会在相邻音节组合之间产生一个相对较长的输入停顿或者说停顿间隔。
针对一个音节组合中输入的字符,相邻字符之间的输入间隔相对于相邻音节之间的停顿时间会短一些。输入的字符可以理解包括汉语拼音、数字等形式,例如“a”,字符可以用于组成音节组合,用户可以通过触发按键(物理键或虚拟键)实现输入对应字符,例如按键可以是数字键盘上的“0”至“9”,也可以是虚拟键盘上的“a”到“z”等。用户在输入字符时,相邻字符之间会有一定输入间隔,例如,用户输入字符“a”和字符“n”,用户输入字符“a”时对应的时间为0秒,用户输入字符“n”时对应的时间为0.1秒,则字符“a”和字符“n”的输入间隔为0.1秒。
用户通过按键序列的依次键入,所对应的输入字符可以形成字符串,字符串可以是一段时间内用户输入的一连串字符,例如,从用户输入的第一个字符,开始计时,可以将30秒内输入的字符,作为一个字符串。字符串也可以是规定的时间间隔用户输入的一连串字符。
字符串可以根据可能组成的输入汉字形成不同的音节组合。若用户想输入的汉字为“将”,那么其对应的音节组合可以包括“jiang”,若用户想输入的汉字为“加密”,那么“加”所对应的音节组合可以为“jia”,“密”所对应的音节组合可以为“mi”。当用户想输入的是“加密”时,在脑海中想的是“jia”和“mi”这两个音节组合,则在用户输入按键序列“54264”时,潜意识的会在相邻两个音节组合之间,也就是输入按键“2”和“6”之间停顿一下,产生停顿间隔。当用户想输入的是“将”时,在脑海中想的是“jiang”这个音节组合,则在用户输入按键序列“54264”时,相邻字符之间的输入间隔一般是固定值或接近于某一个固定值。在本发明实施例中,在进行候选词展示时,可以将用户的这种潜意识停顿行为,作为划分音节组合的一种依据,从而使展示的候选词更加符合用户的实际需求。根据停顿间隔来划分由用户输入字符组成的字符串时,所得到的音节组合可以更贴近用户的实际输入需求,使得根据这种划分方式得到的音节组合来展示该字符串对应的候选词时,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。
基于上述思想,本发明实施例所提供的候选词展示方法可以应用于具有输入功能的智能终端,例如,手机,笔记本电脑,计算机等设备。智能终端可以根据用户对按键的触发获取用户输入的字符。接下来,结合图1来说明本发明实施例所提供的候选词展示的方法。
如图1所示,为本发明实施例提供的一种候选词展示的方法的流程图,该方法包括:
S101:获取用户输入的字符。
用户输入的字符可以是汉语拼音或数字等形式。以移动终端上的汉语拼音输入法为例,用户可以通过触发按键选取合适的字符,移动终端后台可以依据于用户的触发按键,获取到根据触发按键所输入的字符。
S102:根据输入顺序,计算相邻字符之间的输入间隔。
当用户仅输入的字符个数为一个时,移动终端在获取到该字符后,可以依据输入法直接将该字符对应的候选词展示给用户。由于用户需要通过输入音节组合得到输入汉字,故一般情况下,用户会根据所需输入汉字所对应的音节组合中字符组成顺序,依次输入字符,依次输入的多个字符在未确定候选词输入之前,可以形成字符串。
用户在输入字符串时,相邻字符之间会存在一定时间的输入间隔,而输入间隔的时间长短往往涉及了用户输入字符串时潜意识的停顿行为。即当用户输入的字符属于不同的音节组合时,在相邻两个分属不同音节组合的字符之间一般会出现较长的停顿时间,此时该相邻字符之间的输入间隔的时间较长。当用户输入的字符属于同一个音节组合时,在相邻字符之间一般会出现较短的停顿时间,此时该相邻字符之间的输入间隔的时间较短。为了方便说明和区分,在本发明中,将相邻音节组合之间的这种较长的输入间隔定义为停顿间隔,而将同一个音节组合中相邻字符之间的这种较短的输入间隔定义为输入间隔。
因此,在获取到用户输入的字符串后,可以先计算相邻字符之间的输入间隔。在本发明中,相邻字符可以理解为依据输入顺序,先后输入的两个字符,且这两个字符之间没有其他字符。故可以依据于用户输入字符的输入顺序,进行相邻字符之间的输入间隔的计算。并且按照输入顺序计算,避免了遗漏计算某个输入间隔。
其中,根据输入顺序,计算相邻字符之间的输入间隔的具体的计算方法可以有多种。可以在获取用户输入的第一个字符时,开始计时,之后每获取到一个字符就记录一次对应的时间点,对于两个相邻字符,这两个字符各自对应的时间点之差便可以为这两个相邻字符之间的输入间隔,例如,用户输入字符串“xian”,在获取到用户输入第一个字符“x”时开始计时,此时对应的时间点为0,在获取到用户输入第二个字符“i”时对应的时间点为0.1秒,在获取到用户输入第三个字符“a”时对应的时间点为0.6秒,在获取到用户输入第四个字符“n”时对应的时间点为0.7秒,则相邻字符“x”和“i”的输入间隔为0.1秒(0.1秒减去0秒等于0.1秒),相邻字符“i”和“a”的输入间隔为0.5秒(0.6秒减去0.1秒等于0.5秒),相邻字符“a”和“n”的输入间隔为0.1秒(0.7秒减去0.6秒等于0.1秒)。
需要说明的是,上述仅是一种可选的计算输入间隔的方法,本发明实施例并不仅限于上述计算输入间隔的方法。
S103:根据所述输入间隔确定出停顿间隔。
在本发明实施例中可以根据输入间隔的长短确定出哪个或哪些输入间隔属于停顿间隔。
具体的,可以通过计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值;将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
其中,第一阈值可以用于表示相邻音节组合之间的停顿间隔,第二阈值可以用于表示同一个音节组合中,相邻字符之间的输入间隔。
一般情况下,相邻音节组合之间除了用户输入字符时正常的输入间隔之外,用户潜意识的停顿行为也会消耗一定的时间,因此,相邻音节组合之间的停顿间隔往往比相邻字符间的输入间隔的时间长,即第一阈值一般大于第二阈值。
由S102可以计算出相邻字符之间的输入间隔,对于该输入间隔是否涉及上述用户针对音节组合之间的停顿行为,需要做进一步的判定,具体的,可以通过计算输入间隔与第一阈值和第二阈值之间的接近程度,来判断输入间隔中是否涉及用户输入字符时的停顿间隔。
接近程度可以用于表示输入间隔与第一阈值和第二阈值的相关性,其中第一阈值可以用于作为识别相邻音节组合之间停顿间隔的标准,第二阈值可以用于作为识别同一个音节组合中相邻字符之间输入间隔的标准。若一个输入间隔与其中一个阈值的接近程度相对另一个阈值更高,说明这个输入间隔与这个阈值的相关性更高,那么这个输入间隔就越有可能是这个阈值所识别的间隔类型(停顿间隔或输入间隔)。例如,第一阈值为T秒,第二阈值为t秒,相邻字符之间的输入间隔为t1秒,可以依据预定好的方式计算输入间隔与第一阈值和第二阈值的接近程度,从而确定出输入间隔与第一阈值或与第二阈值t的相关性更高。
其中,计算接近程度可以有多种方式,本发明针对其中两种进行详细说明。
第一种计算接近程度的方式可以是采用差值来计算接近程度。分别计算输入间隔与第一阈值的差值和输入间隔与第二阈值的差值,差值越小则表示接近程度高。例如,第一阈值为5秒,第二阈值为1秒,输入间隔为2秒,该输入间隔与第一阈值的差值为3秒,该输入间隔与第二阈值的差值为1秒,该输入间隔与第二阈值的差值比与第一阈值的差值小,则表示该输入间隔与第二阈值的接近程度较高,即该输入间隔与第二阈值的相关性更高,更有可能是一个输入间隔,而不是一个停顿间隔。
第二种计算接近程度的方式可以是采用阈值范围的方式计算接近程度,以计算输入间隔更接近或属于哪个阈值范围,则说明输入间隔更可能是该阈值范围对应的阈值所识别的间隔类型,例如,第一阈值为5秒,将2秒-8秒(包括2秒,不包括8秒)作为第一阈值的阈值范围,第二阈值为1秒,将0秒-2秒(包括0秒,不包括2秒)作为第二阈值的阈值范围,输入间隔为2秒,属于第一阈值的阈值范围,则说明输入间隔与第一阈值的相关性更高,更有可能是一个停顿间隔,而不是一个输入间隔。
需要说明的是,本发明实施例对接近程度的计算方式并不做限定。
计算输入间隔与第一阈值和第二阈值之间的接近程度后,可以将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
当输入间隔与第一阈值的接近程度相对于与第二阈值的接近程度更高时,由于第一阈值可以用于表示相邻音节组合之间的停顿间隔,因此,可以将该输入间隔作为停顿间隔,可以理解为停顿间隔是输入间隔的一种特殊形式,例如,用户输入字符所组成的字符串“xian”,字符“i”和字符“a”之间的输入间隔更接近第一阈值T,则可以将该输入间隔作为停顿间隔。由于停顿间隔可以用于标识音节组合的结束,即若在两个字符之间出现停顿间隔,则说明这两个字符可能属于不同的音节组合。
当输入间隔与第二阈值更接近时,说明该输入间隔属于相邻字符间的输入间隔,即该输入间隔所对应的两个相邻的字符更可能是属于同一个音节组合的字符。
S104:根据所述停顿间隔对输入字符所组成的字符串划分音节组合。
例如,用户输入字符所组成的字符串“xian”,若字符“i”和字符“a”之间具有停顿间隔,则可以依据该停顿间隔将字符串“xian”划分为“xi”和“an”两个音节组合。
S105:根据所述音节组合展示所述字符串对应的候选词。
在用户输入字符时,构成的字符串对应的候选词有一个或多个,在向用户展示候选词时,可以将用户实际可能输入的音节组合所对应的候选词进行优先展示,例如展示在候选词列表的第一页,使得用户优先看到实际想输入候选词的可能性更高,增加用户的输入体验,优先展示的候选词可以直接选取,进一步提升了用户的输入效率。因此,在展示候选词之前需要考虑每个候选词的展示位置。
考虑到由停顿间隔划分的音节组合可能更符合用户的实际输入需求,可以将该音节组合所对应的候选词优先展示,例如,可以将由停顿间隔划分的音节组合所对应的至少一个候选词展示在所述字符串的优先展示位置。
在进行候选词的展示时,可以将由停顿间隔划分的音节组合所对应的一个候选词放在第一个位置,其余候选词按照另一种音节组合的方式展示,例如,用户输入字符所组成的字符串“xian”,由停顿间隔将字符串划分为“xi”和“an”两个音节组合,该字符串对应的另一种音节组合可以是“xian”,在候选词展示时,可以将“xi”和“an”对应的一个候选词“西安”放在第一个位置,将“xian”对应的候选词“先”、“现”、“线”、“闲”依次放在后续位置展示。
在进行候选词的展示时,也可以将由停顿间隔划分的音节组合所对应的多个候选词均放在优先展示的位置,例如,用户通过按键依次输入“54264”,传统方式下,其对应的音节组合可以包括“jiang”、“liang”、“jia”和“mi”、“ji”和“ang”等,采用本发明实施例提供的方法,根据输入间隔的长短可以确定出停顿间隔,如由停顿间隔划分的音节组合为“jia”和“mi”,在候选词展示时,可以将“jia”和“mi”对应的多个候选词“加密”、“加米”、“甲米”、“甲醚”依次放在第一个位置、第二个位置、第三个位置和第四个位置展示。
还可以采用将由停顿间隔划分的音节组合所对应的候选词与其它一种音节组合方式所对应的候选词循环的方式展示,例如,用户通过按键依次输入“54264”,传统方式下,其对应的音节组合可以包括“jiang”、“liang”、“jia”和“mi”、“ji”和“ang”等多种音节组合方式,采用本发明实施例提供的方法,根据输入间隔的长短可以确定出停顿间隔,如由停顿间隔划分的音节组合为“jia”和“mi”,在候选词展示时,可以将“jia”和“mi”对应的一个候选词“加密”放在第一个位置,将另一种音节组合“jiang”对应的候选词“将”放在第二个位置,再将“jia”和“mi”对应的一个候选词“加米”放在第三个位置,将“jiang”对应的一个候选词“讲”放在第四个位置,依次循环放置候选词。
需要说明的是,候选词展示的方式可以有多种,在此不做限定。
通过上述实施例可以看出,在获取用户输入字符时,计算该用户在输入时,两个相邻输入字符的输入间隔,并根据所述输入间隔确定出停顿间隔,也就是用户在输完一个音节组合后可能停顿的时刻。根据停顿间隔来划分由用户输入字符组成的字符串时,所得到的音节组合可以更贴近用户的实际输入需求,使得根据这种划分方式得到的音节组合来展示该字符串对应的候选词时,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。
在S103中的第一阈值和第二阈值可以是预先设置好的两个阈值,可以依据于用户的历史输入字符串来确定。由于一个用户的历史输入数据可以直观的反应这个用户的个人输入习惯,例如一个音节组合中各个字符的输入速度,在输入相邻音节组合时可能停顿的时间等。如果采用一个用户的历史输入数据作为计算针对这个用户的第一阈值和第二阈值的依据,那么计算出的第一阈值和第二阈值可以符合这个用户的个人输入习惯,例如有些用户输入相邻音节组合之间的间隔较长,有些就较短。
相对于使用通用型(针对各个用户)的第一阈值和第二阈值进行输入间隔判断,以这种根据用户历史输入数据得出的第一阈值和第二阈值,针对这个用户输入间隔进行判断所判断出的停顿间隔将更为准确。
故此,本发明实施例提出了使用用户历史输入数据来确定第一阈值和第二阈值的方式,所述第一阈值可以是通过所述用户在历史输入字符串中相邻音节组合之间的停顿间隔所确定的,所述第二阈值可以是通过所述用户在历史输入字符串中相邻字符之间的输入间隔所确定的。
对于上述历史输入字符串,已经确定了用户选取的汉字,该汉字对应的音节组合是已知的,相邻字符之间的停顿时间也是已知的,依据该音节组合可以确定出用户输入的字符串中,哪些相邻字符是分属不同音节组合,哪些相邻字符是属于同一个音节组合,因此,由分属不同音节组合的字符之间的停顿时间可以确定出相邻音节组合之间的停顿间隔,由该停顿间隔可以确定出第一阈值;由属于同一个音节组合的字符之间的停顿时间可以确定出相邻字符之间的输入间隔,由该输入间隔可以确定出第二阈值。
依据于用户的历史输入字符串来确定第一阈值和第二阈值,可以更加准确的判断用户输入字符时可能停顿的时刻,从而使得划分的音节组合更加符合用户的实际输入需求。
考虑到用户在使用输入法的过程中,其输入习惯会随着时间的推移发生变化,例如,用户使用输入法越熟练,则输入字符时,字符间的输入间隔以及音节组合间的停顿间隔可能会越来越短,有些情况下,字符间的输入间隔会变短,而音节组合间的停顿间隔会变长。也就是说,即使使用用户历史输入数据来确定第一阈值和第二阈值,但是若不考虑到该用户个人输入习惯的变化,那么将会影响判断停顿间隔的准确性。
因此,为了有效适应用户的个人输入习惯的变化。在上述实施例中,第一阈值和第二阈值可以不是固定不变的数值,而可以依据用户的输入习惯随之改变。
具体的,第一阈值和第二阈值可以依据用户在历史输入字符串确定,其中,所述历史输入字符串包括距离执行所述获取用户输入的字符的步骤之前最近的,由所述用户输入的至少一个字符串。
其中该历史输入字符串,可以是在获取用户输入的字符之前,在规定时间内用户的历史输入字符。用户的历史输入数据越新,越能够体现该用户的当前输入习惯。例如,在获取用户输入的字符之前的1小时内,用户输入的字符串作为历史输入字符。由此可知,可以将用户的历史输入字符串进行更新,从而可以根据用户的历史输入字符串的更新而动态调整所述第一阈值和所述第二阈值。
采用最近的用户输入的至少一个字符串,作为历史输入字符串,可以依据于用户的输入习惯,不断更新第一阈值和第二阈值,从而使得划分的音节组合更加准确,进一步提升了音节组合划分的准确性,从而使展示的候选词更加符合用户的实际需求,提高用户的输入体验。
在S106中由停顿间隔划分的音节组合展示字符串对应的候选词,考虑到实际应用中,可能会存在由停顿间隔划分的音节组合并不具有对应的候选词的情况,例如,用户输入字符串“xian”,根据停顿间隔将字符串“xian”划分为“x”和“ian”两个音节组合,而音节组合“ian”并没有对应的候选词。因此,在执行S106之前,可以对S105中划分的音节组合是否具有对应的候选词进行判断。
具体的,可以在所述根据划分的音节组合展示所述字符串对应的候选词之前,判断划分的音节组合是否具有对应的候选词。若具有,执行所述根据划分的音节组合展示所述字符串对应的候选词的步骤。若不具有,根据所述字符串的字符组成对所述字符串划分音节组合。根据由所述字符组成划分的音节组合展示所述字符串对应的候选词。
其中,划分的音节组合不具有对应的候选词的原因可能是用户在输入字符时,由于休息或者外界干扰等因素导致相邻字符之间的输入间隔的时间较长,使得该输入间隔可能更接近于第一阈值,从而导致智能终端将该时间间隔作为停顿间隔,以此划分音节组合,而该停顿间隔并非相邻音节组合之间的停顿间隔,从而导致划分的音节组合没有对应的候选词。通过增加上述判断步骤,在划分的音节组合没有对应的候选词的情况下,可以通过传统的方式进行候选词的展示,进一步完善了候选词展示的方法。
在本发明实施例中,或者可以通过对用户输入的字符之间的输入间隔进行统计,当统计出的输入间隔属于离散分布,这种输入间隔明显不符合用户平时的输入习惯,也即当输入间隔属于离散分布时,这些输入间隔并不能很好的体现出用户的实际输入需求,对于这种情况可以采用传统的方式进行候选词的展示。
图2为本发明实施例提供的一种候选词展示装置的装置结构图,所述装置包括获取单元11、计算单元12、确定单元13、划分单元14和展示单元15:
所述获取单元11,用于获取用户输入的字符。
所述计算单元12,用于根据输入顺序,计算相邻字符之间的输入间隔。
所述确定单元13,用于根据所述输入间隔确定出停顿间隔。
所述划分单元14,用于根据所述停顿间隔对输入字符所组成的字符串划分音节组合。
所述展示单元15,用于根据所述音节组合展示所述字符串对应的候选词。
可选的,所述确定单元13具体包括计算子单元和标识子单元:
所述计算子单元,用于计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值。
所述标识子单元,用于将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
可选的,所述第一阈值是通过所述用户在历史输入字符串中相邻音节组合之间的停顿间隔所确定的,所述第二阈值是通过所述用户在历史输入字符串中相邻字符之间的输入间隔所确定的。
可选的,所述历史输入字符串包括距离执行所述获取用户输入的字符的步骤之前最近的,由所述用户输入的至少一个字符串。
可选的,还包括调整单元:
所述调整单元,用于根据所述用户的历史输入字符串的更新而动态调整所述第一阈值和所述第二阈值。
可选的,所述装置还包括判断单元和执行单元:
所述判断单元,用于判断划分的音节组合是否具有对应的候选词。
若划分的音节组合具有对应的候选词,所述执行单元用于执行所述根据划分的音节组合展示所述字符串对应的候选词的步骤。
若划分的音节组合不具有对应的候选词,所述执行单元用于根据所述字符串的字符组成对所述字符串划分音节组合;根据由所述字符组成划分的音节组合展示所述字符串对应的候选词。
可选的,所述展示单元15具体用于将由停顿间隔划分的音节组合所对应的至少一个候选词展示在所述字符串的优先展示位置。
上述单元的具体说明可以参见图1所对应实施例中的相关描述,这里不再赘述。
通过上述实施例可以看出,在获取用户输入字符时,计算该用户在输入时,两个相邻输入字符的输入间隔,并根据所述输入间隔确定出停顿间隔,也就是用户在输完一个音节组合后可能停顿的时刻。根据停顿间隔来划分由用户输入字符组成的字符串时,所得到的音节组合可以更贴近用户的实际输入需求,使得根据这种划分方式得到的音节组合来展示该字符串对应的候选词时,符合用户实际输入需求的候选词可以更容易被用户看到,从而提高了用户的输入体验。
图3是根据一示例性实施例示出的一种用于候选词展示的装置300的框图。例如,该装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理部件302可以包括多媒体模块,以方便多媒体组件303和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在装置300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当装置300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到装置300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种候选词展示方法,所述方法包括:
获取用户输入的字符;
根据输入顺序,计算相邻字符之间的输入间隔;
根据所述输入间隔确定出停顿间隔;
根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
根据所述音节组合展示所述字符串对应的候选词。
图4是根据一示例性实施例示出的一种用于候选词展示的服务器400的框图。该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。
服务器400还可以包括一个或一个以上电源424,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,一个或一个以上键盘454,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种候选词展示方法,其特征在于,所述方法包括:
获取用户输入的字符;
根据输入顺序,计算相邻字符之间的输入间隔;
根据所述输入间隔确定出停顿间隔;
根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
根据所述音节组合展示所述字符串对应的候选词。
2.根据权利要求1所述的方法,其特征在于,所述根据所述输入间隔确定出停顿间隔,包括:
计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值;
将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
3.根据权利要求2所述的方法,其特征在于,所述第一阈值是通过所述用户在历史输入字符串中相邻音节组合之间的停顿间隔所确定的,所述第二阈值是通过所述用户在历史输入字符串中相邻字符之间的输入间隔所确定的。
4.根据权利要求3所述的方法,其特征在于,所述历史输入字符串包括距离执行所述获取用户输入的字符的步骤之前最近的,由所述用户输入的至少一个字符串。
5.根据权利要求2或3所述的方法,其特征在于,还包括:
根据所述用户的历史输入字符串的更新而动态调整所述第一阈值和所述第二阈值。
6.根据权利要求1所述的方法,其特征在于,在所述根据划分的音节组合展示所述字符串对应的候选词之前,还包括:
判断划分的音节组合是否具有对应的候选词;
若具有,执行所述根据划分的音节组合展示所述字符串对应的候选词的步骤;
若不具有,根据所述字符串的字符组成对所述字符串划分音节组合;
根据由所述字符组成划分的音节组合展示所述字符串对应的候选词。
7.根据权利要求1所述的方法,其特征在于,所述根据由停顿间隔划分的音节组合展示所述字符串对应的候选词,包括:
将由停顿间隔划分的音节组合所对应的至少一个候选词展示在所述字符串的优先展示位置。
8.一种候选词展示装置,其特征在于,所述装置包括获取单元、计算单元、确定单元、划分单元和展示单元:
所述获取单元,用于获取用户输入的字符;
所述计算单元,用于根据输入顺序,计算相邻字符之间的输入间隔;
所述确定单元,用于根据所述输入间隔确定出停顿间隔;
所述划分单元,用于根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
所述展示单元,用于根据所述音节组合展示所述字符串对应的候选词。
9.根据权利要求8所述的装置,其特征在于,所述确定单元具体包括计算子单元和标识子单元:
所述计算子单元,用于计算输入间隔与第一阈值和第二阈值之间的接近程度,所述第一阈值大于所述第二阈值;
所述标识子单元,用于将更接近所述第一阈值的输入间隔作为用于标识音节组合结束的停顿间隔。
10.一种用于候选词展示的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的字符;
根据输入顺序,计算相邻字符之间的输入间隔;
根据所述输入间隔确定出停顿间隔;
根据所述停顿间隔对输入字符所组成的字符串划分音节组合;
根据所述音节组合展示所述字符串对应的候选词。
CN201611227858.7A 2016-12-27 2016-12-27 一种候选词展示方法和装置 Active CN108241440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611227858.7A CN108241440B (zh) 2016-12-27 2016-12-27 一种候选词展示方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611227858.7A CN108241440B (zh) 2016-12-27 2016-12-27 一种候选词展示方法和装置

Publications (2)

Publication Number Publication Date
CN108241440A true CN108241440A (zh) 2018-07-03
CN108241440B CN108241440B (zh) 2023-02-17

Family

ID=62702570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611227858.7A Active CN108241440B (zh) 2016-12-27 2016-12-27 一种候选词展示方法和装置

Country Status (1)

Country Link
CN (1) CN108241440B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071342A (zh) * 2007-06-01 2007-11-14 腾讯科技(深圳)有限公司 在输入法中提供候选整句的方法及文字输入系统
CN101382844A (zh) * 2008-10-24 2009-03-11 上海埃帕信息科技有限公司 一种输入间隔分词的方法
US20100250251A1 (en) * 2009-03-30 2010-09-30 Microsoft Corporation Adaptation for statistical language model
CN102236422A (zh) * 2010-04-27 2011-11-09 北京搜狗科技发展有限公司 一种以笔画码进行输入的方法及一种输入法系统
CN102566775A (zh) * 2010-12-31 2012-07-11 上海量明科技发展有限公司 产生字符间隔的输入方法及系统
CN103984421A (zh) * 2014-04-23 2014-08-13 北京百文宝科技股份有限公司 基于按键节奏信息的输入方法和输入系统
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071342A (zh) * 2007-06-01 2007-11-14 腾讯科技(深圳)有限公司 在输入法中提供候选整句的方法及文字输入系统
CN101382844A (zh) * 2008-10-24 2009-03-11 上海埃帕信息科技有限公司 一种输入间隔分词的方法
US20100250251A1 (en) * 2009-03-30 2010-09-30 Microsoft Corporation Adaptation for statistical language model
CN102236422A (zh) * 2010-04-27 2011-11-09 北京搜狗科技发展有限公司 一种以笔画码进行输入的方法及一种输入法系统
CN102566775A (zh) * 2010-12-31 2012-07-11 上海量明科技发展有限公司 产生字符间隔的输入方法及系统
CN103984421A (zh) * 2014-04-23 2014-08-13 北京百文宝科技股份有限公司 基于按键节奏信息的输入方法和输入系统
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统

Also Published As

Publication number Publication date
CN108241440B (zh) 2023-02-17

Similar Documents

Publication Publication Date Title
WO2021051650A1 (zh) 人脸和人手关联检测方法及装置、电子设备和存储介质
CN104219388B (zh) 语音控制方法和装置
RU2640733C2 (ru) Способ и устройство для управления приложением
CN105607805B (zh) 应用图标的角标处理方法及装置
RU2644130C2 (ru) Способ и устройство ввода текста
US20160210034A1 (en) Method and apparatus for switching display mode
CN104731688B (zh) 提示阅读进度的方法及装置
CN103995666B (zh) 一种设置工作模式的方法和装置
CN106202150B (zh) 信息显示方法及装置
CN105045467A (zh) 任务管理器界面的显示方法和装置
CN106484138B (zh) 一种输入方法及装置
CN106791921A (zh) 视频直播的处理方法及装置
CN108038102A (zh) 表情图像的推荐方法、装置、终端及存储介质
CN109799916A (zh) 一种候选项联想方法和装置
CN106802808A (zh) 悬浮按钮控制方法及装置
CN108803892A (zh) 一种在输入法中调用第三方应用程序的方法和装置
CN106844717A (zh) 网页搜索显示方法及装置
CN106775210A (zh) 壁纸更换的方法和装置
CN111596832B (zh) 一种页面切换方法及装置
CN108073291B (zh) 一种输入方法和装置、一种用于输入的装置
CN113936697A (zh) 语音处理方法、装置以及用于语音处理的装置
CN106919302A (zh) 移动终端的操作控制方法及装置
CN104216617A (zh) 光标位置确定方法和装置
CN105094891B (zh) 效果显示方法及装置
CN109002386A (zh) 用户活跃时间记录方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant