CN111665955A

CN111665955A - 候选字符串的处理方法、装置、电子设备及存储介质

Info

Publication number: CN111665955A
Application number: CN202010304901.5A
Authority: CN
Inventors: 王鑫; 李旭; 孙明明; 李平
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-04-17
Filing date: 2020-04-17
Publication date: 2020-09-15
Anticipated expiration: 2040-04-17
Also published as: CN111665955B

Abstract

本申请公开了一种候选字符串的处理方法、装置、电子设备及存储介质，涉及人工智能领域。具体实现方案为：采集用户输入的坐标序列；基于所述坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。另外，本申请还提供一种候选字符串预测模型的训练方法，包括：采集数条训练数据；各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列；采用各条所述训练数据，对所述候选字符串预测模型进行训练。采用本申请训练的候选字符串预测模型，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。

Description

候选字符串的处理方法、装置、电子设备及存储介质

技术领域

本申请涉及计算机技术，尤其涉及人工智能，具体涉及一种候选字符串的处理方法、装置、电子设备及存储介质。

背景技术

移动设备(例如智能手机，平板电脑)在日常生活中扮演着非常重要的角色，越来越多的互联网活动通过移动设备进行。并且在众多的互联网活动中，最为主要的沟通方式便是通过移动设备的输入法进行文字输入。由于移动设备体积的限制，使得移动设备显示屏幕较小，位于屏幕软键盘上的字符区域也较小，因此用户在输入过程中非常容易触到字符区域之外，产生输入错误，用户不得不进行删除以及重新输入。

例如，为了提高输入效率，现有的输入法可以根据用户的输入信息，获取与输入信息的拼写相似或者意思相似的词语，作为候选字符串，向用户推荐。

但是，按照上述方式获取的候选字符串很难预测到用户的真正意图，预测的候选字符串的准确性较差。

发明内容

为了解决上述技术问题，本申请提供了一种用于候选字符串的处理方法、装置、电子设备及存储介质。

根据第一方面，提供了一种输入法中的候选字符串的处理方法，其包括：

采集用户输入的坐标序列；

基于所述坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。

根据第二方面，提供了一种候选字符串预测模型的训练方法，所述方法包括：

采集数条训练数据；各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列；

采用各条所述训练数据，对所述候选字符串预测模型进行训练。

根据第三方面，提供了一种输入法中的候选字符串处理装置，包括：

采集模块，用于采集用户输入的坐标序列；

预测模块，用于基于所述坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。

根据第四方面，提供了一种候选字符串预测模型的训练装置，所述装置包括：

采集模块，用于采集数条训练数据；各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列；

训练模块，用于采用各条所述训练数据，对所述候选字符串预测模型进行训练。

根据第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的方法。

根据第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如上所述的方法。

根据本申请的技术解决了现有的候选字符串预测准确性差的的问题，通过采集用户输入的坐标序列；基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。由于该预先训练的候选字符串预测模型为端到端的模型，该候选字符串预测模型在预测候选字符串时不会累计误差，能够有效地提高预测的准确性。因此，本申请的技术方案，基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本申请实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

进一步地，本申请，通过采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；采用各条训练数据，对候选字符串预测模型进行训练，可以使得训练的候选字符串预测模型为一个端到端的预测模型，在输入坐标序列时，可以直接预测对应的候选字符串；而且能够有效地保证预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的示意图；

图2是根据本申请第二实施例的示意图；

图3是根据本申请第三实施例的示意图；

图4是根据本申请第四实施例的示意图；

图5是根据本申请第五实施例的示意图；

图6是根据本申请第六实施例的示意图；

图7是根据本申请第七实施例的示意图；

图8是根据本申请第八实施例的示意图；

图9是根据本申请第九实施例的示意图；

图10是用来实现本申请实施例的上述方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请第一实施例的示意图；如图1所示，本实施例提供一种输入法中的候选字符串的处理方法，具体可以包括如下步骤：

S101、采集用户输入的坐标序列；

S102、基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。

本实施例的输入法中的候选字符串的处理方法的执行主体为输入法中的候选字符串处理装置，该装置可以设置在输入法中，为输入法筛选候选字符串即候选字符串。

具体地，用户在使用输入法输入字符串时，通常可以打开输入法的软键盘，根据软键盘中标识的字符，点击相应位置，用于实现该位置字符的输入。即在用户一侧，用户点击的是位置。而在输入法一侧，通过建立坐标系，检测软键盘中被点击的坐标位置对应哪个字符，从而确定用户该次点击想要输入哪个字符。基于此原理，输入法中的候选字符串处理装置可以采集到用户在输入字符串时，输入的每个字符的坐标，进而可以采集到用户输入的包括先后输入的多个坐标的坐标序列。即该坐标序列中各坐标可以按照被用户输入时点击的先后顺序排列。本实施例中，用户想要输入的字符串中可以包括两个或者两个以上的多个字符。对应地，该坐标序列中可以包括两个或者多个坐标。本实施例的坐标为二维坐标。

本实施例中，预先训练的候选字符串预测模型可以为一个端到端的模型，使用时，直接将坐标序列输入至该候选字符串预测模型中，该候选字符串预测模型可以基于该坐标序列，预测至少一个候选字符串。由于用户想要输入字符串时，可能会存在点击字符的位置错误，用户对想要输入字符串拼写错误以及输入时字符顺序错误等等，所以，本实施例的候选字符串预测模型可以基于用户输入的坐标序列，预测一个、两个或者多个候选字符串，以供用户从中选择想要输入的字符串。

而由上述实施例可知，本实施例的候选字符串预测模型为预先经过深度学习的端到端的候选字符串预测模型，属于一种深度学习模型。该端到端的候选字符串预测模型在训练时为一个整体，其包括的所有模块一起训练的。在使用时，该候选字符串预测模型中的某个模块不会单独输出结果，整个候选字符串预测模型根据输入只输出一个最终的结果，即一个问题采用一个步骤便可以解决。例如，向该端到端的候选字符串预测模型输入原始字符串的坐标序列，该端到端的候选字符串预测模型可以直接输出至少一个候选字符串。本实施例的候选字符串预测模型，由于采用端到端的实现方式，不会引入累计误差，进而能够有效地提高候选字符串预测的准确性，进而能够提高输入法的输入效率。

本实施例的输入法中的候选字符串的处理方法，通过采集用户输入的坐标序列；基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。本实施例中的预先训练的候选字符串预测模型为端到端的模型，该候选字符串预测模型在预测候选字符串时不会累计误差，能够有效地提高预测的准确性。因此，本实施例的技术方案，基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

图2是根据本申请第二实施例的示意图；如图2所示，本实施例提供一种输入法中的候选字符串的处理方法，在上述图1所示实施例的技术方案的基础上，进一步更加详细地介绍本申请的技术方案。具体可以包括如下步骤：

S201、采集用户输入的坐标序列；

该坐标序列中包括用户想要输入的字符串中各字符的二维坐标，即该坐标序列中包括两个以上的二维坐标。

S202、对坐标序列中各坐标进行归一化处理，得到归一化后的坐标序列；

实际应用中，对于不同移动设备，其屏幕大小不同，横竖屏差别也使得坐标系不统一。例如，本实施例中，可以利用移动设备的软键盘的矩形坐标系作为归一化分母，将用户的按键坐标转化为[0,1]区间上的浮点数，从而实现对用户输入的坐标序列中的各坐标进行归一化处理，得到归一化后的坐标序列。

通过采用该步骤进行归一化处理，可以使得通过所有移动设备输入时，其坐标序列中的坐标均能够落入候选字符串预测模型能够处理的范围内，而不用个性化处理，增强候选字符串的预测过程的便利性，而且还能够有效地提高候选字符串的预测的准确性。

S203、采用候选字符串预测模型中的编码器，基于归一化后的坐标序列进行编码处理，获取到坐标序列的特征表达；

S204、采用候选字符串预测模型中的解码器，基于坐标序列的特征表达进行解码，获取至少一个候选字符串、以及各候选字符串的概率；

本实施例的候选字符串预测模型包括编码器和解码器两大部分。本实施例中，剖开了候选字符串预测模型，侵入到候选字符串预测模型内，能够与编码器以及解码器交互，获取相应的处理结果为例，来描述至少一个候选字符串的预测过程。本实施例的编码器和解码器均由神经网络构成。

例如，该步骤S203具体可以指的是：采用候选字符串预测模型中的编码器基于归一化后的坐标序列进行编码处理，得到坐标序列的特征表达，然后获取编码器的编码结果，即该坐标序列的特征表达。具体实现时，具体可以包括如下步骤：

(a1)采用编码器，对坐标序列中的各坐标进行映射表达，得到各坐标的特征表达；

由于神经网络的输入往往为高维向量，且高维向量比起低维度向量(如二维坐标表示)具有更强的表达能力。该步骤对坐标序列中的各坐标进行映射表达，即用于将用户输入的二维坐标转化为高维度向量，实现高维映射，得到各坐标的更强能力的特征表达。

(b1)采用编码器，基于各坐标的特征表达进行编码处理，获取到坐标序列的特征表达。

基于坐标序列中各坐标的特征表达，将各坐标的特征表达一起进行编码处理，可以得到该坐标序列的特征表达。具体编码处理的实现方式可以采用各种结构来实现，包括但不限于循环神经网络(Recurrent NeuralNetwork；RNN)、长短期记忆(Long Short-TermMemory；LSTM)网络、门控循环单元(Gated Recurrent Unit；GRU)网络等等。

此处需要说明的是，若本实施例中未包括步骤S202时，也可以在该编码器内进行坐标的归一化处理，例如，此时对应地，在该步骤(a1)采用编码器，对坐标序列中的各坐标进行映射表达，得到各坐标的特征表达之前，还可以还包括：采用编码器，对坐标序列中各坐标进行归一化处理，得到归一化后的坐标序列。其归一化处理的方式与上述步骤S202相同，在此不再赘述。

进一步可选地，上述实施例中的步骤S204采用候选字符串预测模型中的解码器，基于坐标序列的特征表达进行解码，获取至少一个候选字符串，在实现时，具体可以包括如下步骤：

(a2)采用解码器，以坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；

具体地，第一层的解码可以将坐标序列的特征表达与起始符的特征表达进行运算，并参考候选字符结合中各字符的特征表达，进而获取到各字符的解码概率。其中具体的运算方式由所采用的网络结构决定，不同的网络结构对应不同的运算方式。另外，本实施例的候选字符集合中可以包括a-z共26个英文字母以及结束符，共27个字符。在解码时，可以得到27个字符的解码概率。

(b2)从候选字符集合中搜索解码概率最大的N个字符；

在解码过程中，该N可以根据实际需求来设置，例如可以为2、3或者其他数值，在此不做限定。

(c2)检测解码概率最大的N个字符中是否包括结束符，若包括，将结束符之前的所有解码字符按解码顺序构成候选字符串；否则，若未包括，执行步骤(d2)；

(d2)判断解码得到的字符串长度是否达到预设阈值，若达到，停止解码，将之前的所有解码字符按解码顺序构成候选字符串，结束，否则执行步骤(e2)；

(e2)对N个字符中各字符进行特征映射，得到相应的特征表达；

(f2)对于N个字符中各字符，采用字符的特征表达，更新隐含层状态；

(g2)并基于更新后的隐含层状态，继续解码，再次获取候选字符集合中各字符成为解码字符的解码概率；返回步骤(b2)。

在实际应用中，用户输入的字符串通常包括两个以上，所以在仅进行过一层解码，可以不进行步骤(c2)和(d2)的判断。

本实施例的解码原理为：以初始隐含层状态和起始符进行第一层解码时，可以得到概率最大的N个字符。此时对于每个字符，可以按照步骤(e2)、(f2)和(g2)进行第二层的解码，并根据步骤(b2)获取到概率最大的N个字符。对于第一层解码得到的N个字符，每个字符均需要进行第二层的解码，得到一个概率最大的字符，这样第一层解码得到的字符和第二层解码得到的字符拼起来就是候选字符串中的部分或者整体。由于第一层得到了概率最大的N个字符，第二层中需要基于第一层解码得到的N个字符共进行N次解码。以此类推，可以继续进行第三层甚至第四层等等的解码，直到根据步骤(c2)，解码到结束符，该结束符之前的各层解码的字符按照解码顺序拼接起来就是一个候选字符串。而若未解码到结束符，可以根据步骤(d2)判断本次解码完后，解码得到的字符串长度是否达到预设阈值，若达到，将之前的所有解码字符按解码顺序构成候选字符串。

基于以上所述，本实施例的解码过程的实施也可以采用概率生成单元、字符向量映射单元和柱状搜索单元来实现。

例如概率生成单元的结构为RNN，该网络以编码器的结果即坐标序列的特征表达为初始隐含层状态，输入开始符号后，开始解码过程，每次解码，均根据输入和隐含层状态进行运算，并求得在可能的候选字符集合的各字符上的解码概率。比如，求得当前步骤，生成字符a到字符z外加结束符号(EOS)的概率分布。其结果由“柱状搜索单元”处理。

柱状搜索单元用于对概率生成单元生成的概率分布进行排序，取概率最大的前N个结果。

字符向量映射单元用于负责将字符a-z转化为向量表示。该模块由可训练“字符-向量”映射表组成，训练时各向量可根据需要通过梯度下降方法进行学习和更新。对于每次解码得到概率最大的字符时，可以基于该字符向量映射单元获取相应字符的向量，并返回给概率生成单元，以供概率生成单元基于该字符的向量，更新隐含层状态，以进行下一步的解码。

基于以上所述，概率生成单元、字符向量映射单元和柱状搜索单元基于各自的功能，相互配合，可以实现上述实施例中的步骤(a2)—(g2)。

另外，本实施例中，还可以采用候选字符串预测模型中的解码器，基于坐标序列的特征表达进行解码，获取各候选字符串的概率。具体地，参考上述解码过程，可以得知，在得到各候选字符串的过程中，能够解码得到候选字符串中各字符的解码概率，然后将候选字符串中各字符的解码概率相乘可以作为该候选字符串的概率。或者也可以基于各字符的解码概率，采用其他的数学运算，得到相应候选字符串的概率。

S205、按照概率由大到小的顺序，向所述用户推荐至少一个候选字符串。

通过该推荐方式，可以使得概率最大的候选字符串可以最先被用户看到，由于概率最大的候选字符串最后可能是用户想要输入的候选字符串，从而能够有效地提高用户的使用体验度。

本实施例的输入法中的候选字符串的处理方法，采用编码器和解码器构成的端到端的候选字符串预测模型，基于用户输入的坐标序列来预测至少一个候选字符串，实现过程较为简单，且不会引入累计误差，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

图3为是根据本申请第三实施例的示意图；如图3所示，介绍了本实施例的候选字符串预测模型的工作原理。

如图3所示，在编码器侧，接收采集到的用户输入的坐标序列中包括g的坐标、i的坐标以及结束符。且根据软键盘的布局，可以得知，键盘中g靠近h，i靠近o。

基于上述图2所示实施例所示，可以得知，在编码器侧可以先对坐标序列中各坐标进行归一化，然后进行映射即二维到高维的映射，再接着采用GRU进行编码处理，得到坐标序列的特征表达。

然后，在解码器侧，解码器可以坐标序列的特征表达开始解码，具体地，解码器可以采用概率生成单元、字符向量映射单元和柱状搜索单元一起进行解码，如图3所示，第一层解码得到g和h的概率最大。然后分别以g和h为基础，按照上述图2所示实施例的解码方式，进行第二层的解码，例如，g后的解码可以得到o和i。h之后的解码可以得到i。以此类推，go之后的解码可以得到结束符#和t，got之后解码又可以得到结束符#，gi之后的解码可以得到结束符#。hi解码之后可以得到结束符#。

基于以上解码得到的各解码字符的解码概率，可以计算得到各候选字符串的概率，如go的概率为0.71，got的概率为0.05，gi的概率为0.23，hi的概率为0.01。

而且，如图3所示，解码器在解码过程中，通过柱状搜索单元发现概率最大字符为g，其次大的字符为h时，并不立即判断其结果为g，而是同时对g和h都进行下一步解码，若用户的下一步输入为“i”则可能“hi”的联合概率大于“gi”的联合概率，从而模型的预测结果为“hi”。总之，柱状搜索能够扩大搜索范围，可以考虑上下文多个字符进行解码，具有更高的准确性。

图4为是根据本申请第四实施例的示意图；如图4所示，本实施例提供一种候选字符串预测模型的训练方法，具体可以包括如下步骤：

S401、采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；

S402、采用各条训练数据，对候选字符串预测模型进行训练。

本实施例的候选字符串预测模型的训练方法的执行主体为候选字符串预测模型的训练装置，该装置可以为一实体的电子装置；也可以采用软件集成，使用时可以运行在计算机设备上，以对候选字符串预测模型进行训练。

本实施例中采集的训练数据中的每一条训练数据中都包括训练字符串、以及用户想要输入该训练字符串可能输入的训练坐标序列。为了丰富训练坐标序列，本实施例中，可以参考输入法中各种可能出错的应用场景，如输入时错点了邻近键盘、输入时输错了字符的次序或者拼写错误等等，来构建坐标序列。这样，可以丰富训练数据的类型，使得该候选字符串预测模型同时还具有很强的纠错能力，能够基于坐标序列，准确预测候选字符串。

需要说明的是，为了提高候选字符串预测模型的准确性，所有的训练数据中训练坐标序列为正确的训练数据、与训练坐标序列为错误的训练数据的比例要大于1，例如可以为10：1、20：1或者其他比例。例如，训练坐标序列为错误的，可以指的是，用户想要输入训练字符串hi，但是误输入的训练坐标序列为gi的坐标序列；或者用户想要输入训练字符串people，但是误输入的训练坐标序列为people的坐标序列等等。

另外，可选地，本实施例中，各条训练数据中可以不标注概率分布。但是训练字符串的各字符为其本身的概率为1，对应的该字符为其他字符的概率为0，基于该原理，可以得到训练字符串中各字符的概率分布。例如字符a的已知概率分布可以表示为【1,0,……0】，该概率分布为27维，分别表示a-z共26个英文字符和结束符，上述a的概率分布即表示仅在字符a对应位置概率为1，其余字符位置概率为0。当然，可选地，也可以在各条训练数据中标注各字符的概率分布。

本实施例的候选字符串预测模型的训练方法，通过采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；采用各条训练数据，对候选字符串预测模型进行训练，可以使得训练的候选字符串预测模型为一个端到端的预测模型，在输入坐标序列时，可以直接预测对应的候选字符串；而且能够有效地保证预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。

图5为是根据本申请第五实施例的示意图；如图5所示，本实施例提供一种候选字符串预测模型的训练方法，在上述图4所示实施例的技术方案的基础上，进一步更加详细地描述本申请的技术方案。具体可以包括如下步骤：

S501、采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；

S502、对于各条训练数据，基于训练数据中的训练坐标序列以及候选字符串预测模型，生成预测字符串的各预测字符的预测概率分布；

本实施例的候选字符串预测模型的训练过程，与上述图2所示实施例的基于候选字符串预测模型预测候选字符串的过程相似，区别仅在于此处在预测时，不用等到生成整个预测字符串时，才进行网络结构的参数的调整。而在预测到每个预测字符时，都需要进行监控，及时调整网络结构的参数，使得每个预测字符的预测都更加准确。

例如，该步骤具体可以包括如下步骤：

(a3)采用候选字符串预测模型中的编码器，基于训练坐标序列进行编码处理，获取到训练坐标序列的特征表达；

具体地，可以采用编码器，对训练坐标序列中的各坐标进行映射表达，得到各坐标的特征表达；然后采用编码器，基于各坐标的特征表达进行编码处理，获取到训练坐标序列的特征表达。

该步骤(a3)与上述图2所示实施例的步骤S203的实现原理相似，详细亦可以上述图2所示实施例的相关记载。

(b3)采用候选字符串预测模型中的解码器，基于训练坐标序列的特征表达进行解码，获取预测字符串的各预测字符的预测概率分布；

具体地，在该步骤(b3)中，在若解码预测字符串中第一个字符时，采用解码器，以训练坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；该过程可以参考上述图2所示实施例的相关记载。然后基于候选字符集合中各字符的解码概率，生成预测字符串中第一个预测字符的概率分布。例如，该第一个字符的预测概率分布即是一个包括候选字符集合中所有字符的概率的分布。如a的解码概率为0.1，b的解码概率为0.01，c的解码概率为0.05等等，则对应的预测概率分布可以表示为【0.1，0.01，0.05，……】。

若解码预测字符串中第一个字符之外的其他字符时，需要采用编码器对解码得到前一个字符进行特征映射，得到相应的特征表达；采用解码器基于前一个字符的特征表达，更新隐含层状态；并基于更新后的所述隐含层状态，继续解码，该过程可以参考上述图2所示实施例的相关记载。并参考第一个字符的解码，能够获取到预测字符串中的第2个及第2个之后的其他字符的预测概率分布。

可选地，在步骤(a3)采用候选字符串预测模型中的编码器，基于训练坐标序列进行编码处理，获取到训练坐标序列的特征表达之前，可以包括采用编码器，对训练坐标序列中各坐标进行归一化处理，得到归一化后的训练坐标序列。即该归一化处理可以由编码器来完成。

或者实际应用中，也可以在候选字符串预测模型之外，单独执行归一化处理。例如，此时可以在在步骤(a3)之前，采用单独的归一化处理模块对训练坐标序列中各坐标进行归一化处理，得到归一化后的训练坐标序列。

S503、检测预测字符串中各预测字符的预测概率分布与训练字符串对应字符的已知概率分布是否一致；若不一致，执行步骤S504；若一致；执行步骤S505；

其中每个字符的已知概率分布便是该字符对应位置为1，其余字符对应位置为0。

S504、调整候选字符串预测模型的参数，使得该预测字符的预测概率分布趋于已知概率分布；返回步骤S502继续预测下一个字符，直到预测到结束符之后，继续采用下一条训练数据继续进行训练。

本实施例中，候选字符串预测模型在预测到预测字符串中的每一个字符时，都需要和训练字符串中该位置已知字符的已知概率分布进行比对，只要不一致，都需要调整一下候选字符串预测模型的网络结构的参数，使得预测概率分布趋于已知概率分布。

S505、检测在连续预设次数的训练中预测字符的预测概率分布与对应位置已知字符的已知概率分布是否始终一致；若是，确定训练结束，确定候选字符串预测模型的参数，进而确定候选字符串预测模型；若不一致，返回步骤S502，继续采用各训练数据，训练候选字符串预测模型。

该步骤为训练候选字符串预测模型的截止条件。其中连续预设次数可以根据实际需求来设置，例如可以为连续50、80、100或者其他次数的训练。或者实际应用中，也可以设置训练的截止条件为，在完成预设次数阈值的训练，训练结束。这里的预设次数可以根据实际需求，设置为100万或者其他数值，在此不再赘述。

本实施例的候选字符串预测模型的训练方法，通过检测预测字符串中各预测字符的预测分布概率与该位置对应字符的已知分布概率不一致时，调整候选字符串预测模型的参数来训练候选字符串预测模型，能够有效地保证训练的候选字符串预测模型的准确性，可以使得训练的端到端的候选字符串预测模型，在输入坐标序列时，可以直接预测对应的候选字符串；而且能够有效地保证预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

图6为是根据本申请第六实施例的示意图；如图6所示，本实施例提供一种输入法中的候选字符串处理装置600，包括：

采集模块601，用于采集用户输入的坐标序列；

预测模块602，用于基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。

本实施例的输入法中的候选字符串处理装置600，通过采用上述模块实现输入法中的候选字符串处理的实现原理以及技术效果，与上述相关方法实施例的实现相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图7为是根据本申请第七实施例的示意图；如图7所示，在上述图6所示实施例的技术方案的基础上，进一步更加详细地描述本申请的技术方案。

如图7所示，本实施例的输入法中的候选字符串处理装置600中，预测模块602，包括：

编码处理单元6021，用于采用候选字符串预测模型中的编码器，基于坐标序列进行编码处理，获取到坐标序列的特征表达；

解码处理单元6022，用于采用候选字符串预测模型中的解码器，基于坐标序列的特征表达进行解码，获取至少一个候选字符串。

进一步可选地，编码处理单元6021，用于：

采用编码器，对坐标序列中的各坐标进行映射表达，得到各坐标的特征表达；

采用编码器，基于各坐标的特征表达进行编码处理，获取到坐标序列的特征表达。

进一步可选地，编码处理单元6021，还用于：

对坐标序列中各坐标进行归一化处理，得到归一化后的坐标序列。此时对应地，可以由编码器来执行该归一化处理。

或者可选地，也可以还采用一个归一化处理模块来单独对坐标序列中各坐标进行归一化处理，得到归一化后的坐标序列。

进一步可选地，解码处理单元6022，用于：

采用解码器，以坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；

从候选字符集合中搜索解码概率最大的N个字符；

对N个字符中各字符进行特征映射，得到相应的特征表达；

对于N个字符中各字符，采用字符的特征表达，更新隐含层状态；并基于更新后的隐含层状态，继续解码，再次获取候选字符集合中各字符成为解码字符的解码概率，并获取解码概率最大的N个字符，以此类推，直至解码到结束符或者解码得到的字符串长度达预设阈值，解码结束，获取得到至少一个候选字符串。

进一步可选地，本实施例的输入法中的候选字符串处理装置600中，还包括推荐模块603；

预测模块602，还用于基于坐标序列以及候选字符串预测模型，预测各候选字符串的概率；或者具体可以由解码处理单元6022得到该概率。

推荐模块603，用于按照概率由大到小的顺序，向用户推荐至少一个候选字符串。

图8为是根据本申请第八实施例的示意图；如图8所示，本实施例提供一种候选字符串预测模型的训练装置800，包括：

采集模块801，用于采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；

训练模块802，用于采用各条训练数据，对候选字符串预测模型进行训练。

本实施例的候选字符串预测模型的训练装置800，通过采用上述模块实现候选字符串预测模型的训练的实现原理以及技术效果，与上述相关方法实施例的实现相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图9为是根据本申请第九实施例的示意图；如图9所示，在上述图8所示实施例的技术方案的基础上，进一步更加详细地描述本申请的技术方案。

如图8所示，本实施例的候选字符串预测模型的训练装置800中，训练模块802，包括：

生成单元8021，用于对于各条训练数据，基于训练数据中的训练坐标序列以及候选字符串预测模型，生成预测字符串的各预测字符的预测概率分布；

检测单元8022，用于检测预测字符串的各预测字符的预测概率分布与训练字符串对应字符的已知概率分布是否一致；

调整单元8023，用于若不一致，调整候选字符串预测模型的参数，使得各预测字符的预测概率分布趋于已知概率分布。

进一步地，该训练模块802的训练截止条件可以参考上述方法部分相关记载。

进一步可选地，生成单元8021，用于：

对于各条训练数据，采用候选字符串预测模型中的编码器，基于训练坐标序列进行编码处理，获取到训练坐标序列的特征表达；

采用候选字符串预测模型中的解码器，基于训练坐标序列的特征表达进行解码，获取预测字符串的各预测字符及各预测字符的预测概率分布。

进一步可选地，生成单元8021，用于：

采用编码器，对训练坐标序列中的各坐标进行映射表达，得到各坐标的特征表达；

采用编码器，基于各坐标的特征表达进行编码处理，获取到训练坐标序列的特征表达。

进一步可选地，生成单元8021，还用于对训练坐标序列中各坐标进行归一化处理，得到归一化后的训练坐标序列。该归一化处理可以由编码器来执行，或者也可以由一个单独的归一化处理模块来执行。

进一步可选地，生成单元8021，，用于：

若解码预测字符串中第一个字符时，采用解码器，以训练坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；并基于候选字符集合中各字符的解码概率，生成预测字符串中第一个字符的预测概率分布；

若解码预测字符串中第一个字符之外的其他字符时，采用编码器对解码得到前一个字符进行特征映射，得到相应的特征表达；采用解码器基于前一个字符的特征表达，更新隐含层状态；并基于更新后的隐含层状态，继续解码，获取预测字符串中的其他字符的预测概率分布。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图10所示，是根据本申请实施例的实现上述相关方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图10所示，该电子设备包括：一个或多个处理器1001、存储器1002，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图10中以一个处理器1001为例。

存储器1002即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的输入法中的候选字符串处理方法或者候选字符串预测模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法。

存储器1002作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法对应的程序指令/模块(例如，附图6-附图9所示的相关模块)。处理器1001通过运行存储在存储器1002中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法。

存储器1002可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储实现输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法的电子设备的使用所创建的数据等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1002可选包括相对于处理器1001远程设置的存储器，这些远程存储器可以通过网络连接至实现输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法的电子设备还可以包括：输入装置1003和输出装置1004。处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接，图10中以通过总线连接为例。

输入装置1003可接收输入的数字或字符信息，以及产生与实现输入法中的候选字符串的处理方法或者候选字符串预测模型的训练方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1004可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，通过采集用户输入的坐标序列；基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串。由于该预先训练的候选字符串预测模型为端到端的模型，该候选字符串预测模型在预测候选字符串时不会累计误差，能够有效地提高预测的准确性。因此，本申请实施例的技术方案，基于坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本申请实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

根据本申请实施例的技术方案，采用编码器和解码器构成的端到端的候选字符串预测模型，基于用户输入的坐标序列来预测至少一个候选字符串，实现过程较为简单，且不会引入累计误差，能够有效地提高预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本申请实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

根据本申请实施例的技术方案，通过采集数条训练数据；各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列；采用各条训练数据，对候选字符串预测模型进行训练，可以使得训练的候选字符串预测模型为一个端到端的预测模型，在输入坐标序列时，可以直接预测对应的候选字符串；而且能够有效地保证预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。

根据本申请实施例的技术方案，通过检测预测字符串中各预测字符的预测分布概率与该位置对应字符的已知分布概率不一致时，调整候选字符串预测模型的参数来训练候选字符串预测模型，能够有效地保证训练的候选字符串预测模型的准确性，可以使得训练的端到端的候选字符串预测模型，在输入坐标序列时，可以直接预测对应的候选字符串；而且能够有效地保证预测的候选字符串的准确性，进而能够有效地提高输入法的输入准确性和输入效率。同时，本申请实施例的技术方案，也能够有效地增强用户使用输入法的体验度，进而增强用户对输入法的粘性。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种输入法中的候选字符串的处理方法，其特征在于，包括：

采集用户输入的坐标序列；

2.根据权利要求1所述的方法，其特征在于，基于所述坐标序列以及预先训练的候选字符串预测模型，预测至少一个候选字符串，包括：

采用所述候选字符串预测模型中的编码器，基于所述坐标序列进行编码处理，获取到所述坐标序列的特征表达；

采用所述候选字符串预测模型中的解码器，基于所述坐标序列的特征表达进行解码，获取所述至少一个候选字符串。

3.根据权利要求2所述的方法，其特征在于，采用所述候选字符串预测模型中的编码器，基于所述坐标序列进行编码处理，获取到所述坐标序列的特征表达，包括：

采用所述编码器，对所述坐标序列中的各坐标进行映射表达，得到各所述坐标的特征表达；

采用所述编码器，基于各所述坐标的特征表达进行编码处理，获取到所述坐标序列的特征表达。

4.根据权利要求3所述的方法，其特征在于，采用所述编码器，对所述坐标序列中的各坐标进行映射表达，得到各所述坐标的特征表达之前，所述方法还包括：

对所述坐标序列中各坐标进行归一化处理，得到归一化后的所述坐标序列。

5.根据权利要求2所述的方法，其特征在于，采用所述候选字符串预测模型中的解码器，基于所述坐标序列的特征表达进行解码，获取所述至少一个候选字符串，包括：

采用所述解码器，以所述坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；

从所述候选字符集合中搜索解码概率最大的N个字符；

对所述N个字符中各所述字符进行特征映射，得到相应的特征表达；

对于所述N个字符中各所述字符，采用所述字符的特征表达，更新隐含层状态；并基于更新后的所述隐含层状态，继续解码，再次获取所述候选字符集合中各所述字符成为解码字符的解码概率，并获取解码概率最大的N个字符，以此类推，直至解码到结束符或者解码得到的字符串长度达预设阈值，解码结束，获取得到所述至少一个候选字符串。

6.根据权利要求1-5任一所述的方法，其特征在于，所述方法还包括：

基于所述坐标序列以及所述候选字符串预测模型，预测各所述候选字符串的概率；

按照概率由大到小的顺序，向所述用户推荐所述至少一个候选字符串。

7.一种候选字符串预测模型的训练方法，其特征在于，所述方法包括：

8.根据权利要求7所述的方法，其特征在于，采用各条所述训练数据，对所述候选字符串预测模型进行训练，包括：

对于各条所述训练数据，基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型，生成预测字符串的各预测字符的预测概率分布；

检测所述预测字符串的各预测字符的预测概率分布与所述训练字符串对应字符的已知概率分布是否一致；

若不一致，调整所述候选字符串预测模型的参数，使得各所述预测字符的预测概率分布趋于所述已知概率分布。

9.根据权利要求8所述的方法，其特征在于，对于各条所述训练数据，基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型，生成预测字符串的各预测字符的预测概率分布，包括：

对于各条所述训练数据，采用所述候选字符串预测模型中的编码器，基于所述训练坐标序列进行编码处理，获取到所述训练坐标序列的特征表达；

采用所述候选字符串预测模型中的解码器，基于所述训练坐标序列的特征表达进行解码，获取所述预测字符串的各预测字符的预测概率分布。

10.根据权利要求9所述的方法，其特征在于，采用所述候选字符串预测模型中的解码器，基于所述训练坐标序列的特征表达进行解码，获取所述预测字符串的各预测字符的预测概率分布，包括：

若解码所述预测字符串中第一个字符时，采用所述解码器，以所述训练坐标序列的特征表达作为初始的隐含层状态进行解码，获取候选字符集合中各字符成为解码字符的解码概率；并基于所述候选字符集合中各字符的解码概率，生成所述预测字符串中第一个字符的预测概率分布；

若解码所述预测字符串中第一个字符之外的其他字符时，采用所述编码器，对所述解码得到前一个字符进行特征映射，得到相应的特征表达；采用所述解码器基于所述前一个字符的特征表达，更新隐含层状态；并基于更新后的所述隐含层状态，继续解码，获取所述预测字符串中的所述其他字符的预测概率分布。

11.一种输入法中的候选字符串处理装置，其特征在于，包括：

采集模块，用于采集用户输入的坐标序列；

12.根据权利要求11所述的装置，其特征在于，所述预测模块，包括：

编码处理单元，用于采用所述候选字符串预测模型中的编码器，基于所述坐标序列进行编码处理，获取到所述坐标序列的特征表达；

解码处理单元，用于采用所述候选字符串预测模型中的解码器，基于所述坐标序列的特征表达进行解码，获取所述至少一个候选字符串。

13.根据权利要求12所述的装置，其特征在于，所述编码处理单元，用于：

14.根据权利要求13所述的装置，其特征在于，所述编码处理单元，还用于：

15.根据权利要求12所述的装置，其特征在于，解码处理单元，用于：

从所述候选字符集合中搜索解码概率最大的N个字符；

16.根据权利要求11-15任一所述的装置，其特征在于，所述装置还包括推荐模块；

所述预测模块，还用于基于所述坐标序列以及所述候选字符串预测模型，预测各所述候选字符串的概率；

所述推荐模块，用于按照概率由大到小的顺序，向所述用户推荐所述至少一个候选字符串。

17.一种候选字符串预测模型的训练装置，其特征在于，所述装置包括：

18.根据权利要求17所述的装置，其特征在于，所述训练模块，包括：

生成单元，用于对于各条所述训练数据，基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型，生成预测字符串的各预测字符的预测概率分布；

检测单元，用于检测所述预测字符串的各预测字符的预测概率分布与所述训练字符串对应字符的已知概率分布是否一致；

调整单元，用于若不一致，调整所述候选字符串预测模型的参数，使得各所述预测字符的预测概率分布趋于所述已知概率分布。

19.根据权利要求18所述的装置，其特征在于，所述生成单元，用于：

20.根据权利要求19所述的装置，其特征在于，所述生成单元，用于：

21.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6或者7-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-6或者7-10中任一项所述的方法。