CN111324528B

CN111324528B - 一种输入法评测方法、装置、设备及存储介质

Info

Publication number: CN111324528B
Application number: CN202010076352.0A
Authority: CN
Inventors: 杨勤英; 殷运鹏; 宋明
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2020-01-23
Filing date: 2020-01-23
Publication date: 2023-11-21
Anticipated expiration: 2040-01-23
Also published as: CN111324528A

Abstract

本申请提出一种输入法评测方法、装置、设备及存储介质。该方法包括：从目标群体的历史输入文本中确定出至少一个文本单元集合，每一文本单元集合中的各文本单元对应同一编码信息；分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果。上述的评测方法实现了对待评测输入法的解码效果的评测，应用该评测方法可以使用户及开发者了解待评测输入法的解码效果。

Description

一种输入法评测方法、装置、设备及存储介质

技术领域

本申请涉及输入法评测技术领域，尤其涉及一种输入法评测方法、装置、设备及存储介质。

背景技术

输入法是用户向电子设备输入文本内容的常用工具。用户在输入法输入的信息作为编码信息，输入法对用户输入的编码信息进行解码得到的文本解码结果，用户从输入法解码得到的文本解码结果中选择文本解码结果作为输入的文本内容。

一款好的输入法对用户输入的编码信息的解码结果，应当符合用户的文本输入预期，从而保证用户的文本输入效率。而市面上的输入法琳琅满目，各种输入法的解码效果也各不相同，此时，如何对输入法进行评测从而了解输入法的解码效果，成为了开发者开发输入法以及用户选择输入法时的现实需求。

发明内容

基于上述需求，本申请提出一种输入法评测方法、装置、设备及存储介质，能够实现对输入法的评测。

一种输入法评测方法，包括：

从目标群体的历史输入文本中确定出至少一个文本单元集合，每一文本单元集合中的各文本单元对应同一编码信息；其中，所述同一编码信息的编码规范与待评测输入法的编码规范一致；

分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；

至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果。

一种输入法评测装置，包括：

测试集确定单元，用于从目标群体的历史输入文本中确定出至少一个文本单元集合，每一文本单元集合中的各文本单元对应同一编码信息；其中，所述同一编码信息的编码规范与待评测输入法的编码规范一致；

测试数据获取单元，用于分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；

评测结果确定单元，用于至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果。

一种输入法评测设备，包括：

存储器和处理器；

其中，所述存储器与所述处理器连接，用于存储程序；

所述处理器，用于通过运行所述存储器中存储的程序，实现上述的输入法评测方法。

一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现上述的输入法评测方法。

本申请提出的输入法评测方法从目标群体的历史输入文本中确定出文本单元集合，并且每个文本单元集合对应同一编码信息；将与每个文本单元集合对应的编码信息输入待评测输入法得到与每个文本单元集合对应的解码结果集合；根据各个文本单元集合及其对应的解码结果集合，确定对待评测输入法的评测结果。上述的评测方法实现了对待评测输入法的解码效果的评测，应用该评测方法可以使用户及开发者了解待评测输入法的解码效果。

进一步的，本申请上述的输入法评测方法将同一编码信息及其对应的文本单元集合作为测试集对待评测输入法进行评测，该评测方法的测试集包含的预期结果不唯一，对应同一编码信息的较多的预期结果可以减少将待评测输入法的解码结果误判为错误的解码结果的情况发生，因此能够提高对待评测输入法评测的客观性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本申请实施例提供的一种输入法评测方法的流程示意图；

图2是本申请实施例提供的另一种输入法评测方法的流程示意图；

图3是本申请实施例提供的一种输入法评测装置的结构示意图；

图4是本申请实施例提供的一种输入法评测设备的结构示意图。

具体实施方式

本申请实施例技术方案适用于对输入法进行评测的应用场景，采用本申请实施例技术方案，能够对输入法的解码效果进行评测，从而为开发者开发输入法以及用户选择输入法提供依据。

需要说明的是，输入法解码包括静态解码和对解码结果进行动态调整两种处理。静态解码是输入法不可或缺的一部分处理内容，它属于输入法的核心技术，输入法的静态解码处理会根据相应的输入给出符合大众需求的排序解码结果，随后在用户使用输入法的过程中根据用户个人使用习惯进行再一次的解码结果动态调序，得出最终的解码结果。静态解码的准确性是影响输入法效果的最重要因素之一。本申请实施例所提出的输入法评测方法，主要用户对输入法的静态解码效果进行评测。

其中，上述的输入法可以是任意的输入法，例如拼音输入法、五笔书法、手写输入法等。

在现有技术中存在一些常见的输入法评测方法，但是这些评测方法的客观性较差，因此其评测并不准确。

例如，常见的对拼音输入法的评测方法为评测拼音输入法的解码结果top1至top5的命中率。该评测方法的测试集制作方法一般为，寻找一批常用词语、口语聊天等内容，进行各种编码信息的标注，形成一个编码标注信息对应一个预期文本结果(常用词语、口语聊天内容等)的测试集，将大批量的测试集一起组成完整的解码效果测试集。

具体的测试方法是将测试集的编码信息输入拼音输入法引擎得到多个有序的解码结果，将标注的预期文本结果和引擎输出的有序解码结果进行对比，记下标注的预期文本结果处在引擎解码结果的第n位，若该解码结果中无标注的预期文本结果则记为0，得出预期文本结果处在前1位、前2位、前3位、前4位、前5位的百分占比即top1至top5的命中率，该命中率即作为对拼音输入法的解码效果评测结果。

上述的评测方法对测试集的依赖性比较大，理论上，一个固定的输入编码信息有多种合理的解码结果，比如对于不同的用户，或者在不同的文本输入场景下，其编码结果理应发生变化。但是测试集只有一个预期文本结果，导致合理但是不与预期文本结果一致的解码结果被统计到解码错误的行列。

对于其他类型的输入法的现有评测方法也存在上述问题。由此可见，受制于测试集的限制，常见的对输入法的评测方法均不够客观，其评测可信度较差。

为了解决上述问题，本申请实施例提出一种输入法评测方法，能够实现对输入法的解码效果的客观评测。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

参见图1所示，本申请实施例提出的输入法评测方法，包括：

S101、从目标群体的历史输入文本中确定出至少一个文本单元集合，每一文本单元集合中的各文本单元对应同一编码信息。

其中，所述同一编码信息的编码规范与待评测输入法的编码规范一致。

具体的，在本申请实施例中，上述的待评测输入法，是指可以由用户输入编码信息，该待评测输入法能够对用户输入的编码信息进行解码得到多个解码结果的输入法，例如可以是拼音输入法、五笔输入法、手写输入法等。

可以理解，不同的输入法可识别的编码信息的编码规范各不相同，例如对于拼音输入法来说，其只能识别拼音串(通过26键键盘输入的内容)或数字串(通过9键键盘输入的内容)形式的编码信息；对于五笔输入法和手写输入法来说，其只能识别由笔画组合构成的编码信息。因此，当需要使用某种输入法对编码信息进行解码时，该编码信息应当符合该输入法的编码规范。例如对于拼音输入法来说，要想利用拼音输入法对输入的编码信息进行解码，则该输入的编码信息应当是上述的拼音串或数字串的形式。

上述目标群体可以是指特定的用户群体，例如可以是主动招募的100个用户，签署数据共享协议确保其知情且同意对其输入文本进行采集、记录的用户群体。

本申请实施例对目标群体的历史输入文本进行采集，作为构建测试集的文本数据源。上述目标群体的历史输入文本，是指目标群体在设定的历史时间段内向电子设备或应用程序中输入的文本内容。其中，目标群体输入的文本内容，可以是通过任意方式输入的文本内容，例如可以是语音输入的文本内容，也可以是利用拼音输入法、五笔输入法、手写输入法等方式输入的文本内容。

上述的文本单元，是指由文本字符构成的文本字符组合，例如当上述的历史输入文本为汉字文本时，上述的文本单元即为由一个汉字，或两个汉字，或三个汉字等组成的分词；当上述的历史输入文本为英文文本时，上述的文本单元即为由字母或单词组成的英文字符串。

本申请实施例从上述的目标群体的历史输入文本中提取文本单元，以及分别确定与各个文本单元对应的编码信息。并且，上述的与各个文本单元对应的编码信息，与待评测输入法的编码规范一致，也就是，将与各个文本单元对应的编码信息输入待评测输入法，能够使待评测输入法对其进行解码，从而得到与文本单元相同内容形式的解码结果。例如，假设上述的待评测输入法为拼音输入法，同时，上述的文本单元为汉字构成的分词，则与文本单元对应的编码信息为上述的拼音串或数字串形式的信息内容。

在此基础上，本申请实施例对所有的文本单元划分文本单元集合，使得每个文本单元集合中的各个文本单元对应同一编码信息。此时，每个文本单元集合中的各个文本单元对应的编码信息，也就是该文本单元集合对应的编码信息。在本申请实施例中，一个文本单元集合及其对应的编码信息构成一条测试集数据，用于对输入法的评测，该测试集数据中的文本单元集合中的各个文本单元，均作为与编码信息对应的预期结果。

可以理解，本申请实施例的上述处理得到的测试集数据不同于常规的一个编码信息对应一个预期结果的结构形式，而是一个编码信息对应多个预期结果，从根本上改变了测试集的结构。该测试集涵盖的预期结果更丰富，因此可以减少对待评测输入法的解码结果的统计错误情况的发生。

S102、分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果。

在得到上述的各个文本单元集合，以及与每个文本单元集合对应的编码信息后，本申请实施例利用上述的文本单元集合以及与文本单元集合对应的编码信息对待评测输入法进行评测。

具体的，分别将每个文本单元集合对应的编码信息输入待评测输入法，使待评测输入法对输入的编码信息进行解码得到至少一个解码结果，该至少一个解码结果构成解码结果集合。

需要说明的是，上述待评测输入法对输入的编码信息的解码结果具有次序性，符合用户需求的解码结果越靠前，就越利于被用户选择，其解码效果就更优。例如，假设输入法的解码结果中的第一个解码结果总能满足用户需求，则用户使用该输入法时就会很便利，此时该用户对该输入法的评价就会比较好；假设输入法的解码结果中的前几个解码结果都不包含用户需要的解码结果，则用户需要再从输入法的解码结果中查找所需的解码结果，可想而知用户使用该输入法时很不便利，此时该用户对该输入法的评价可能就会比较差。

因此，待评测输入法输出的各个解码结果的次序，直接影响了用户使用输入法的感受，而输入法的解码结果能否以更加便利的方式满足用户需求也是评测输入法的解码效果的一个方面，也就是，输入法输出的各个解码结果的排序直接影响对该输入法的评测结果。因此，本申请实施例保持上述待评测输入法对上述文本单元集合对应的编码信息的解码结果的原始顺序，即上述的解码结果集合中包含的各个解码结果是上述待评测输入法对输入的编码信息进行解码后依次输出的各个解码结果的排序集合。

本申请实施例将上述各个文本单元集合对应的编码信息分别输入上述待评测输入法，得到该待评测输入法对输入的各个编码信息进行解码得到的各个解码结果集合，该解码结果集合，也就是与输入的编码信息对应的文本单元集合相对应的解码结果集合。

则，通过上述处理，可以得到由待评测输入法解码得到的，与上述每个文本单元集合对应的解码结果集合。

S103、至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果。

通过步骤S102的处理介绍可以确定，上述的文本单元集合及其对应的解码结果集合，均对应同一编码信息的集合。其中，对应同一编码信息的文本单元集合，可以看做是测试集中的对应该编码信息的预期结果；而对应该同一编码信息的解码结果集合，则是待评测输入法对该编码信息进行解码得到的解码结果集合。

示例性的，本申请实施例通过将对应同一编码信息的文本单元集合和解码结果集合进行对比，确定对上述待评测输入法的评测结果。

例如，对应于某一编码信息，通过将对应该编码信息的文本单元集合的元素与对应该编码信息的编码结果集合的元素进行对比，确定上述待评测输入法对该编码信息的解码结果是否命中任意一个预期结果，从而判断该待评测输入法是否解码得到与该编码信息对应的正确的预期结果，或者判断其命中正确的预期结果的数量，进而得出对该待评测输入法的评测结果。

需要说明的是，由于上述的文本单元集合是来自于目标群体的历史输入文本的文本单元集合，因此，上述的待评测输入法对文本单元集合中的文本单元的命中情况，实际上表示了该待评测输入法对上述目标群体的常用文本单元的解码成功情况。

则可以理解，按照本申请实施例上述处理过程得到的对待评测输入法的评测结果，是基于目标群体的历史输入文本得出的对待评测输入法的评测结果，其评测结果的好坏只能表示其能否满足上述目标群体的文本输入需求的评测结果，即只能作为上述目标群体对该待评测输入法的评测结果。

显而易见的，假设按照本申请上述实施例技术方案得出的对待评测输入法的评测结果较优，则可以说明该待评测输入法能够较好地满足上述目标群体的文本输入需求。然而对于与上述的目标群体的文本输入习惯完全不同的另一用户群体来说，该待评测输入法可能无法较好的满足其文本输入需求，此时这一用户群体对该待评测输入法的评价可能较差。

因此，按照本申请上述实施例介绍的评测方法得到的对待评测输入法的评测结果，具体是上述的目标群体对该待评测输入法的评测结果。

进一步的，为了提高对上述待评测输入法的评测客观性，可以将上述的目标群体设定为主动招募且同意配合对输入法进行评测的大众群体，则按照本申请实施例介绍得到的对该待评测输入法的评测结果即为大众对该待评测输入法的评测结果。

或者，可以针对任意领域的用户(例如化工领域、计算机领域等)，在用户知情且同意配合的情况下，通过采集其历史输入文本，按照本申请实施例技术方案，得出该领域用户对该输入法的评测结果，这样，可以分领域分别对待评测输入法进行评测。

通过上述介绍可见，本申请实施例提出的输入法评测方法从目标群体的历史输入文本中确定出文本单元集合，并且每个文本单元集合对应同一编码信息；将与每个文本单元集合对应的编码信息输入待评测输入法得到与每个文本单元集合对应的解码结果集合；根据各个文本单元集合及其对应的解码结果集合，确定对待评测输入法的评测结果。上述的评测方法实现了对待评测输入法的解码效果的评测，应用该评测方法可以使用户及开发者了解待评测输入法的解码效果。

作为一种示例性的实现方式，上述的从目标群体的历史输入文本中确定出至少一个文本单元集合，包括：

首先，获取目标群体在设定时间段内的历史输入文本。

示例性的，本申请实施例在上述目标群体知情且同意的情况下，在目标群体各自的电子设备上安装具有日志记录功能的程序，对上述目标群体各自向电子设备输入的文本内容进行持续记录。在经过设定时长的持续记录，例如经过2-3年的记录后，提取记录的所有文本内容作为历史输入文本。

作为可选的实现方式，可以通过从数据库读取的方式，从存储上述目标群体的历史输入文本的开源数据库中，读取上述的历史输入文本。

然后，对上述的历史输入文本进行文本单元划分处理，得到各个文本单元，以及分别确定与各个文本单元对应的编码信息。

示例性的，本申请实施例对上述的历史输入文本进行分词处理，将上述的历史输入文本分为各个文本单元。在此基础上，可以分别确定每个文本单元对应的编码信息。

例如，对历史输入文本进行分词处理得到各个文本单元后，分别确定每个文本单元的拼音，作为与各个文本单元对应的编码信息。

作为一种示例性的实现方式，假设上述的编码信息为拼音，则可以借助语音合成引擎实现对历史输入文本的文本单元划分，以及确定各个文本单元的编码信息，即确定各个文本单元对应的拼音。

具体的，将上述的历史输入文本输入语音合成引擎，该语音合成引擎对输入的文本进行分词及注音处理，并将分词结果及注音结果输出，即可得到上述历史输入文本包含的各个文本单元以及各个文本单元对应的拼音。

需要说明的是，上述对历史输入文本的分词处理，以符合用户常规的断句、语气等情景进行，其分词得到的文本单元可以是单个字的文本单元，也可能是两个字、三个字、四个字的文本单元等。即，对上述的历史输入文本的分词处理可以从不同的切分粒度进行，得到切分粒度为小、中、大的文本单元。其中，小切分粒度一般是2-3个字，中切分粒度一般是3-5个字，大切分粒度一般是5个字以上。例如利用语音合成引擎对“所以你永远买不起房子”进行切分及注音的例子：所[＝suo2]以[＝yi2]*你[＝ni3]*永[＝yong2]远[＝yuan3]#买[＝mai3]不[＝bu4]起[＝qi3]*房[＝fang2]子[＝zi8]。小粒度切分得到的文本单元有：所以、你、永远、买不起、房子；中粒度切分得到的文本单元有：所以你永远、买不起房子；大粒度切分得到的文本单元有：所以你永远买不起房子。

最后，由上述各个文本单元中的、与同一编码信息对应的各个文本单元，组成与该同一编码信息对应的文本单元集合。

具体的，对上述的历史输入文本进行切分后得到很多文本单元，将所有文本单元放在一起统计对应的编码信息，将编码信息相同的文本单元整合在一起组成文本单元集合，该集合作为与该同一编码信息对应的文本单元集合。

例如，将相同拼音对应的文本单元整合在一起组成文本单元集合，作为与该拼音对应的文本单元集合。比如，“老师”、“老是”、“老实”、“老式”、“老世”、“老石”对应的拼音均为“laoshi”，则将“老师”、“老是”、“老实”、“老式”、“老世”、“老石”整合成集合{老师，老是，老实，老式，老世，老石}，作为与拼音“laoshi”对应的文本单元集合。

按照上述处理，能够将上述的各个文本单元划分为至少一个文本单元集合，并且每个文本单元集合对应同一个编码信息，以上各个文本单元集合及其对应的编码信息，分别作为对待评测输入法进行评测的测试集。

作为一种优选的实现方式，参见图2所示，在执行步骤S202、分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合后，上述输入法评测方法还包括：

S203、确定各个文本单元集合中的各个文本单元的评分分值，以及确定各个解码结果集合中的各个解码结果的评分分值。

其中，上述的评分分值至少基于词频属性确定，该词频属性具体可以是高频、中频、低频中的任意一种。

本申请实施例对上述各个文本单元集合中的各个文本单元，以及上述各个解码结果集合中的各个解码结果进行评分时，具体是先确定各个文本单元和各个解码结果在上述目标群体的历史输入文本中出现的次数，然后基于各个文本单元和各个解码结果在上述目标群体的历史输入文本中出现的次数，确定各个文本单元和各个解码结果在目标群体的历史输入文本中的词频属性，例如可能是高频、中频、低频等。文本单元和解码结果在目标群体的历史输入文本中的词频属性表示了文本单元和解码结果在目标群体的历史输入文本中出现的频率。最后，根据各个文本单元和各个解码结果在目标群体的历史输入文本中的词频属性，对各个文本单元和各个解码结果进行评分，确定其评分分值。

上述对各个文本单元的评分分值，代表了用户在文本输入过程中，当输入了与该文本单元对应的编码信息时，期望获得该文本单元的期望程度，文本单元的评分分值越大，则说明用户在文本输入过程中通过输入与该文本单元对应的编码信息从而获得该文本单元的期望程度越高。可以理解，如果待评测输入法对于上述文本单元对应的编码信息的解码结果的评分分值，与上述文本单元的评分分值接近，则说明待评测输入法对该编码信息的解码结果基本上能够符合用户的期望。

作为一种示例性的实现方式，上述步骤S203中确定各个文本单元集合中的各个文本单元的评分分值时，具体包括：

首先，分别确定各个文本单元集合中的各个文本单元在目标群体的历史输入文本中的词频属性。

可以理解，文本单元在上述的目标群体的历史输入文本中出现的次数，能够正面反映该文本单元在上述目标群体的历史输入文本中的词频属性。因此，可以通过统计上述的各个文本单元集合中的各个文本单元在上述的目标群体的历史输入文本中出现的次数，确定各个文本单元在上述的目标群体的历史输入文本中的词频属性。

进一步的，由于文本单元的词长不同，其在目标群体的历史输入文本中的词频属性的评判标准不同。对于词长较长的词，例如5个字的词，由于其使用频率本身较低，因此在上述历史输入文本中出现较少的次数就可能已经是高频词；而对于词长较长的词，例如2个字的词，由于其使用频率本身较高，因此，在上述历史输入文本中出现较多的次数才能视为高频词。

因此，作为一种优选的实现方式，本申请实施例在确定各个文本单元在上述目标群体的历史输入文本中的词频属性时，具体是根据文本单元的词长，以及文本单元在上述目标群体的历史输入文本中出现的次数来确定的。

具体的，对应各个文本单元集合中的每个文本单元，分别根据其字长和其在目标群体的历史输入文本中出现的次数，确定其词频属性。

示例性的，本申请实施例参照如下表1所示的词频属性划分方案，根据文本单元的字长和在上述历史输入文本中出现的次数，对文本单元进行词频属性划分。

	低频	中频	高频
				2字	[1500,5000)	[5000,25000)	[25000,正无穷大)
3字	[200,2000)	[2000,6000)	[6000,正无穷大)
				4字	[20,500)	[500,1500)	[1500,正无穷大)
5字	[20,300)	[300,600)	[600,正无穷大)

如表1所示，由2个字构成的文本单元的词频大于25000的为高频，词频在5000-25000的为中频；词频在1500至5000的为低频；低于1500的舍弃。同理，对于其他字长的文本单元，可以分别确定其在目标群体的历史输入文本中的词频属性。

更进一步的，为了更加简洁地表示对上述的各个文本单元的词频属性的确定结果，本申请实施例将文本单元的词频(在上述的目标群体的历史输入文本中出现的次数)、词频属性、字长信息，添加到文本单元集合中。

例如，对于上述的拼音“laoshi”对应的文本单元集合{老师，老是，老实，老式，老世，老石}，分别将其中的各个文本单元的词频、词频属性、字长信息添加到集合中，得到如下的统计结果：

8163969laoshi:{[6747304,老师,高频_2_冠军]，[1072778,老是,高频_2]，[325330,老实,高频_2]，[10764,老式,中频_2]，[5854,老世,中频_2]，[1939,老石,低频_2]}

其中，“8163969”表示拼音“laoshi”对应的所有文本单元的词频总和。对于集合中词频最大的文本单元，本申请实施例还为其增设“冠军”属性，即上述集合中的“高频_2_冠军”表示该文本单元为高频词，并且在上述的目标群体的历史输入文本中的词频最大。

需要说明的是，具有上述冠军属性的文本单元，其词频必须处于第一位，并且其词频超过与其对应的编码信息对应的所有文本单元的词频总和的60％。例如上述的文本单元集合中，“老师”的词频大于25000且大于拼音“laoshi”对应的所有文本单元的词频总和的60％，因此“老师”具有冠军属性。

又例如，对于9键拼音输入法的数字串“94264926”，对与其对应的各个文本单元进行词频(在上述的目标群体的历史输入文本中出现的次数)统计，并且确定其词频属性后，可以整理得到如下的文本单元集合：

00875473 94264926：{[745264,想要,高频_2_冠军][54736,想玩,高频_2][43590,香烟,高频_2][16480,香皂,中频_2][6002,张燕,中频_2][5329,张艳,中频_2][2291,像要,低频_2][1781,张岩,低频_2]}。

其中，“00875473”表示数字串“94264926”对应的所有文本单元的词频总和。

在分别确定上述各个文本单元集合中的各个文本单元在目标群体的历史输入文本中的词频属性后，至少根据各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性，以及预设的基于词频属性的评分规则，分别确定各个文本单元集合中的各个文本单元的评分分值。

其中，上述的基于词频属性的评分规则，具体是评分分值大小与词频属性和/或词频排名相关的评分规则，具体的，相对来说，文本单元的词频属性表征的词频越高，和/或词频排名越靠前，则对其评分的分值越高。

作为一种示例性的实现方式，本申请实施例设定，在一个文本单元集合中，词频排在前5位的、词频属性为高频、中频、低频的文本单元，其评分分值分别为3²、2²、1²，词频排在前5-16位的、词频属性为高频、中频、低频的文本单元的得分分值分别为3、2、1；若文本单元集合中的词频最高的文本单元具有冠军属性，则该文本单元的评分分值在上述评分分值的基础上乘以1.5。

例如，对与数字串94264926对应的文本单元集合{[745264,想要,高频_2_冠军][54736,想玩,高频_2][43590,香烟,高频_2][16480,香皂,中频_2][6002,张燕,中频_2][5329,张艳,中频_2][2291,像要,低频_2][1781,张岩,低频_2]}中的各个文本单元进行评分，由于词频最高的文本单元“想要”具有冠军属性，并且其具有高频属性，则按照本申请实施例上述的评分规则，其评分分值为1.5×3²＝13.5；文本单元“想玩”具有高频属性，并且其词频排在前5位，因此其评分分值为3²＝9；文本单元“香烟”具有高频属性，并且其词频排在前5位，因此其评分分值为3²＝9；文本单元“香皂”和“张燕”分别具有中频属性，并且其词频均排在前5位，因此其评分分值均为2²＝4。

按照上述处理过程，对于上述的每个文本单元集合，均可以确定其中包含的各个文本单元的评分分值。

另一方面，上述步骤S203中确定各个解码结果集合中的各个解码结果的评分分值时，具体包括：

首先，分别确定上述的各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性。

具体的，本步骤处理的具体处理内容，与上述实施例介绍的“分别确定上述的各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性”这一处理步骤的处理内容相同，参照其执行即可。

或者，在确定各个解码结果的评分分值时，可以直接应用在确定各个文本单元的评分分值时已经确定的各个文本单元在上述目标群体的历史输入文本中的词频属性信息。

然后，对应每个解码结果集合中的每个解码结果，分别将与该解码结果所在的解码结果集合对应的文本单元集合中的、与该解码结果的内容相同的文本单元的词频属性，设定为该解码结果的词频属性。

具体的，对于上述每个解码结果集合中的每个解码结果，按照如下方式确定其词频属性：

将该解码结果所在的解码结果集合对应的文本单元集合中的、与该解码结果的内容相同的文本单元的词频属性，设定为该解码结果的词频属性。

即，即如果该解码结果的内容，与该解码结果所在的解码结果集合对应的文本单元集合中的任意一个文本单元的内容相同，则该解码结果的词频属性就是与其内容相同的文本单元的词频属性。

如果在某一解码结果所在的解码结果集合对应的文本单元集合中，不存在于该解码结果内容相同的文本单元，则该解码结果的词频属性为不存在。

按照上述规则，可以分别确定每个解码结果集合中的每个解码结果的词频属性。

最后，至少根据各个解码结果集合中的各个解码结果的词频属性，以及预设的基于词频属性的评分规则，分别确定各个解码结果集合中的各个解码结果的评分分值。

其中，上述基于词频属性的评分规则，同样为评分分值大小与词频属性成正比的评分规则，即解码结果的词频属性越高，其评分分值越高。

作为一种示例性的实现方式，本申请实施例设定，在一个解码结果集合中，排在集合前5位的、词频属性为高频、中频、低频的解码结果，其评分分值分别为3²、2²、1²，排在集合前5-16位的、词频属性为高频、中频、低频的解码结果的得分分别为3、2、1；若解码结果集合中的第一个解码结果具有冠军属性，则该解码结果的评分分值在上述评分分值的基础上乘以1.5；若解码结果的词频属性为不存在，则其得分为0。按照上述评分规则，可以确定解码结果集合中的前16个解码结果的评分分值。

例如，假设向待评测拼音输入法输入上述的数字串形式的编码信息“94264926”，得到的解码结果集合为{想要，香皂，香烟，像要，张湾，张燕，张岩，张彦，张妍，张瑶，张耀，香艳，张万，张延，张艳，张婉}，则按照上述的评分规则，解码结果“想要”的词频属性为高频_2_冠军，且处在集合的第一位，则解码结果“想要”得分＝1.5×32＝13.5；解码结果“香皂”的词频属性为中频_2，处在第二位，得分为2²＝4；解码结果“香烟”的词频属性为高频_2,且处在第三位，则得分为3²＝9；解码结果“像要”的词频属性为低频_2,处在第四位，得分为1²＝1；解码结果“张湾”的词频属性为不存在，得分为0；解码结果“张燕”的词频属性为中频_2，处在第六位，得分为2；以此类推，可以分别确定上述解码结果集合中的各个解码结果的评分分值。

对于上述的每个解码结果集合，通过执行上述处理可以分别确定集合中的各个解码结果的词频属性、词频等信息，进而根据预设的评分规则，确定各个解码结果的评分分值。

在分别确定上述的各个文本单元集合中的各个文本单元的评分分值，以及上述的各个解码结果集合中的各个解码结果的评分分值后，上述的至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果，具体为执行以下步骤S204的处理：

S204、根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果。

如前文所述，文本单元集合中的文本单元的评分分值，表示了用户输入与该文本单元对应的编码信息时，期望得到该文本单元的期望程度。而与上述的文本单元集合对应的解码结果集合中的解码结果的评分分值，是待评测输入法对该文本单元集合对应的编码信息进行解码得到的解码结果的评分分值。

可以理解，如果待评测输入法对某一文本单元集合对应的编码信息进行解码得到的解码结果的评分分值，与该文本单元集合中的文本单元的评分分值接近，则可以说明该待评测输入法能够满足用户对文本输入的预期，此时该用户对该待评测输入法的评价就会较高。

例如，假设待评测输入法对某一文本单元集合对应的编码信息进行解码得到的各个解码结果的评分分值，与该文本单元集合中的各个文本单元的评分分值完全一致，包括各解码结果的评分分值排序与各文本单元的评分分值排序一致，则可以说明该待评测输入法对该编码信息的解码结果，与该编码信息对应的文本单元集合中的文本单元完全一致，也就是说该待评测输入法对该编码信息的解码结果，完全符合用户预期，此时该待评测输入法能够得到该用户的满意评价，该评价即可作为该用户对该待评测输入法的评测结果。

由此可见，通过将上述各个文本单元结合和各个文本单元集合中的各个文本单元的评分分值，与上述各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值进行对比，可以确定待评测输入法对同一编码信息的解码结果与该编码信息对应的文本单元之间的差异，从而可以以此确定上述目标群体对该待评测输入法的评测结果。

作为一种示例性的实现方式，上述的根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果，具体包括：

首先，对应每个文本单元集合，分别将该文本单元集合中的各个文本单元按照在上述目标群体的历史输入文本中出现的次数由高到低的顺序进行排序。

其中，文本单元在上述目标群体的历史输入文本中出现的次数即为文本单元的词频。经过上述调整后，在文本单元集合中、从第一个文本单元开始，各个文本单元的词频是逐渐减少的。

对文本单元集合中的各个文本单元的上述排序处理，可以使得文本单元集合中的文本单元的排序情况与用户对各个文本单元的使用情况相匹配，文本单元在文本单元集合中的位置越靠前，则说明用户对该文本单元的使用频率越高。

前文介绍到，待评测输入法对输入的编码信息的解码结果是有次序性的。通常情况下，如果待评测输入法对某一编码信息进行解码输出的解码结果集合中的排位靠前的解码结果为用户常用的对应该编码信息的文本单元，则可以说明该待评测输入法能够满足用户对该编码信息的解码需求；相反，如果待评测输入法对某一编码信息进行解码输出的解码结果集合中的排位靠前的解码结果中，不存在用户常用的对应该编码信息的文本单元，则用户还需要进一步从待评测输入法输出的解码结果集合中查找所需的文本单元，此时用户使用较繁琐，该输入法不能快速地满足用户对该编码信息的解码需求。

基于上述理论，将与编码信息对应的文本单元集合中的各个文本单元进行排序，使其符合用户对该编码信息的解码预期。然后将该文本单元集合用作对待评测输入法的解码结果的评测基础，可以实现对待评测输入法的解码结果输出顺序这一方面的评测。

如果不对上述文本单元集合中的各个文本单元进行排序，则无法确定待评测输入法的解码输出结果是否能够快速地满足用户的解码需求，而只能评测待评测输入法对编码信息进行解码能否得到用户预期的解码结果，对于输入法的解码结果输出顺序的评测则无法实现，此时对待评测输入法的评测相对来说不够全面。而经过上述排序处理后，可以使对待评测输入法的评测更严谨、更全面。

需要说明的是，在上述的文本单元集合建立阶段，可以直接将与同一编码信息对应的文本单元按照其在目标群体的历史输入文本中的词频进行排序建立集合，此时上述的文本单元集合中的各个文本单元本身就是排序后的。因此，在这种情况下，可以跳过上述的排序处理步骤。

然后，计算各个文本单元集合的前n个文本单元的评分分值的总和，以及计算各个解码结果集合的前n个解码结果的评分分值的总和；其中n为正整数。

具体的，对于每个文本单元集合，分别计算其前n个文本单元的评分分值的和，然后将各个文本单元集合的前n个文本单元的评分分值的和进行求和处理，得到各个文本单元的前n个文本单元的评分分值的总和。

同理，对于每个解码结果集合，分别计算其前n个解码结果的评分分值的和，然后将各个解码结果集合的前n个解码结果的评分分值的和进行求和处理，得到各个解码结果集合的前n个解码结果的评分分值的总和。

例如，假设有文本单元集合A以及与文本单元集合A对应的解码结果集合A’，和文本单元集合B以及与文本单元集合B对应的解码结果集合B’，假设n＝3。则分别计算文本单元集合A的前3个文本单元的评分分值的和得到a，计算文本单元集合B的前3个文本单元的评分分值的和得到b，计算解码结果集合A’的前3个解码结果的评分分值的和a’，计算解码结果集合B’的前3个解码结果的评分分值的和b’，然后，计算a+b的和作为文本单元集合A和B的前3个文本单元的评分分值的总和，计算a’+b’的和作为解码结果集合A’和B’的前3个解码结果的评分分值的总和。

最后，通过计算所述各个文本单元集合的前n个文本单元的评分分值的总和，以及所述各个解码结果集合的前n个解码结果的评分分值的总和的比值，确定所述目标群体对所述待评测输入法的评测结果。

具体的，上述的各个文本单元集合的前n个文本单元的评分分值的总和，以及上述各个解码结果集合的前n个解码结果的评分分值的总和的比值，即为上述的待评测输入法的前n个解码结果的用户满意度，也就是上述的目标群体对待评测输入法的前n个解码结果的满意度。

例如，假设上述的待评测输入法为拼音输入法，测试集只有前文所述的包含“94264926”这一编码信息的测试集，则，与该编码信息对应的文本单元集合{[745264,想要,高频_2_冠军][54736,想玩,高频_2][43590,香烟,高频_2][16480,香皂,中频_2][6002,张燕,中频_2][5329,张艳,中频_2][2291,像要,低频_2][1781,张岩,低频_2]}的top1文本单元的评分分值的总和为1.5×3²＝13.5；top2文本单元的评分分值的总和为1.5×3²+3²＝22.5；top5文本单元的评分分值的总和为1.5×3²+3²+3²+2²+2²＝39.5。

与该编码信息对应的解码结果集合{想要，香皂，香烟，像要，张湾，张燕，张岩，张彦，张妍，张瑶，张耀，香艳，张万，张延，张艳，张婉}的top1解码结果的评分分值的总和为1.5×3²＝13.5；top2解码结果的评分分值的总和为1.5×3²+2²＝17.5；top5解码结果的评分分值的总和为1.5×3²+2²+3²+1²+0＝27.5。

则，该拼音输入法的top1输出结果的用户满意度＝(top1解码结果的评分分值的总和/top1文本单元的评分分值的总和)*100％＝(13.5/13.5)*100％＝100％；该拼音输入法的top2输出结果的用户满意度＝(top2解码结果的评分分值的总和/top2文本单元的评分分值的总和)*100％＝(17.5/22.5)*100％＝77.8％；该拼音输入法的top5输出结果的用户满意度＝(top5解码结果的评分分值的总和/top5文本单元的评分分值的总和)*100％＝(27.5/39.5)*100％＝69.6％。

可以理解，图2所示的输入法评测方法从目标群体对输入法的前n个解码结果的满意度角度，对待评测输入法进行了评测。该评测过程直接评测了待评测输入法的解码输出的用户满意度，是对待评测输入法的基本功能评测。

图2所示的方法实施例中的步骤S201、S202分别对应图1所示的方法实施例中的步骤S101、S102，其具体内容请参见图1所示的方法实施例的内容，此处不再赘述。

作为另一种可选的实现方式，本申请实施例还提出，上述的根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果，包括：

首先，对应每个文本单元集合，分别将该文本单元集合中的各个文本单元按照在所述目标群体的历史输入文本中出现的次数由高到低的顺序进行排序；

具体的，该步骤的排序处理可参见上述实施例相应的处理步骤介绍实现，此处不再重复。

然后，对应每种类型的词频属性，包括高频、中频、低频，分别执行以下处理：

计算各个文本单元集合的前k个文本单元中的、具有该类型词频属性的文本单元的评分分值的总和，作为第一评分总和，以及计算各个解码结果集合的前k个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和，作为第二评分总和；其中，k为正整数。

具体的，对于每个文本单元集合，分别计算其前k个文本单元中的、具有该类型词频属性的文本单元的评分分值的和。然后，将各个文本单元集合的前k个文本单元中的、具有该类型词频属性的文本单元的评分分值的和进行累加处理，得到的累加和作为第一评分总和。

同理，对于每个解码结果集合，分别计算其前k个解码结果中的、具有该类型词频属性的解码结果的评分分值的和。然后，将各个解码结果集合的前k个解码结果中的、具有该类型词频属性的解码结果的评分分值的和进行累加处理，得到的累加和作为第二评分总和。

例如，假设有文本单元集合A以及与文本单元集合A对应的解码结果集合A’，和文本单元集合B以及与文本单元集合B对应的解码结果集合B’，假设k＝5，上述该种类型的词频属性为高频。则分别计算文本单元集合A的前5个文本单元中的、具有高频属性的文本单元的评分分值的和得到a，计算文本单元集合B的前5个文本单元中的、具有高频属性的文本单元的评分分值的和得到b，计算解码结果集合A’的前5个解码结果中的、具有高频属性的解码结果的评分分值的和a’，计算解码结果集合B’的前5个解码结果中的、具有高频属性的解码结果的评分分值的和b’，然后，计算a+b的和作为文本单元集合A和B的前5个文本单元中的、具有高频属性的文本单元的评分分值的总和，作为第一评分总和，计算a’+b’的和作为解码结果集合A’和B’的前5个解码结果中的、具有高频属性的解码结果的评分分值的总和，作为第二评分总和。

在上述分别计算得到第一评分总和以及第二评分总和的基础上，计算所述第一评分总和与所述第二评分总和的比值，作为所述目标群体对所述待评测输入法关于该类型词频属性的文本单元的前k个解码结果的满意度。

具体的，上述的第一评分总和与上述的第二评分总和的比值，表示了上述待评测输入法对具有该种类型的词频属性的文本单元进行解码时的前k个解码结果的用户满意度。

例如，假设上述的该种类型的词频属性为高频属性，上述的待评测输入法为拼音输入法，测试集只有前文所述的包含94264926”这一编码信息的测试集，则，与该编码信息对应的文本单元集合{[745264,想要,高频_2_冠军][54736,想玩,高频_2][43590,香烟,高频_2][16480,香皂,中频_2][6002,张燕,中频_2][5329,张艳,中频_2][2291,像要,低频_2][1781,张岩,低频_2]}的top1文本单元中的高频文本单元的评分分值的总和为“想要”的评分分值＝1.5×3²＝13.5；top2文本单元中的高频文本单元的评分分值的总和为“想要”的评分分值+“想玩”的评分分值＝1.5×3²+3²＝22.5；top5文本单元中的高频文本单元的评分分值的总和为“想要”的评分分值+“想玩”的评分分值+“香烟”的评分分值＝1.5×3²+3²+3²＝31.5。

与该编码信息对应的解码结果集合{想要，香皂，香烟，像要，张湾，张燕，张岩，张彦，张妍，张瑶，张耀，香艳，张万，张延，张艳，张婉}的top1解码结果中的高频解码结果的评分分值的总和为“想要”的评分分值＝1.5×3²＝13.5；top2解码结果中的高频解码结果的的评分分值的总和为“想要”的评分分值＝1.5×3²＝13.5，因为第二个解码结果“香皂”的词频属性为中频，不是高频；top5解码结果中的高频解码结果的评分分值的总和为“想要”和“香烟”的评分分值的和＝1.5×3²+3²＝22.5。

则，该拼音输入法对高频文本单元进行解码的top1解码结果的用户满意度＝(top1高频解码结果的评分分值的总和/top1高频文本单元的评分分值的总和)*100％＝(13.5/13.5)*100％＝100％；该拼音输入法对高频文本单元进行解码的top2解码结果的用户满意度＝(top2高频解码结果的评分分值的总和/top2高频文本单元的评分分值的总和)*100％＝(13.5/22.5)*100％＝60％；该拼音输入法对高频文本单元进行解码的top5解码结果的用户满意度＝(top5高频解码结果的评分分值的总和/top5高频文本单元的评分分值的总和)*100％＝(22.5/31.5)*100％＝71.4％。

进一步的，上述待评测输入法对于中频文本单元进行解码时的前k个解码结果的用户满意度均可以参照本申请上述实施例介绍执行。

可以理解，本申请实施例区分不同的词频属性，对待评测输入法关于各种不同的词频属性的文本的前k个解码结果的用户满意度进行评测，是对待评测输入法的解码效果的进一步细化评测，可以使用户更加具体地了解待评测输入法对不同词频属性的文本的解码效果。

进一步的，本申请实施例还进一步分析待评测输入法的解码效果短板，也就是分析确定待评测输入法对高频、中频、低频文本进行解码时，对哪种词频属性的文本进行解码的效果不佳。对待评测输入法的短板进行分析需要提取错例，也就是提取解码效果下降的例子，此时需要对比待评测输入法的当前版本和待评测输入法的历史版本的解码效果。在通过本申请前述实施例介绍实现对待评测输入法的当前版本的评测的基础上，本申请实施例还对待评测输入法的历史版本进行评测，然后，通过将对于两种版本的待评测输入法的评测结果进行比较，从中提取错例，也就是提取解码效果下降的例子，以及基于提取的错例分析确定当前版本的待评测输入法的解码效果短板。

作为一种可选的实现方式，本申请实施例提出的输入法评测方法还包括：

分别将每一文本单元集合对应的编码信息输入与所述待评测输入法对应的历史版本输入法，得到与每一文本单元集合对应的历史版本解码结果集合；所述历史版本解码结果集合中包括所述历史版本输入法对编码信息进行解码得到的至少一个解码结果。

具体的，本申请实施例将上述各个文本单元集合对应的编码信息分别输入上述历史版本待评测输入法，得到该历史版本待评测输入法对输入的各个编码信息进行解码得到的各个解码结果集合，该解码结果集合，也就是与输入的编码信息对应的文本单元集合相对应的历史版本解码结果集合。

确定各个解码结果集合中的各个解码结果的词频属性和各个历史版本解码结果集合中的各个历史版本解码结果的词频属性，以及确定各个历史版本解码结果集合中的各个历史版本解码结果的评分分值。

具体的，上述的确定各个解码结果结合中的各个解码结果的词频属性的处理，可以按照本申请前述实施例中介绍的确定各个解码结果结合中的各个解码结果的词频属性的处理过程实现，此处不再重复。

上述的确定各个历史版本解码结果集合中的各个历史版本解码结果的词频属性的处理，也可以参照前述实施例中介绍的确定各个解码结果集合中的各个解码结果的词频属性的处理过程实现。

具体的，对应每个历史版本解码结果集合中的每个历史版本解码结果，分别通过执行以下处理确定其词频属性：

将与该历史版本解码结果所在的历史版本解码结果集合对应的文本单元集合中的、与该历史版本解码结果的内容相同的文本单元的词频属性，设定为该历史版本解码结果的词频属性。

上述确定历史版本解码结果的词频属性的处理过程，可以参照本申请前述实施例中介绍的确定各个解码结果集合中的各个解码结果的词频属性的处理过程实现，此处不再详细论述。

对应每种类型的词频属性，分别执行以下处理：

计算各个解码结果集合的前I个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和，作为第三评分总和，以及计算各个历史版本解码结果集合的前I个历史版本解码结果中的、具有该类型词频属性的历史版本解码结果的评分分值的总和，作为第四评分总和；其中I为正整数；

具体的，上述的分别计算各个解码结果集合的前I个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和，以及计算各个历史版本解码结果集合中的前I个历史版本解码结果中的、具有该类型词频属性的历史版本解码结果的评分分值的总和的具体处理过程，可以参见本申请前述实施例中介绍的分别计算各个文本单元集合的前k个文本单元中的、具有该类型词频属性的文本单元的评分分值的总和，以及计算各个解码结果集合的前k个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和的具体处理过程执行，此处不再重复论述。

需要说明的是，对应每种类型的词频属性(包括高频、中频、低频)，均按照上述的计算方案计算得到各个解码结果集合的前I个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和，以及计算得到各个历史版本解码结果集合中的前I个历史版本解码结果中的、具有该类型词频属性的历史版本解码结果的评分分值的总和。

在执行上述计算处理，得到对应每种词频属性的“第三评分总和”和“第四评分总和”的基础上，通过执行如下处理评测当前版本待评测输入法的短板：

至少通过将所述第三评分总和与所述第四评分总和进行对比，确定所述待评测输入法相对于所述历史版本输入法的、关于该类型词频属性的文本单元的前I个解码结果的用户满意度变化情况。

具体的，对应高频属性，真正高频下降的例子为当前版本待评测输入法对高频词的解码结果的评分减去历史版本待评测输入法对高频词的解码结果的评分的差值为负值的例子。

即，在对应高频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值为负值，则可以说明当前版本待评测输入法关于高频词的解码效果下降。

而真正中频下降的例子为当前版本待评测输入法对高频词的解码结果的评分减去历史版本待评测输入法对高频词的解码结果的评分的差值不为正值，并且当前版本待评测输入法对中频词的解码结果的评分减去历史版本待评测输入法对中频词的解码结果的评分的差值为负值的例子。

即，在对应高频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值不为正值，并且，在对应中频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值为负值，则可以说明该当前版本待评测输入法关于中频词的解码效果下降。

真正低频下降的例子为当前版本待评测输入法对高频词的解码结果的评分减去历史版本待评测输入法对高频词的解码结果的评分的差值不为正值，并且，当前版本待评测输入法对中频词的解码结果的评分减去历史版本待评测输入法对中频词的解码结果的评分的差值不为正值，以及，当前版本待评测输入法对低频词的解码结果的评分减去历史版本待评测输入法对低频词的解码结果的评分的差值为负值的例子。

即，在对应高频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值不为正值，并且，在对应中频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值不为正值，以及，在对应低频属性按照上述计算方案分别计算得到第三评分总和以及第四评分总和后，如果第三评分总和减去第四评分总和的差值为负值，则可以说明该当前版本待评测输入法关于中频词的解码效果下降。

例如，假设上述待评测输入法为拼音输入法，参照前述实施例介绍，假设9key下针对输入的编码信息“94264926”有两个版本的top1的结果，版本一的结果：1.想要；版本二的结果：1.香皂。

参照前文实施例的介绍，版本一中高频解码结果的评分分值是13.5；中频解码结果的评分分值为0。版本二中高频解码结果的评分分值为0；中频解码结果的评分分值为2²＝4。假如版本2是当前版本，版本1是历史版本，则高频解码结果的评分差值＝0-13.5＝-13.5，可以确定高频结果下降。中频解码结果的评分差值＝4-0＝4，4大于0，此时不能得到版本2的中频解码结果比版本1好，即版本1的中频解码结果比版本2差的结论是不成立的。这是因为版本一的高频解码结果得分比版本二的高频解码结果评分高时，版本一的中频解码结评分比版本二的中频解码结果评分低时很难自动判断总体效果。

进一步的，若9key下针对输入的编码信息“94264926”有两个版本的解码结果，版本一的结果1.想要2香皂3张燕4像要5张燕；版本二的结果1.想要2香皂3像要4张岩5想；版本二为当前版本，版本一为对比版本；则两个版本的top5高频解码结果的评分分差＝13.5-13.5＝0；top5中频解码结果的评分分差＝4-(4+4)＝-4；top5低频解码结果的评分分差＝(1+1)-(1+1)＝0。对比可见，两个版本的高频解码结果的评分一致，则高频解码效果基本不变；中频解码结果的评分分差为负值且高频分差不为正，则中频效果下降。

参照上述的计算对比方法，可以分别确定当前版本待评测输入法相对于历史版本待评测输入法的、关于高频、中频、低频的文本的前I个解码结果的用户满意度变化情况。根据对应个词频属性的前I个解码结果的用户满意度变化情况，可以提取错例对当前版本待评测输入法的短板进行评测。

作为一种可选的实现方式，上述的至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果，包括：

根据各个文本单元集合及其对应的解码结果集合中的相同的文本单元内容的存在状态，确定对所述待评测输入法的评测结果。

具体的，文本单元集合及其对应的解码结果集合中的相同的文本单元内容的存在状态，具体可以是指文本单元集合及其对应的解码结果集合中包含的相同文本单元的数量、相同文本单元在集合中的位置等。

本申请实施例设定，对于某一解码结果集合而言，如果其中包含的解码结果的内容与其对应的文本单元集合中的文本单元的内容相同，则认为该解码结果集合与其对应的文本单元集合包含相同的文本单元。

示例性的，解码结果集合与其对应的文本单元集合中的相同文本单元的数量越多，并且该相同文本单元在解码结果集合中的位置与在文本单元集合中的位置越相似，则可以说明该解码结果集合与其对应的文本单元集合的相似度越高，也就说明待评测输入法的解码结果越符合用户预期的解码结果。

基于上述理论，可以根据各个文本单元集合及其对应的解码结果集合中的相同的文本单元内容的存在状态，确定对待评测输入法的评测结果。

例如，如果待评测输入法输出的解码结果集合与其对应的文本单元集合包含的相同文本单元的数量越多，并且该相同文本单元在解码结果集合中的位置与在文本单元集合中的位置越相似，则所述目标群体对待评测输入法的评测结果更佳。

另外需要说明的是，由于不同字长的文本单元和解码结果在判定其词频属性时的评判标准不同，而不同的词频属性直接影响文本单元和解码结果的评分分值，进而影响对待评测输入法的评测结果。因此，本申请上述实施例介绍的输入法评测方法是对应相同字长的文本单元和解码结果进行评测的，例如上文各实施例中的举例均以两个字字长的文本单元和解码结果进行的评测。

而事实上，从目标群体的历史输入文本中提取出的文本单元可能是任意字长的文本单元。对此，可以参照本申请上述各实施例的介绍，分别对应相同字长的文本单元对待评测输入法进行评测，从而得出对待评测输入法关于特定字长的文本的解码效果的评测结果。例如，对于3个字字长、4个字字长、5个字字长的文本的解码效果的评测，均可以参照本申请上述实施例介绍实现，本申请实施例不再一一详述。

与上述的输入法评测方法相对应的，本申请实施例还提出一种输入法评测装置，参见图3所示，该装置包括：

测试集确定单元100，用于从目标群体的历史输入文本中确定出至少一个文本单元集合，每一文本单元集合中的各文本单元对应同一编码信息；其中，所述同一编码信息的编码规范与待评测输入法的编码规范一致；

测试数据获取单元110，用于分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；

评测结果确定单元120，用于至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果。

本申请实施例提出的输入法评测装置从目标群体的历史输入文本中确定出文本单元集合，并且每个文本单元集合对应同一编码信息；将与每个文本单元集合对应的编码信息输入待评测输入法得到与每个文本单元集合对应的解码结果集合；根据各个文本单元集合及其对应的解码结果集合，确定对待评测输入法的评测结果。上述的评测装置实现了对待评测输入法的解码效果的评测，应用该评测装置可以使用户及开发者了解待评测输入法的解码效果。

进一步的，本申请上述的输入法评测装置将同一编码信息及其对应的文本单元集合作为测试集对待评测输入法进行评测，该评测装置所应用的测试集包含的预期结果不唯一，对应同一编码信息的较多的预期结果可以减少将待评测输入法的解码结果误判为错误的解码结果的情况发生，因此能够提高对待评测输入法评测的客观性。

作为一种示例性的实现方式，所述测试集确定单元100从目标群体的历史输入文本中确定出至少一个文本单元集合时，具体用于：

获取目标群体在设定时间段内的历史输入文本；

对所述历史输入文本进行文本单元划分处理，得到各个文本单元，以及分别确定与各个文本单元对应的编码信息；

由所述各个文本单元中的、与同一编码信息对应的各个文本单元，组成与该同一编码信息对应的文本单元集合。

作为一种示例性的实现方式，所述装置还包括：

评分处理单元，用于确定各个文本单元集合中的各个文本单元的评分分值，以及确定各个解码结果集合中的各个解码结果的评分分值；其中，所述评分分值至少基于词频属性确定，所述词频属性为高频，或中频，或低频；

则，所述评测结果确定单元120至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果时，具体用于：

根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果。

作为一种示例性的实现方式，所述确定各个文本单元集合中的各个文本单元的评分分值，包括：

分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性；

至少根据各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性，以及预设的基于词频属性的评分规则，分别确定各个文本单元集合中的各个文本单元的评分分值。

作为一种示例性的实现方式，所述分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性，包括：

对应各个文本单元集合中的每个文本单元，分别根据其字长和其在所述目标群体的历史输入文本中出现的次数，确定其词频属性。

作为一种示例性的实现方式，所述基于词频属性的评分规则为评分分值大小与词频属性和/或词频排名相关的评分规则。

作为一种示例性的实现方式，所述确定各个解码结果集合中的各个解码结果的评分分值，包括：

对应每个解码结果集合中的每个解码结果，分别将与该解码结果所在的解码结果集合对应的文本单元集合中的、与该解码结果的内容相同的文本单元的词频属性，设定为该解码结果的词频属性；

至少根据各个解码结果集合中的各个解码结果的词频属性，以及预设的基于词频属性的评分规则，分别确定各个解码结果集合中的各个解码结果的评分分值。

作为一种示例性的实现方式，所述根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果，包括：

对应每个文本单元集合，分别将该文本单元集合中的各个文本单元按照在所述目标群体的历史输入文本中出现的次数由高到低的顺序进行排序；

计算各个文本单元集合的前n个文本单元的评分分值的总和，以及计算各个解码结果集合的前n个解码结果的评分分值的总和；其中n为正整数；

通过计算所述各个文本单元集合的前n个文本单元的评分分值的总和，以及所述各个解码结果集合的前n个解码结果的评分分值的总和的比值，确定所述目标群体对所述待评测输入法的评测结果。

对应每种类型的词频属性，分别执行以下处理：

计算各个文本单元集合的前k个文本单元中的、具有该类型词频属性的文本单元的评分分值的总和，作为第一评分总和，以及计算各个解码结果集合的前k个解码结果中的、具有该类型词频属性的解码结果的评分分值的总和，作为第二评分总和；其中，k为正整数；

计算所述第一评分总和与所述第二评分总和的比值，作为所述目标群体对所述待评测输入法关于该类型词频属性的文本单元的前k个解码结果的满意度。

作为一种示例性的实现方式，所述方法还包括：

分别将每一文本单元集合对应的编码信息输入与所述待评测输入法对应的历史版本输入法，得到与每一文本单元集合对应的历史版本解码结果集合；所述历史版本解码结果集合中包括所述历史版本输入法对编码信息进行解码得到的至少一个解码结果；

确定各个解码结果集合中的各个解码结果的词频属性和各个历史版本解码结果集合中的各个历史版本解码结果的词频属性，以及确定各个历史版本解码结果集合中的各个历史版本解码结果的评分分值；

对应每种类型的词频属性，分别执行以下处理：

至少通过将所述第三评分总和与所述第四评分总和进行对比，确定所述待评测输入法相对于所述历史版本输入法的、关于该类型词频属性的文本的前I个解码结果的用户满意度变化情况。

作为一种示例性的实现方式，确定各个历史版本解码结果集合中的各个历史版本解码结果的词频属性，包括：

对应每个历史版本解码结果集合中的每个历史版本解码结果，分别通过执行以下处理确定其词频属性：

作为一种示例性的实现方式，所述至少根据各个文本单元集合及其对应的解码结果集合，确定所述目标群体对所述待评测输入法的评测结果，包括：

根据各个文本单元集合及其对应的解码结果集合中的相同的文本单元内容的存在状态，确定所述目标群体对所述待评测输入法的评测结果。

具体的，上述的输入法评测装置的各实施例中的各个单元的具体工作内容，请参见上述方法实施例的内容此处不再赘述。

与上述的输入法评测方法和装置相对应的，本申请实施例还提出一种输入法评测设备，参见图4所示，该设备包括：

存储器200和处理器210；

其中，所述存储器200与所述处理器210连接，用于存储程序；

所述处理器210，用于通过运行所述存储器200中存储的程序，实现上述任一实施例公开的输入法评测方法的各个处理步骤。

具体的，上述投屏处理设备还可以包括：总线、通信接口220、输入设备230和输出设备240。

处理器210、存储器200、通信接口220、输入设备230和输出设备240通过总线相互连接。其中：

总线可包括一通路，在计算机系统各个部件之间传送信息。

处理器210可以是通用处理器，例如通用中央处理器(CPU)、微处理器等，也可以是特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

处理器210可包括主处理器，还可包括基带芯片、调制解调器等。

存储器200中保存有执行本发明技术方案的程序，还可以保存有操作系统和其他关键业务的程序。具体地，程序可以包括程序代码，程序代码包括计算机操作指令。更具体的，存储器200可以包括只读存储器(read-only memory，ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory，RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。

输入设备230可包括接收用户输入的数据和信息的装置，例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。

输出设备240可包括允许输出信息给用户的装置，例如显示屏、打印机、扬声器等。

通信接口220可包括使用任何收发器一类的装置，以便与其他设备或通信网络通信，如以太网，无线接入网(RAN)，无线局域网(WLAN)等。

处理器2102执行存储器200中所存放的程序，以及调用其他设备，可用于实现本申请实施例所提供的输入法评测方法的各个步骤。

本申请另一实施例还提供了一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器运行时，实现上述任一实施例提供的输入法评测方法的各个步骤。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本申请各实施例种装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。

本申请所提供的几个实施例中，应该理解到，所揭露的终端，装置和方法，可以通过其它的方式实现。例如，以上所描述的终端实施例仅仅是示意性的，例如，模块或子模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个子模块或模块可以结合或者可以集成到另一个模块，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的，作为模块或子模块的部件可以是或者也可以不是物理模块或子模块，即可以位于一个地方，或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中，也可以是各个模块或子模块单独物理存在，也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现，也可以采用软件功能模块或子模块的形式实现。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件单元，或者二者的结合来实施。软件单元可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种输入法评测方法，其特征在于，包括：

分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；其中，所述解码结果集合中包含的各个解码结果是所述待评测输入法对输入的编码信息进行解码后依次输出的各个解码结果的排序集合；

确定各个文本单元集合中的各个文本单元的评分分值，以及确定各个解码结果集合中的各个解码结果的评分分值；其中，所述评分分值至少基于词频属性确定，所述词频属性为高频，或中频，或低频；

2.根据权利要求1所述的方法，其特征在于，所述从目标群体的历史输入文本中确定出至少一个文本单元集合，包括：

获取目标群体在设定时间段内的历史输入文本；

3.根据权利要求1所述的方法，其特征在于，所述确定各个文本单元集合中的各个文本单元的评分分值，包括：

4.根据权利要求3所述的方法，其特征在于，所述分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于词频属性的评分规则为评分分值大小与词频属性和/或词频排名相关的评分规则。

6.根据权利要求1所述的方法，其特征在于，所述确定各个解码结果集合中的各个解码结果的评分分值，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果，包括：

计算各个文本单元集合的前n个文本单元的评分分值的和的总和，以及计算各个解码结果集合的前n个解码结果的评分分值的和的总和；其中n为正整数；

通过计算所述各个文本单元集合的前n个文本单元的评分分值的和的总和，以及所述各个解码结果集合的前n个解码结果的评分分值的和的总和的比值，确定所述目标群体对所述待评测输入法的评测结果。

8.根据权利要求1所述的方法，其特征在于，所述根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果，包括：

对应每种类型的词频属性，分别执行以下处理：

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对应每种类型的词频属性，分别执行以下处理：

10.根据权利要求1所述的方法，其特征在于，所述确定所述目标群体对所述待评测输入法的评测结果，还包括：

11.一种输入法评测装置，其特征在于，包括：

测试数据获取单元，用于分别将每一文本单元集合对应的编码信息输入待评测输入法，得到与每一文本单元集合对应的解码结果集合，所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果；其中，所述解码结果集合中包含的各个解码结果是所述待评测输入法对输入的编码信息进行解码后依次输出的各个解码结果的排序集合；

评测结果确定单元，用于根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值，以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值，确定所述目标群体对所述待评测输入法的评测结果。

12.一种输入法评测设备，其特征在于，包括：

存储器和处理器；

其中，所述存储器与所述处理器连接，用于存储程序；

所述处理器，用于通过运行所述存储器中存储的程序，实现如权利要求1至10中任意一项所述的输入法评测方法。

13.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现如权利要求1至10中任意一项所述的输入法评测方法。