CN111984131B

CN111984131B - 一种基于动态权重进行信息输入的方法及系统

Info

Publication number: CN111984131B
Application number: CN202010646321.4A
Authority: CN
Inventors: 宝音
Original assignee: BEIJING LANGUAGE AND CULTURE UNIVERSITY
Current assignee: BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2021-05-14
Anticipated expiration: 2040-07-07
Also published as: CN111984131A

Abstract

本发明公开了一种基于动态权重进行信息输入的方法和系统，权重方法包括：将同时存在于第一历和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二和第一输入次数确定每个目标词语的权重系数，并且将权重系数大于阈值的目标词语选择作为权重词语，以确定多个权重词语；根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重；当接收到用户输入字符时，获取与所述字符相对应的多个待选词语，基于与字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。

Description

一种基于动态权重进行信息输入的方法及系统

技术领域

本发明涉及信息技术领域，并且更具体地，涉及一种基于动态权重进行信息输入的方法及系统。

背景技术

目前，随着互联网技术的不断进步以及移动终端性能的不断提升，移动终端所具备的功能越来越多。通常情况下，信息输入功能是移动终端中非常重要的功能。例如，信息输入功能可以用于移动终端内的即时通讯应用、购物应用和文档处理应用等。因为需要被频繁使用，所以信息输入功能也被寄予了更高的期望，如输入的快捷性、准确率、效率等等。

在现有技术中，当用户希望通过移动终端进行信息输入时，通常需要输入一些字符，而移动终端中的信息输入应用会根据这些字符来确定多个词语并将这些词语进行提供或呈现以供用户选择。然而，在现有技术中，通常是基于固定的顺序或用户的输入习惯来确定多个词语的顺序。这种方式无法满足用户需求，这是因为这种方法无法根据动态信息来实时修改多个词语的顺序。

发明内容

根据本发明的一个方面，提供一种基于动态权重进行信息输入的方法，所述方法包括：

获取第一时间区间内的第一历史输入信息集，并对第一历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第一输入次数；

确定每个词语所归属的信息集合，从而确定每个信息集合所涉及的所有词语的第一输入次数的总和，根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子，基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重；

获取第二时间区间内的第二历史输入信息集，并对第二历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第二输入次数；

将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数，并且将权重系数大于阈值的目标词语选择作为权重词语，以确定多个权重词语；

根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重；利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重；

当接收到用户输入字符时，获取与所述字符相对应的多个待选词语，基于与所述字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。

在获取第一时间区间内的第一历史输入信息集之前还包括：

根据类别信息将用于进行信息输入的信息库划分为多个信息集合，其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称；

获取预先设置的输入规则，根据预先设置的输入规则为每个信息集合确定基础权重。

其中至少一个词语同时属于多个信息集合；

所述输入规则包括每个信息集合的默认权重和动态权重，其中由内容服务器为每个信息集合设置默认权重，并且由用户设备为每个信息集合设置动态权重；

根据预先设置的输入规则为每个信息集合确定基础权重包括：

根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。

所述第一时间区间包括时间上连续的第一预定数量的自然日。

确定每个词语所归属的信息集合包括：确定每个词语所归属的至少一个信息集合。

确定每个信息集合所涉及的所有词语的第一输入次数的总和包括：

确定每个信息集合所涉及的所有词语；

统计所有词语中每个词语的第一输入次数；

将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。

根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括：

获取每个信息集合所涉及的所有词语的第一输入次数的总和CA_i，其中i为自然数并且1≤i≤Nc，其中Nc为信息集合的数量；

第i个信息集合的第一权重调整因子wm_i为：

基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括：

获取每个信息集合的第一权重调整因子wm_i；

获取每个信息集合的基础权重wb_i；

确定每个信息集合的初始权重wt_i＝wb_i×(1+wm_i)。

所述第二时间区间包括时间上连续的第二预定数量的自然日，

其中，所述第二预定数量小于所述第一预定数量，

或者第二预定数量的自然日是所述第一预定数量的自然日的子集。

所述基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括：

确定每个目标词语的第一输入次数CF_y；

确定每个目标词语的第二输入次数CS_y；

每个目标词语的权重系数

其中y为自然数并且1≤y≤Nw，其中Nw为目标词语的数量。

所述阈值为1、0.9、0.8、0.6或0.5。

所述根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括：

获取每个权重词语的第二输入次数CS_j，确定每个权重词语的动态系数为：

其中j为自然数并且1≤j≤Nm，其中Nm为权重词语的数量。

其中根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：

确定每个权重词语所归属的信息集合，并将具有至少一个权重词语的信息集合确定为权重信息集合；

确定每个权重信息集合所包括的至少一个权重词语；

根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。

其中根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：

确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数F_pq，其中F_pq为第p个权重信息集合中第q个权重词语的动态系数；

获取每个权重信息集合的初始权重wt_p；

确定每个权重信息集合的动态权重Fw_p＝wt_p×(1+F_p1/1+F_p2/2+F_p3/3+…+F_pq/q),

其中p和q为自然数并且1≤p≤Nk，1≤q≤k_p,Nk为权重信息集合的数量，并且k_p为第p个权重信息集合的权重词语的数量。

其中利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括：

将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重；

基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括：

确定每个待选词语与所述字符的内容关联度Cr_v；

基于每个待选词语的词语权重W_v和与所述字符的内容关联度Cr_v确定每个待选词语与所述字符的经过修改的内容关联度CLr_v＝Cr_v×(1+W_v)；

其中，v为自然数并且1≤v≤No，No为待选词语的数量。

根据本发明的另一方面，提供一种基于动态权重进行信息输入的系统，所述系统包括：

获取装置，获取第一时间区间内的第一历史输入信息集，并对第一历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第一输入次数；获取第二时间区间内的第二历史输入信息集，并对第二历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第二输入次数；

确定装置，确定每个词语所归属的信息集合，从而确定每个信息集合所涉及的所有词语的第一输入次数的总和，根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子，基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重；将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数，并且将权重系数大于阈值的目标词语选择作为权重词语，以确定多个权重词语；

修改装置，根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重；利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重；

提供装置，当接收到用户输入字符时，获取与所述字符相对应的多个待选词语，基于与所述字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。

还包括初始化装置，用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合，其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称；

其中至少一个词语同时属于多个信息集合；

初始化装置根据预先设置的输入规则为每个信息集合确定基础权重包括：

初始化装置根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。

所述确定装置确定每个词语所归属的信息集合包括：确定装置确定每个词语所归属的至少一个信息集合。

所述确定装置确定每个信息集合所涉及的所有词语的第一输入次数的总和包括：

确定装置确定每个信息集合所涉及的所有词语；

确定装置统计所有词语中每个词语的第一输入次数；

确定装置将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。

所述确定装置根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括：

确定装置获取每个信息集合所涉及的所有词语的第一输入次数的总和CA_i，其中i为自然数并且1≤i≤Nc，其中Nc为信息集合的数量；

第i个信息集合的第一权重调整因子wm_i为：

确定装置基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括：

确定装置获取每个信息集合的第一权重调整因子wm_i；

确定装置获取每个信息集合的基础权重wb_i；

确定装置确定每个信息集合的初始权重wt_i＝wb_i×(1+wm_i)。

其中，所述第二预定数量小于所述第一预定数量，

所述确定装置基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括：

确定装置确定每个目标词语的第一输入次数CF_y；

确定装置确定每个目标词语的第二输入次数CS_y；

确定装置确定每个目标词语的权重系数

其中y为自然数并且1≤y≤Nw，其中Nw为目标词语的数量。

所述阈值为1、0.9、0.8、0.6或0.5。

所述修改装置根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括：

修改装置获取每个权重词语的第二输入次数CS_j，确定每个权重词语的动态系数为：

其中j为自然数并且1≤j≤Nm，其中Nm为权重词语的数量。

其中修改装置根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：

修改装置确定每个权重词语所归属的信息集合，并将具有至少一个权重词语的信息集合确定为权重信息集合；

修改装置确定每个权重信息集合所包括的至少一个权重词语；

修改装置根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。

其中修改装置根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：

修改装置确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数F_pq，其中F_pq为第p个权重信息集合中第q个权重词语的动态系数；

修改装置获取每个权重信息集合的初始权重wt_p；

修改装置确定每个权重信息集合的动态权重Fw_p＝wt_p×(1+F_p1/1+F_p2/2+F_p3/3+…+F_pq/q),

其中修改装置利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括：

修改装置将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重；

其中提供装置基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括：

确定每个待选词语与所述字符的内容关联度Cr_v；

其中，v为自然数并且1≤v≤No，No为待选词语的数量。

附图说明

通过参考下面的附图，可以更为完整地理解本发明的示例性实施方式：

图1为根据本发明的基于动态权重进行信息输入的方法的流程图；

图2为根据本发明的提供多个待选词语的示意图；

图3为根据本发明的基于动态权重进行信息输入的系统的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式，然而，本发明可以用许多不同的形式来实施，并且不局限于此处描述的实施例，提供这些实施例是为了详尽地且完全地公开本发明，并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中，相同的单元/元件使用相同的附图标记。

除非另有说明，此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外，可以理解的是，以通常使用的词典限定的术语，应当被理解为与其相关领域的语境具有一致的含义，而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明的基于动态权重进行信息输入的方法100的流程图。方法100根据第一时间区间内的第一历史输入信息集和第二时间区间内的第二历史输入信息集，确定每个词语的第一输入次数和第二输入次数，同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数并以此确定多个权重词语。方法100根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重，并且当接收到用户输入字符时，获取与所述字符相对应的多个待选词语，基于与所述字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。

方法100从步骤101处开始。在步骤101，获取第一时间区间内的第一历史输入信息集，并对第一历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第一输入次数。第一时间区间可以包括时间上连续的第一预定数量的自然日。第一时间区间还可以是时间上不连续的第一预定数量的自然日。此外，第一时间区间可以是一段连续的时间区段。图2为根据本发明的提供多个待选词语的示意图。如图2所示，第一时间区间为一段连续的时间区段。

此外，在获取第一时间区间内的第一历史输入信息集之前还包括：根据类别信息将用于进行信息输入的信息库划分为多个信息集合，其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称。其中，类别信息例如是体育、音乐、历史等。类别信息还可以是篮球、足球、排球等。根据类别信息将用于进行信息输入的信息库划分为多个信息集合例如是，根据每个词语所归属的类别对信息库中的所有词语进行分类，以划分为多个信息集合。其中至少一个词语同时属于多个信息集合。例如，词语“界外”可能同时属于信息集合“篮球”、“足球”和“排球”。

获取预先设置的输入规则，根据预先设置的输入规则为每个信息集合确定基础权重。其中预先设置的输入规则可以是由服务器设置的或是由用户设备设置的。所述输入规则包括每个信息集合的默认权重和动态权重。例如，由内容服务器为每个信息集合设置默认权重，并且由用户设备为每个信息集合设置动态权重。默认权重可以是例如在足球运动非常流行的国家，例如，巴西，信息集合“足球”的默认权重大于信息集合“篮球”的默认权重。动态权重是由用户设备或使用用户设备的用户来设置的。例如，用户是篮球评论员，并且因此将信息集合“篮球”的动态权重设置为大于信息集合“足球”的动态权重。

根据预先设置的输入规则为每个信息集合确定基础权重包括：根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。其中所有信息集合的默认权重的格式为百分比，并且所有信息集合的默认权重的和为100％。动态权重例如可以是针对特定信息集合的增加比例。例如，信息集合A、B和C的默认权重分别为1/3、1/3和1/3。动态权重为信息集合A增加100％，即1/3+1/3＝2/3。通过动态权重对信息集合A进行处理后，信息集合A、B和C的默认权重变为2/3、1/3和1/3。将变更后的默认权重进行处理，使得信息集合A、B和C的基础权重wb变为1/2、1/4和1/4，即由2/3、1/3和1/3的比例来获得的。

在步骤102，确定每个词语所归属的信息集合，从而确定每个信息集合所涉及的所有词语的第一输入次数的总和，根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子，基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重。确定每个词语所归属的信息集合包括：确定每个词语所归属的至少一个信息集合。

确定每个信息集合所涉及的所有词语的第一输入次数的总和包括：确定每个信息集合所涉及的所有词语；统计所有词语中每个词语的第一输入次数；将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。

根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括：获取每个信息集合所涉及的所有词语的第一输入次数的总和CA_i，其中i为自然数并且1≤i≤Nc，其中Nc为信息集合的数量。CA_i为第i个信息集合所涉及的所有词语的第一输入次数的总和。

根据下面的公式计算第i个信息集合的第一权重调整因子wm_i：

其中i为自然数并且1≤i≤Nc，其中Nc为信息集合的数量。

基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括：获取每个信息集合的第一权重调整因子wm_i；获取每个信息集合的基础权重wb_i；确定每个信息集合的初始权重wt_i＝wb_i×(1+wm_i)。应当了解的是，可以针对每个信息集合的初始权重wt_i确定新的比例，并根据新的比例确定初始权重wt_i的值。即，在通过上面公式确定初始权重后，对初始权重进行处理以使得所有信息集合的初始权重的和为100％。可替换地，可以不对初始权重进行处理以使得所有信息集合的初始权重的和为100％，即直接使用初始权重的计算值。

在步骤103，获取第二时间区间内的第二历史输入信息集，并对第二历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第二输入次数。所述第二时间区间包括时间上连续的第二预定数量的自然日。其中，所述第二预定数量小于所述第一预定数量。或者第二预定数量的自然日是所述第一预定数量的自然日的子集。如图2所示，第二时间区间为一段连续的时间区段并且，第二时间区间是第一时间区间的子集。

在步骤104，将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数，并且将权重系数大于阈值的目标词语选择作为权重词语，以确定多个权重词语。

基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括：确定每个目标词语的第一输入次数CF_y；确定每个目标词语的第二输入次数CS_y；根据第一输入次数和第二输入次数计算每个目标词语的权重系数

其中y为自然数并且1≤y≤Nw，其中Nw为目标词语的数量。举例来说，阈值可以为1、0.9、0.8、0.6或0.5。

在步骤105，根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重；利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重。

根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括：获取每个权重词语的第二输入次数CS_j，确定每个权重词语的动态系数为：

其中j为自然数并且1≤j≤Nm，其中Nm为权重词语的数量。

其中根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：确定每个权重词语所归属的信息集合，并将具有至少一个权重词语的信息集合确定为权重信息集合；确定每个权重信息集合所包括的至少一个权重词语；根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。

其中根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数F_pq，其中F_pq为第p个权重信息集合中第q个权重词语的动态系数；获取每个权重信息集合的初始权重wt_p；确定每个权重信息集合的动态权重Fw_p＝wt_p×(1+F_p1/1+F_p2/2+F_p3/3+…+F_pq/q),

其中利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括：将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重。

在步骤106，当接收到用户输入字符时，获取与所述字符相对应的多个待选词语，基于与所述字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。

基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括：确定每个待选词语与所述字符的内容关联度Cr_v；基于每个待选词语的词语权重W_v和与所述字符的内容关联度Cr_v确定每个待选词语与所述字符的经过修改的内容关联度CLr_v＝Cr_v×(1+W_v)；其中，v为自然数并且1≤v≤No，No为待选词语的数量。其中Cr_v是第v个待选词语与所述字符的内容关联度。W_v是第v个待选词语的词语权重。CLr_v是第v个待选词语与所述字符的经过修改的内容关联度。

本发明基于每个待选词语的内容关联度的降序顺序对多个待选词语进行排序并将待选词语按内容关联度分为呈降序顺序的多个待选词语组。例如，多个待选词语组中分别包括多个待选词语A1-A9、B1-B9、C1-C9等。本发明按照内容关联度的降序顺序依次提供所述多个待选词语组，如图2所示。当根据本发明的上述方式确定每个待选词语的经过修改的内容关联度时，例如，待选词语B3的经过修改的内容关联度小于待选词语A2并且大于待选词语A4。为此，将待选词语B3排在待选词语A2和待选词语A4之间。而待选词语A3的经过修改的内容关联度小于待选词语A9并且大于待选词语B1。为此，将待选词语A3排在待选词语A9和待选词语B1之间。

图3为根据本发明的基于动态权重进行信息输入的系统300的结构示意图。系统300包括：获取装置301、确定装置302、修改装置303、提供装置304和初始化装置305。

获取装置301获取第一时间区间内的第一历史输入信息集，并对第一历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第一输入次数；获取第二时间区间内的第二历史输入信息集，并对第二历史输入信息集内多个词语中的每个词语进行次数统计，以确定每个词语的第二输入次数。第一时间区间包括时间上连续的第一预定数量的自然日。第二时间区间包括时间上连续的第二预定数量的自然日，其中，所述第二预定数量小于所述第一预定数量，或者第二预定数量的自然日是所述第一预定数量的自然日的子集。

确定装置302确定每个词语所归属的信息集合，从而确定每个信息集合所涉及的所有词语的第一输入次数的总和，根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子，基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重；将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语，基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数，并且将权重系数大于阈值的目标词语选择作为权重词语，以确定多个权重词语。

确定装置302确定每个词语所归属的信息集合包括：确定装置确定每个词语所归属的至少一个信息集合。确定装置302确定每个信息集合所涉及的所有词语的第一输入次数的总和包括：确定装置302确定每个信息集合所涉及的所有词语；确定装置302统计所有词语中每个词语的第一输入次数；确定装置302将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。

确定装置302根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括：确定装置302获取每个信息集合所涉及的所有词语的第一输入次数的总和CA_i，其中i为自然数并且1≤i≤Nc，其中Nc为信息集合的数量；

第i个信息集合的第一权重调整因子wm_i为：

确定装置302基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括：确定装置302获取每个信息集合的第一权重调整因子wm_i；确定装置302获取每个信息集合的基础权重wb_i；确定装置302确定每个信息集合的初始权重wt_i＝wb_i×(1+wm_i)。

确定装置302基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括：确定装置302确定每个目标词语的第一输入次数CF_y；确定装置302确定每个目标词语的第二输入次数CS_y；确定装置302确定每个目标词语的权重系数

其中y为自然数并且1≤y≤Nw，其中Nw为目标词语的数量。阈值为1、0.9、0.8、0.6或0.5。

修改装置303根据每个权重词语的第二输入次数确定每个权重词语的动态系数，根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重；利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重。

修改装置303根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：修改装置303确定每个权重词语所归属的信息集合，并将具有至少一个权重词语的信息集合确定为权重信息集合；修改装置303确定每个权重信息集合所包括的至少一个权重词语；修改装置303根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。

修改装置303根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括：修改装置303确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数F_pq，其中F_pq为第p个权重信息集合中第q个权重词语的动态系数；修改装置303获取每个权重信息集合的初始权重wt_p；

修改装置303确定每个权重信息集合的动态权重Fw_p＝wt_p×(1+F_p1/1+F_p2/2+F_p3/3+…+F_pq/q),

其中修改装置303利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括：修改装置303将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重。

修改装置303根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括：修改装置303获取每个权重词语的第二输入次数CS_j，确定每个权重词语的动态系数为：

其中j为自然数并且1≤j≤Nm，其中Nm为权重词语的数量。

当接收到用户输入字符时，提供装置304获取与所述字符相对应的多个待选词语，基于与所述字符的内容关联度和词语权重对多个待选词语进行排序，并按照排序的顺序来提供所述多个待选词语。其中提供装置304基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括：提供装置304确定每个待选词语与所述字符的内容关联度C_rv；提供装置304基于每个待选词语的词语权重W_r和与所述字符的内容关联度C_rv确定每个待选词语与所述字符的经过修改的内容关联度CL_rv＝C_rv×(1+W_r)。

初始化装置305用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合，其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称；获取预先设置的输入规则，根据预先设置的输入规则为每个信息集合确定基础权重。其中至少一个词语同时属于多个信息集合。所述输入规则包括每个信息集合的默认权重和动态权重，其中由内容服务器为每个信息集合设置默认权重，并且由用户设备为每个信息集合设置动态权重。初始化装置305根据预先设置的输入规则为每个信息集合确定基础权重包括：初始化装置305根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。

已经通过参考少量实施方式描述了本发明。然而，本领域技术人员所公知的，正如附带的专利权利要求所限定的，除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地，在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释，除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例，除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行，除非明确地说明。

Claims

1.一种基于动态权重进行信息输入的方法，所述方法包括：

2.根据权利要求1所述的方法，在获取第一时间区间内的第一历史输入信息集之前还包括：

3.根据权利要求2所述的方法，其中至少一个词语同时属于多个信息集合；

4.根据权利要求1所述的方法，所述第一时间区间包括时间上连续的第一预定数量的自然日。

5.根据权利要求1所述的方法，确定每个词语所归属的信息集合包括：确定每个词语所归属的至少一个信息集合。

6.一种基于动态权重进行信息输入的系统，所述系统包括：

7.根据权利要求6所述的系统，还包括初始化装置，用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合，其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称；

8.根据权利要求7所述的系统，其中至少一个词语同时属于多个信息集合；

9.根据权利要求6所述的系统，所述第一时间区间包括时间上连续的第一预定数量的自然日。

10.根据权利要求6所述的系统，所述确定装置确定每个词语所归属的信息集合包括：确定装置确定每个词语所归属的至少一个信息集合。