CN105100353B

CN105100353B - 一种对移动终端的新增联系人进行通讯录分组的方法

Info

Publication number: CN105100353B
Application number: CN201510565735.3A
Authority: CN
Inventors: 陈包容
Original assignee: 陈包容
Current assignee: Changsha ge'ermen Intelligent Technology Co., Ltd
Priority date: 2015-09-08
Filing date: 2015-09-08
Publication date: 2017-11-14
Anticipated expiration: 2035-09-08
Also published as: CN105100353A

Abstract

本发明公开了一种对移动终端的新增联系人进行通讯录分组的方法，通过获取移动终端及其通讯录好友共享的通讯录信息，判断移动终端的新增联系人是否位于通讯录好友的联系人当中，若是，则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，若是，则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，若否，则基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题，节省了手动对新增联系人进行通讯录分组的时间，提高了分类效率，提升了用户体验。

Description

一种对移动终端的新增联系人进行通讯录分组的方法

技术领域

本发明涉及通讯录分组领域，特别地，涉及一种对移动终端的新增联系人进行通讯录分组的方法。

背景技术

通常，在终端设备的通讯录中设置有通讯录分组功能，用户可以根据自己的使用习惯或需求制定多个通讯录组别，如家人、同事、朋友、大学同学、中学同学组别等，并将隶属于该通讯录组别的新增联系人手动加入其中，从而方便用户按通讯录组别进行操作，如群发短信等。但是，这种手动添加新增联系人到设置的通讯录组别中的方法，大大增加了用户操作的时间，而且操作方法十分繁琐。

发明内容

本发明提供了一种对移动终端的新增联系人进行通讯录分组的方法，以解决现有采用手动添加新增联系人到设置的通讯录组别中导致操作复杂、过程繁琐的技术问题。

本发明提供的对移动终端的新增联系人进行通讯录分组的方法，包括：

获取移动终端及其通讯录好友共享的通讯录信息，通讯录信息包括联系人以及联系人的隶属通讯录组别；

判断移动终端的新增联系人是否位于通讯录好友的联系人当中，若是，则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，第一隶属通讯录组别为新增联系人在通讯录好友的联系人当中的隶属通讯录组别，第二隶属通讯录组别为通讯录好友在移动终端的联系人中的隶属通讯录组别，若是，则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别；

若否，则基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。

进一步地，将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别包括：

获取新增联系人与通讯录好友的历史联系文本作为第一历史联系文本，以及通讯录好友与移动终端的历史联系文本作为第二历史联系文本，并基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度；

判断逻辑关联度是否大于预设的逻辑关联度阈值，若是，则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别。

进一步地，基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

提取第一历史联系文本中的关键词作为第一关键词，并将第一关键词转换成词向量作为第一词向量；

提取第二历史联系文本中的关键词作为第二关键词，并将第二关键词转换成词向量作为第二词向量；

计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。

进一步地，计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

计算第一词向量与第二词向量之间的相似度作为文本逻辑关联度；

计算新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为第一通话逻辑关联度，计算新增联系人和移动终端之间的通话时长与新增联系人和通讯录好友之间的通话时长的比值作为第二通话逻辑关联度，计算移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度，其中，选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯，并选择第一通话逻辑关联度，或第二通话逻辑关联度，或第三通话逻辑关联度，或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度；

将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。

进一步地，基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组包括：

获取移动终端与通讯录好友的历史联系文本作为第三历史联系文本，以及移动终端与新增联系人的历史联系文本作为第四历史联系文本；

提取第三历史联系文本中的关键词作为第三关键词，并将第三关键词转换成词向量作为第三词向量；

提取第四历史联系文本中的关键词作为第四关键词，并将第四关键词转换成词向量作为第四词向量；

计算第三词向量与第四词向量之间的相似度，并将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别。

进一步地，计算第三词向量与第四词向量之间的相似度包括：

利用预先建立的语义信息库对第三关键词进行语义匹配，获得第三关键词的同义词或近义词作为关联词，并将关联词转换成词向量，得到关联词向量，其中，语义信息库包括：基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库相关联的语义关系库；

计算第三词向量与第四词向量之间的相似度，作为第一相似度，以及计算关联词向量与第四词向量之间的相似度，作为第二相似度；

将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度。

进一步地，将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度包括：

利用预先建立的语义信息库以及语义规则库，对第三关键词进行语义推理，获得第三关键词的推理词，并将推理词转换成词向量，得到推理词向量，其中，语义规则库包括：自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库，其中自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则；

计算推理词向量与第四词向量之间的相似度，作为第三相似度，将第一相似度、第二相似度以及第三相似度的加权相似度作为第三词向量与第四词向量之间的相似度。

进一步地，第三词向量为多个，计算第三词向量与第四词向量之间的相似度，作为第一相似度包括：

依次计算第四词向量和多个第三词向量中的每一个第三词向量的相似度集合；

获取相似度集合中值最大的相似度作为第一相似度。

进一步地，将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别包括：

判断最大的相似度是否大于预设的相似度阈值，若是，则将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别；

若否，则新建通讯录组别，并将新增联系人归类到新建通讯录组别。

进一步地，历史联系文本包括历史聊天文本和/或历史语音文本，历史语音文本为转换成文本格式的历史语音数据。

本发明具有以下有益效果：

本发明的对移动终端的新增联系人进行通讯录分组的方法，通过移动终端及其通讯录好友共享的通讯录信息判断移动终端的新增联系人是否位于通讯录好友的联系人当中，并在判定新增联系人位于通讯录好友的联系人当中后，再判断新增联系人在通讯录好友的联系人当中的隶属通讯录组别是否与通讯录好友在移动终端的联系人当中的隶属通讯录组别是否相同，并在判定结果为是时将新增联系人在通讯录好友的联系人当中的隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，以及在判定新增联系人不位于通讯录好友的联系人当中后，基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题，实现了利用移动终端及其通讯录好友共享的通讯录信息进行逻辑推理，从而间接获取新增联系人在移动终端中的隶属通讯录组别或者基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，大量节省了手动对新增联系人进行通讯录分组的时间，提高了分类效率，提升了用户体验。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明优选实施例的对移动终端的新增联系人进行通讯录分组的方法的流程图；

图2是本发明针对第一个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图；

图3是本发明针对第二个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图；

图4是本发明针对第二个精简的实施例中计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度的方法流程图；

图5是本发明针对第三个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

参照图1，本发明的优选实施例提供了一种对移动终端的新增联系人进行通讯录分组的方法，包括：

步骤S101，获取移动终端及其通讯录好友共享的通讯录信息，通讯录信息包括联系人以及联系人的隶属通讯录组别；

步骤S102，判断移动终端的新增联系人是否位于通讯录好友的联系人当中，若是，则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，第一隶属通讯录组别为新增联系人在通讯录好友的联系人当中的隶属通讯录组别，第二隶属通讯录组别为通讯录好友在移动终端的联系人中的隶属通讯录组别，若是，则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，若否，则基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。

本发明公开的对移动终端的新增联系人进行通讯录分组的方法，通过移动终端及其通讯录好友共享的通讯录信息判断移动终端的新增联系人是否位于通讯录好友的联系人当中，并在判定新增联系人位于通讯录好友的联系人当中后，再判断新增联系人在通讯录好友的联系人当中的隶属通讯录组别是否与通讯录好友在移动终端的联系人当中的隶属通讯录组别是否相同，并在判定结果为是时将新增联系人在通讯录好友的联系人当中的隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，以及在判定新增联系人不位于通讯录好友的联系人当中后，基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题，实现了利用移动终端及其通讯录好友共享的通讯录信息进行逻辑推理，从而间接获取新增联系人在移动终端中的隶属通讯录组别或者基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，大量节省了手动对新增联系人进行通讯录分组的时间，提高了分类效率，提升了用户体验。

需要说明的是，由于移动终端的新增联系人可能位于移动终端的多个通讯录好友的联系人中，并且在每个通讯录好友中的隶属通讯录组别不相同，故本实施例推理出符合要求的隶属通讯录组别可能为多个，针对这种情况，本实施例可以选取任意一个隶属通讯录组别或选取数量最多的隶属通讯录组别作为最终的新增联系人在移动终端的联系人中的隶属通讯录组别。

可选地，将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别包括：

由于根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理，从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题，例如当系统检测到移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”，且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”，若直接将“朋友”通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别，则可能出现分类不准确的问题，即C的朋友并不一定是A的朋友。针对该问题，本实施例通过选取逻辑关联度指标来定量描述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。具体地，本实施例通过获取新增联系人与通讯录好友的历史联系文本作为第一历史联系文本，以及通讯录好友与移动终端的历史联系文本作为第二历史联系文本，并基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例通过获取第一历史联系文本与第二历史联系文本来分析第一隶属通讯录组别与第二通讯录组别的逻辑关联度，并在逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，避免了根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理，从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题，提高了分类的准确性和精确度。

可选地，基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

本实施例中的词向量是指词语的向量表示，最简单的表示方法是稀疏描述法(One-hot Representation)，该方法将词表中的每个词表示成一个由0和1组成的向量，其中，只有一个维度值为1，其余维度值都为0，向量的维度为词表的大小，词表由所有需要进行向量化词语组成，词语的个数即为词表的大小，例如，一个词表包含10个词语，则该词表的所有词语转换成10维的向量，例如，“话筒”的词向量表示为[0,0,0,0,1,0,0,0,0,0]，“麦克”的词向量表示为[0,1,0,0,0,0,0,0,0,0]，向量中数值为1的位置对应该词在词表的位置，即“话筒”位于词表中第6个位置，“麦克”位于词表中第2个位置。另一种表示方法为分布式描述方法(Distributed Representation)，该方法是一种低维词向量表示方法。例如，一个词表同样包含10个词语时，“话筒”的词向量可以仅通过五维向量进行表示，例如[0.792,-0.177,-0.107,0.109,-0.542]，这种方式能够大大减少向量的维数。

由于稀疏描述法一方面存在“词汇鸿沟”的问题，即得到的词向量之间相互孤立，从两个词向量中不能得出两个词之间的相似关系，另一方面该方法容易出现“维数灾难”，即词向量维数过大，导致训练难度、内存占用量过大。分布式描述方法最大的优势在于能够让相关或者相似的词转换得到的词向量在距离上更接近，所谓的距离即余弦夹角的距离。此外，分布式描述方法表示的词向量具有较低的维度，适合于进行机器训练，训练的效率都较高，所占用的内存相对于稀疏描述法较少。因此，本实施例采用分布式描述方法将关键词转换为词向量。

本实施例中的相似度是指第一关键词与第二关键词之间的相似程度，可以是语义的相似程度，也可以是词法的相似程度，通过与第一关键词和第二关键词对应的词向量之间的距离来表示。两个词向量的距离越短，说明该两个词向量对应的词的相似度越大，进一步说明两个词在语义或是词法上更为接近。常用的描述向量距离的方式有欧氏距离、余弦夹角等。通过计算两个词向量的夹角余弦值来表示该词向量对应的两个词的相似度的计算公式为：其中，X、Y分别表示词向量X和词向量Y。cosθ的取值范围为[0，1]，cosθ越接近1时，则表示两词语之间的相似度越高，反之，cosθ值越接近0，则表示两词语之间的相似度越低。通过计算词向量的夹角余弦值能够较为直观的反映出两个关键词的相似度。

可选地，计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

尽管本实施例通过计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度，并在判定逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，但仍然可能出现推理结果不精确的问题。例如当系统检测到移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“X公司同事”，且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“X公司同事”，且通过计算发现逻辑关联度满足预设的逻辑关联度阈值，此时若将“X公司同事”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别可能出现不准确情况，因为可能出现新增联系人B早已经从X公司离职而通讯录好友C并没有及时更改通讯录，以致导致推理结论不准确，即新增联系人B不是移动终端A的“X公司同事”。

针对该问题，本实施例计算新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为第一通话逻辑关联度，计算新增联系人和移动终端之间的通话时长与新增联系人和通讯录好友之间的通话时长的比值作为第二通话逻辑关联度，计算移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度，其中，选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯，并选择第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度，以及将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度，这样大大的提高了推理的精确度。

本实施例选取第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度，主要是依据新增联系人分别与移动终端以及与通讯录好友之间的通话密切度情况、以及移动终端对新增联系人发起通讯的选择方式的概率情况来设计的。具体地，假设新增联系人B和移动终端A之间的通话频率(或通话时长)与新增联系人B和通讯录好友C之间的通话频率(或通话时长)的比值越大，则说明依据新增联系人B在通讯录好友C的联系人中的隶属通讯录组别推出新增联系人B在移动终端A的联系人中的隶属通讯录组别的逻辑推理正确率越高。同样地，本实施例较新颖的利用移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度，其中，选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯，这主要是基于在日常通讯场景中，通讯发起方向通讯接收方发起通讯主要包括三种选择方式，具体为从通讯录、从历史通话记录、从短信通讯模块对通讯接收方发起通讯，而根据经验可知，通讯发起方对于联系较密切的通讯接收方大多数时候会选择从历史通话记录发起通讯、而对于联系较少或不常联系的通讯接收方，则大多数时候会选择从通讯录对通讯接收方发起通讯，本实施例较新颖的利用这种概率事件，将移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度，在实际实施过程中一般选择移动终端从历史通话记录对新增联系人发起通讯的加权系数大于移动终端从通讯录或短信通讯模块对新增联系人发起通讯的加权系数。例如，若移动终端A对新增联系人B发起通讯的次数为100次，其中，移动终端A从历史通话记录对新增联系人B发起通讯的次数为70次，移动终端A从通讯录对新增联系人B发起通讯的次数为20次，移动终端A从短信通讯模块对新增联系人B发起通讯的次数为10次，则可以得到移动终端对新增联系人发起通讯的选择方式的概率加权和为P＝m1*p1+m2*p2+m3*p3，其中P为移动终端对新增联系人发起通讯的选择方式的概率加权和，m1、m2、m3分别为加权系数，p1、p2、p3分别为移动终端对新增联系人发起通讯的选择方式的概率，例如移动终端A从历史通话记录对新增联系人B发起通讯的概率为：p1＝70/100＝0.7。由此可以看出，移动终端从历史通话记录相对于从通讯录或短信通讯模块对新增联系人发起通讯的概率越大，说明移动终端与新增联系人的关系更密切，故依据新增联系人在通讯录好友的联系人中的隶属通讯录组别推出新增联系人在移动终端的联系人中的隶属通讯录组别的逻辑推理正确率越高。

本实施例基于通话频率、通话时长以及发起通讯的选择方式概率分别设计第一通话逻辑关联度、第二通话逻辑关联度、第三通话逻辑关联度，并将第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度充分考虑了新增联系人分别与移动终端以及与通讯录好友之间的关联度，使得通话逻辑关联度的指标设计具有充分的合理性和代表性，以及使得依据新增联系人在通讯录好友的联系人中的隶属通讯录组别推出新增联系人在移动终端的联系人中的隶属通讯录组别的逻辑推理正确率越高。

需要说明的是，本实施例在计算通话频率、通话时长或发起通讯的选择方式概率时可以取任意一个设定时间段的通话频率、通话时长或发起通讯的选择方式概率，一般来说，可以取最近的时间段。且本实施例的文本逻辑关联度与通话逻辑关联度的加权系数可以根据用户自定义。

可选地，基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组包括：

本实施例在判定新增联系人不位于通讯录好友的联系人当中后，采用基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。具体地，通过计算移动终端和通讯录好友之间的历史联系文本与移动终端和新增联系人之间的历史联系文本之间的相似度，将新增联系人归类到最大的相似度对应的通讯录好友的隶属通讯录组别，解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题，实现了基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，大量节省了手动对新增联系人进行通讯录分组的时间，提高了分类效率，提升了用户体验。

可选地，计算第三词向量与第四词向量之间的相似度包括：

由于仅仅根据第三词向量和第四词向量的相似度决定新增联系人所属的通讯录组别可能出现准确度不高的问题，故本实施例通过对第三关键词进行语义匹配，获得第三关键词的同义词或近义词作为关联词，然后再基于第三关键词向量计算第一相似度以及基于关联词向量计算第二相似度，最后将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度。本实施例中第一相似度和第二相似度的加权系数可以根据实际情况或用户自定义进行设定，在具体的实施过程中，一般定义第一相似度的加权系数大于第二相似度的加权系数。

此外，本实施例除了根据预先建立的语义信息库获得关联词外，还可以采用模糊搜索机制在预先建立的数据库和/或互联网上搜索第三关键词的同义词或近义词作为关联词。本实施例通过结合基于第三关键词向量计算的第一相似度以及基于关联词向量计算的第二相似度，获取新增联系人所属的通讯录组别，解决了仅仅依据基于第三词向量与第四词向量计算出的相似度获取新增联系人所属的通讯录组别准确度不高的问题，并且结合基于关联词计算的第二相似度，使得计算出的相似度更加切合实际情况，同时也更精准。

可选地，将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度包括：

由于在实际实施过程中，仅仅根据第三关键词和关联词计算出的第一相似度和第二相似度并没有考虑第三关键词内部隐藏的语义信息，故本实施例利用预先建立的语义信息库以及语义规则库，对第三关键词进行语义推理，获得推理词，并基于推理词向量和第四词向量计算第三相似度，以及将第一相似度、第二相似度以及第三相似度的加权相似度作为最终的相似度。采用增设第三相似度的加权相似度作为最终的相似度，充分考虑了第三关键词的语义信息和根据第三关键词获得的推理信息，从而使得计算出的最终的相似度更切合实际情况，以及更精准。

可选地，第三词向量为多个，计算第三词向量与第四词向量之间的相似度，作为第一相似度包括：

获取相似度集合中值最大的相似度作为第一相似度。

当第三关键词为多个时，其对应的第三词向量也为多个，此时依次计算第四词向量与每一个第三词向量的相似度，得到一个相似度集合。本实施例可以通过统计相似度集合中的最大值作为第一相似度。例如，假设移动终端的通讯录中包括A通讯录好友，且经过对第三历史联系文本提取关键词后，获得第三词向量为{A1}，{A2}，则在计算A与新增联系人D的第四词向量{D1}的相似度时，分别计算第三词向量{A1}与第四词向量{D1}以及第三词向量{A2}与第四词向量{D1}的夹角余弦值，并选取最大的夹角余弦值作为第一相似度。可选地，本实施例不限于采用最大的夹角余弦值作为第一相似度，例如本实施例还可以选取{A1}与{D1}以及{A2}与{D1}的夹角余弦值的平均值作为第一相似度。通过选取多个第三关键词向量，避免了第三词向量选取不准确的问题，提高了第一相似度计算的准确性和可靠性，同时为后续选取第三关键词的关联词和推理词奠定了基础。

可选地，本实施例中的关联词向量也可以为多个，且当关联词向量为多个时，本实施例计算第二相似度与当第三词向量为多个时计算第一相似度的方法类似。具体地，当关联词向量为多个时，依次计算第四词向量与每一个关联词向量的相似度，，得到一个相似度集合，并获取相似度集合中值最大的相似度作为第二相似度。可选地，推理词向量也可以为多个，且当推理词向量为多个时，本实施例计算第三相似度与当第三词向量为多个时计算第一相似度的方法类似。

可选地，将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别包括：

由于在实际情况中，移动终端预先设置的通讯录分组有限，如果将任何一个新增联系人根据相似度值直接归类到预先设置的通讯录分组中，可能出现由于通讯录分组的数量太少导致对新增联系人的通讯录分组不准确或不合理。针对该问题，本实施例在将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别之前判断最大的相似度是否大于预设的相似度阈值，若是，则将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别，若否，则新建通讯录组别，并将新增联系人归类到新建通讯录组别。通过设置预设的相似度阈值智能地将新增联系人分类到通讯录好友的隶属通讯录组别或新建的通讯录组别中，从而实现了对新增联系人的隶属通讯录组别的准确分类。可选地，新建通讯录组别，并将新增联系人归类到新建通讯录组别之后还包括：根据第四关键词对新建通讯录组别的名称进行命名。

可选地，历史联系文本包括历史聊天文本和/或历史语音文本，历史语音文本为转换成文本格式的历史语音数据。

本实施例中的历史联系文本可以是历史聊天文本，也可以是历史语音文本或两者的结合，其中历史语音文本为转换成文本格式的历史语音数据，且历史语音数据又包括通话历史语音数据或聊天历史语音数据。

可选地，移动终端的新增联系人为移动终端新增加的联系人或移动终端中没有隶属通讯录组别的联系人。具体地，本实施例可以对移动终端新增加的联系人进行通讯录自动分类，也可以对移动终端中没有隶属通讯录组别的联系人进行通讯录自动分类。

可选地，通讯录好友为移动终端的通讯录中的部分通讯录好友或全部通讯录好友。本实施例中移动终端可以选择部分通讯录好友或全部通讯录好友作为对新增联系人进行通讯录分组的参考和依据对象。

下面以三个精简的实施例对本实施例的对移动终端的新增联系人进行通讯录分组的方法进行更进一步的说明，其中，第一个精简的实施例进行通讯录分组的情景为：移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”，且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”。参照图2，该方法主要包括以下步骤：

步骤S201，获取移动终端A及其通讯录好友C共享的通讯录信息，通讯录信息包括联系人以及联系人的隶属通讯录组别。具体地，本实施例中的通讯录信息包括移动终端A、通讯录好友C的通讯录信息。

步骤S202，判断移动终端A的新增联系人B是否位于通讯录好友C的联系人当中。由于本实施例新增联系人B位于通讯录好友C的联系人当中，故执行步骤S203。

步骤S203，判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，第一隶属通讯录组别为新增联系人B在通讯录好友C的联系人当中的隶属通讯录组别，第二隶属通讯录组别为通讯录好友C在移动终端A的联系人中的隶属通讯录组别，若是，将第一隶属通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。

具体地，本实施例中第一隶属通讯录组别为“朋友”，与第二隶属通讯录组别相同，故本实施例将新增联系人B自动归类到通讯录组别为“朋友”的组别，从而实现了对新增联系人B的自动分组。

本实施例的第二个精简的实施例进行通讯录分组的情景为：移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”，且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”。参照图3，该方法主要包括以下步骤：

步骤S301，获取移动终端A及其通讯录好友C共享的通讯录信息，通讯录信息包括联系人以及联系人的隶属通讯录组别。具体地，本实施例中的通讯录信息包括移动终端A、通讯录好友C的通讯录信息。

步骤S302，判断移动终端A的新增联系人B是否位于通讯录好友C的联系人当中。由于本实施例新增联系人B位于通讯录好友C的联系人当中，故执行步骤S303。

步骤S303，判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，第一隶属通讯录组别为新增联系人B在通讯录好友C的联系人当中的隶属通讯录组别，第二隶属通讯录组别为通讯录好友C在移动终端A的联系人中的隶属通讯录组别。具体地，本实施例中第一隶属通讯录组别为“朋友”，与第二隶属通讯录组别相同，则执行步骤S304。

步骤S304，获取新增联系人B与通讯录好友C的历史联系文本作为第一历史联系文本，以及通讯录好友C与移动终端A的历史联系文本作为第二历史联系文本；

步骤S305，提取第一历史联系文本中的关键词作为第一关键词，并将第一关键词转换成词向量作为第一词向量，提取第二历史联系文本中的关键词作为第二关键词，并将第二关键词转换成词向量作为第二词向量。本实施例中的第一关键词和第二关键词的数量可以为多个，且为了提高词向量训练的效率，本实施例在获取关键词之前先对历史联系文本进行分词、去除停用词等预处理操作，然后通过统计特征项文本的词频数获取关键词。本实施例通过对历史联系文本进行预处理，去除停用词，一方面降低了词向量训练过程的复杂度，降低词向量训练的效率，另一方面提高了词向量训练的训练质量，从而提高了训练得到的词向量之间相似度的准确性。

步骤S306，计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例通过第一关键词和第二关键词对应的词向量之间的距离来表示相似度，常用的描述向量距离的方式有欧氏距离、余弦夹角等。例如，当本实施例得到第一词向量为T1(2.5,1,0,1,0,1.1)，第二词向量为T2(2.832,0.258,0,0,0.258,0)，可以得到两个词向量之间的夹角余弦值为cosθ＝0.835。

参照图4，可选地，步骤S306，计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

步骤S3061，计算第一词向量与第二词向量之间的相似度作为文本逻辑关联度。根据步骤S306可以得到两个词向量之间的夹角余弦值为cosθ＝0.835，由于词向量之间的夹角余弦值的取值范围为[0,1]，故本实施例无需再将夹角余弦值进行归一化，而直接将夹角余弦值直接作为两个词向量的相似度，即文本逻辑关联度。

步骤S3062，将新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为通话逻辑关联度。

步骤S3063，将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例可以由用户自定义文本逻辑关联度与通话逻辑关联度的加权系数，假设本实施例取文本逻辑关联度的加权系数为m1＝0.5，通话逻辑关联度的加权系数为m2＝0.5，且文本逻辑关联度为cosθ1＝0.835，通话逻辑关联度为cosθ2＝0/100＝0，本实施例采用新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为通话逻辑关联度，具体为新增联系人和移动终端之间的通话次数0次，新增联系人和通讯录好友之间的通话次数100次，此时可以计算出最终的逻辑关联度N＝m1*cosθ1+m2*cosθ2＝0.418。

步骤S307，判断逻辑关联度是否大于预设的逻辑关联度阈值，若是，则将第一隶属通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。

具体地，如果不考虑通话逻辑关联度，而直接将文本逻辑关联度cosθ1＝0.835作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度，且假设预设的逻辑关联度阈值为T_th＝0.7，则可知此时可以将第一隶属通讯录组别“朋友”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。但如果考虑通话逻辑关联度，且将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度，即N＝0.418，假设预设的逻辑关联度阈值同样为T_th＝0.7，则判断出不能将第一隶属通讯录组别“朋友”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。很明显地，考虑通话逻辑关联度作为逻辑关联度的一部分，可以得出更准确的分类结果，且使得逻辑关联度指标的设计也更合理。

本实施例通过获取第一历史联系文本与第二历史联系文本来分析第一隶属通讯录组别与第二通讯录组别的逻辑关联度，并在逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别，避免了根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理，从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题，提高了分类的准确性和精确度。

本实施例的第三个精简的实施例进行通讯录分组的情景为：移动终端A的通讯录中包括C和D两个通讯录好友，移动终端A的新增联系人B不在移动终端A的任何通讯录好友的联系人当中，且通讯录好友C在移动终端A的联系人中的隶属通讯录组别为“朋友”，通讯录好友D在移动终端A的联系人中的隶属通讯录组别为“同事”。参照图5，该方法主要包括以下步骤：

步骤S401，获取移动终端与通讯录好友的历史联系文本作为第三历史联系文本，以及移动终端与新增联系人的历史联系文本作为第四历史联系文本。具体地，本实施例的第三历史联系文本包括移动终端A与通讯录好友C的历史联系文本以及移动终端A与通讯录好友D的历史联系文本，第四历史联系文本为移动终端A与新增联系人B的历史联系文本。

步骤S402，提取第三历史联系文本中的关键词作为第三关键词，并将第三关键词转换成词向量作为第三词向量，提取第四历史联系文本中的关键词作为第四关键词，并将第四关键词转换成词向量作为第四词向量。

步骤S403，利用预先建立的语义信息库以及语义规则库对第三关键词进行语义匹配和语义推理，获得第三关键词的关联词和推理词，并对应转换成关联词向量和推理词向量。

步骤S404，计算第三词向量与第四词向量之间的相似度，作为第一相似度，计算关联词向量与第四词向量之间的相似度，作为第二相似度，以及计算推理词向量与第四词向量之间的相似度，作为第三相似度。例如，当本实施例得到第四词向量为T4(2.5,1,0,1,0,1.1)，与通讯录好友C对应的第三词向量为T_C3(0.354,0,0.708,2.064,0.258,0)，关联词向量为T_C5(0,0.258,1.416,1.032,0,0)，推理词向量为T_C6(0,0,0.708,0.516,0,0)时，则可以依次得到与通讯录好友C对应的第一相似度为cosθ_C3＝0.431，第二相似度为cosθ_C5＝0.237，第三相似度为cosθ_C6＝0.191；同理，与通讯录好友D对应的第三词向量为T_D3(1.77,0.258,0,0,0,0.354)，关联词向量具体为T_D5(2.832,0.258,0,0,0.258,0)，推理词向量具体为T_D6(0.708,1.032,0.354,0.258,0,0)时，则可以依次得到与通讯录好友D对应的第一相似度为cosθ_D3＝0.904，第二相似度为cosθ_D5＝0.835，第三相似度为cosθ_D6＝0.750。

步骤S405，将第一相似度、第二相似度以及第三相似度的加权相似度作为第三词向量与第四词向量之间的相似度，并将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别。本实施例取与第一、第二、第三相似度分别对应的加权系数为k1＝0.6，k2＝0.2，k3＝0.2，则可以计算出与通讯录好友C对应的最终的相似度为：L_C＝k1*cosθ_C3+k2*cosθ_C5+k3*cosθ_C6＝0.333，与通讯录好友D对应的最终的相似度为：L_D＝k1*cosθ_D3+k2*cosθ_D5+k3*cosθ_D6＝0.859，故可以看出，新增联系人B与通讯录好友D的相似度大于新增联系人B与通讯录好友C的相似度，故最终将新增联系人B归类到通讯录好友D在移动终端A的联系人当中的隶属通讯录组别，即“同事”通讯录组别。

本实施例通过结合基于第三关键词向量计算的第一相似度以及基于关联词向量计算的第二相似度，以及基于推理词向量计算的第三相似度，计算出第三词向量与第四词向量之间的相似度，并基于该相似度将新增联系人归类到最大的相似度对应的通讯录好友的隶属通讯录组别，解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题，实现了基于移动终端与通讯录好友的历史联系文本，以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组，大量节省了手动对新增联系人进行通讯录分组的时间，提高了分类效率，提升了用户体验。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种对移动终端的新增联系人进行通讯录分组的方法，其特征在于，包括：

步骤一、获取移动终端及其通讯录好友共享的通讯录信息，所述通讯录信息包括联系人以及所述联系人的隶属通讯录组别；

步骤二、判断所述移动终端的新增联系人是否位于所述通讯录好友的联系人当中，若否，进入步骤三，若是，则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同，所述第一隶属通讯录组别为所述新增联系人在所述通讯录好友的联系人当中的隶属通讯录组别，所述第二隶属通讯录组别为所述通讯录好友在所述移动终端的联系人中的隶属通讯录组别，若否，进入步骤三，若是，则将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别；

步骤三、基于所述移动终端与所述通讯录好友的历史联系文本，以及所述移动终端与所述新增联系人的历史联系文本对所述移动终端的新增联系人进行通讯录分组。

2.根据权利要求1所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别包括：

获取所述新增联系人与所述通讯录好友的历史联系文本作为第一历史联系文本，以及所述通讯录好友与所述移动终端的历史联系文本作为第二历史联系文本，并基于所述第一历史联系文本和所述第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度；

判断所述逻辑关联度是否大于预设的逻辑关联度阈值，若是，则将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别。

3.根据权利要求2所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，基于所述第一历史联系文本和所述第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

提取所述第一历史联系文本中的关键词作为第一关键词，并将所述第一关键词转换成词向量作为第一词向量；

提取所述第二历史联系文本中的关键词作为第二关键词，并将所述第二关键词转换成词向量作为第二词向量；

计算所述第一词向量与所述第二词向量之间的相似度作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。

4.根据权利要求3所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，计算所述第一词向量与所述第二词向量之间的相似度作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括：

计算所述第一词向量与所述第二词向量之间的相似度作为文本逻辑关联度；

计算所述新增联系人和所述移动终端之间的通话频率与所述新增联系人和所述通讯录好友之间的通话频率的比值作为第一通话逻辑关联度，计算所述新增联系人和所述移动终端之间的通话时长与所述新增联系人和所述通讯录好友之间的通话时长的比值作为第二通话逻辑关联度，计算所述移动终端对所述新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度，其中，所述选择方式包括从通讯录对所述新增联系人发起通讯、从历史通话记录对所述新增联系人发起通讯、从短信通讯模块对所述新增联系人发起通讯，并选择所述第一通话逻辑关联度，或所述第二通话逻辑关联度，或所述第三通话逻辑关联度，或所述第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度；

将所述文本逻辑关联度与所述通话逻辑关联度的加权和作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。

5.根据权利要求1所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，基于所述移动终端与所述通讯录好友的历史联系文本，以及所述移动终端与所述新增联系人的历史联系文本对所述移动终端的新增联系人进行通讯录分组包括：

获取所述移动终端与所述通讯录好友的历史联系文本作为第三历史联系文本，以及所述移动终端与所述新增联系人的历史联系文本作为第四历史联系文本；

提取所述第三历史联系文本中的关键词作为第三关键词，并将所述第三关键词转换成词向量作为第三词向量；

提取所述第四历史联系文本中的关键词作为第四关键词，并将所述第四关键词转换成词向量作为第四词向量；

计算所述第三词向量与所述第四词向量之间的相似度，并将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别。

6.根据权利要求5所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，计算所述第三词向量与所述第四词向量之间的相似度包括：

利用预先建立的语义信息库对所述第三关键词进行语义匹配，获得所述第三关键词的同义词或近义词作为关联词，并将所述关联词转换成词向量，得到关联词向量，其中，所述语义信息库包括：基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与所述基本概念库、所述常识知识库、所述句型关系模板库、所述用户综合信息库、所述互联网信息库、所述自定义预输入信息库相关联的语义关系库；

计算所述第三词向量与所述第四词向量之间的相似度，作为第一相似度，以及计算所述关联词向量与所述第四词向量之间的相似度，作为第二相似度；

将所述第一相似度和所述第二相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度。

7.根据权利要求6所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，将所述第一相似度和所述第二相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度包括：

利用预先建立的所述语义信息库以及语义规则库，对所述第三关键词进行语义推理，获得所述第三关键词的推理词，并将所述推理词转换成词向量，得到推理词向量，其中，所述语义规则库包括：自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库，其中所述自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则；

计算所述推理词向量与所述第四词向量之间的相似度，作为第三相似度，将所述第一相似度、所述第二相似度以及所述第三相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度。

8.根据权利要求7所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，所述第三词向量为多个，计算所述第三词向量与所述第四词向量之间的相似度，作为第一相似度包括：

依次计算所述第四词向量和多个所述第三词向量中的每一个所述第三词向量的相似度集合；

获取所述相似度集合中值最大的相似度作为第一相似度。

9.根据权利要求8所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别包括：

判断最大的所述相似度是否大于预设的相似度阈值，若是，则将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别；

若否，则新建通讯录组别，并将所述新增联系人归类到所述新建通讯录组别。

10.根据权利要求9所述的对移动终端的新增联系人进行通讯录分组的方法，其特征在于，

所述历史联系文本包括历史聊天文本和/或历史语音文本，所述历史语音文本为转换成文本格式的历史语音数据。