CN105100353B - 一种对移动终端的新增联系人进行通讯录分组的方法 - Google Patents

一种对移动终端的新增联系人进行通讯录分组的方法 Download PDF

Info

Publication number
CN105100353B
CN105100353B CN201510565735.3A CN201510565735A CN105100353B CN 105100353 B CN105100353 B CN 105100353B CN 201510565735 A CN201510565735 A CN 201510565735A CN 105100353 B CN105100353 B CN 105100353B
Authority
CN
China
Prior art keywords
address list
contact person
newly
term vector
mobile terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510565735.3A
Other languages
English (en)
Other versions
CN105100353A (zh
Inventor
陈包容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha ge'ermen Intelligent Technology Co., Ltd
Original Assignee
陈包容
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 陈包容 filed Critical 陈包容
Priority to CN201510565735.3A priority Critical patent/CN105100353B/zh
Publication of CN105100353A publication Critical patent/CN105100353A/zh
Application granted granted Critical
Publication of CN105100353B publication Critical patent/CN105100353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种对移动终端的新增联系人进行通讯录分组的方法,通过获取移动终端及其通讯录好友共享的通讯录信息,判断移动终端的新增联系人是否位于通讯录好友的联系人当中,若是,则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,若是,则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,若否,则基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题,节省了手动对新增联系人进行通讯录分组的时间,提高了分类效率,提升了用户体验。

Description

一种对移动终端的新增联系人进行通讯录分组的方法
技术领域
本发明涉及通讯录分组领域,特别地,涉及一种对移动终端的新增联系人进行通讯录分组的方法。
背景技术
通常,在终端设备的通讯录中设置有通讯录分组功能,用户可以根据自己的使用习惯或需求制定多个通讯录组别,如家人、同事、朋友、大学同学、中学同学组别等,并将隶属于该通讯录组别的新增联系人手动加入其中,从而方便用户按通讯录组别进行操作,如群发短信等。但是,这种手动添加新增联系人到设置的通讯录组别中的方法,大大增加了用户操作的时间,而且操作方法十分繁琐。
发明内容
本发明提供了一种对移动终端的新增联系人进行通讯录分组的方法,以解决现有采用手动添加新增联系人到设置的通讯录组别中导致操作复杂、过程繁琐的技术问题。
本发明提供的对移动终端的新增联系人进行通讯录分组的方法,包括:
获取移动终端及其通讯录好友共享的通讯录信息,通讯录信息包括联系人以及联系人的隶属通讯录组别;
判断移动终端的新增联系人是否位于通讯录好友的联系人当中,若是,则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,第一隶属通讯录组别为新增联系人在通讯录好友的联系人当中的隶属通讯录组别,第二隶属通讯录组别为通讯录好友在移动终端的联系人中的隶属通讯录组别,若是,则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别;
若否,则基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。
进一步地,将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别包括:
获取新增联系人与通讯录好友的历史联系文本作为第一历史联系文本,以及通讯录好友与移动终端的历史联系文本作为第二历史联系文本,并基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度;
判断逻辑关联度是否大于预设的逻辑关联度阈值,若是,则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别。
进一步地,基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
提取第一历史联系文本中的关键词作为第一关键词,并将第一关键词转换成词向量作为第一词向量;
提取第二历史联系文本中的关键词作为第二关键词,并将第二关键词转换成词向量作为第二词向量;
计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
进一步地,计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
计算第一词向量与第二词向量之间的相似度作为文本逻辑关联度;
计算新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为第一通话逻辑关联度,计算新增联系人和移动终端之间的通话时长与新增联系人和通讯录好友之间的通话时长的比值作为第二通话逻辑关联度,计算移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,其中,选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯,并选择第一通话逻辑关联度,或第二通话逻辑关联度,或第三通话逻辑关联度,或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度;
将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
进一步地,基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组包括:
获取移动终端与通讯录好友的历史联系文本作为第三历史联系文本,以及移动终端与新增联系人的历史联系文本作为第四历史联系文本;
提取第三历史联系文本中的关键词作为第三关键词,并将第三关键词转换成词向量作为第三词向量;
提取第四历史联系文本中的关键词作为第四关键词,并将第四关键词转换成词向量作为第四词向量;
计算第三词向量与第四词向量之间的相似度,并将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别。
进一步地,计算第三词向量与第四词向量之间的相似度包括:
利用预先建立的语义信息库对第三关键词进行语义匹配,获得第三关键词的同义词或近义词作为关联词,并将关联词转换成词向量,得到关联词向量,其中,语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入 信息库以及与基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库相关联的语义关系库;
计算第三词向量与第四词向量之间的相似度,作为第一相似度,以及计算关联词向量与第四词向量之间的相似度,作为第二相似度;
将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度。
进一步地,将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度包括:
利用预先建立的语义信息库以及语义规则库,对第三关键词进行语义推理,获得第三关键词的推理词,并将推理词转换成词向量,得到推理词向量,其中,语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
计算推理词向量与第四词向量之间的相似度,作为第三相似度,将第一相似度、第二相似度以及第三相似度的加权相似度作为第三词向量与第四词向量之间的相似度。
进一步地,第三词向量为多个,计算第三词向量与第四词向量之间的相似度,作为第一相似度包括:
依次计算第四词向量和多个第三词向量中的每一个第三词向量的相似度集合;
获取相似度集合中值最大的相似度作为第一相似度。
进一步地,将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别包括:
判断最大的相似度是否大于预设的相似度阈值,若是,则将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别;
若否,则新建通讯录组别,并将新增联系人归类到新建通讯录组别。
进一步地,历史联系文本包括历史聊天文本和/或历史语音文本,历史语音文本为转换成文本格式的历史语音数据。
本发明具有以下有益效果:
本发明的对移动终端的新增联系人进行通讯录分组的方法,通过移动终端及其通讯录好友共享的通讯录信息判断移动终端的新增联系人是否位于通讯录好友的联系人当中,并在判定新增联系人位于通讯录好友的联系人当中后,再判断新增联系人在通讯录好友的联系人当中的隶属通讯录组别是否与通讯录好友在移动终端的联系人当中的隶属通讯录组别是否相同,并在判定结果为是时将新增联系人在通讯录好友的联系人当中的隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,以及在判定新增联系人不位于通讯录好友的联系人当中后,基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题,实现了利用移动终端及其通讯录好友 共享的通讯录信息进行逻辑推理,从而间接获取新增联系人在移动终端中的隶属通讯录组别或者基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,大量节省了手动对新增联系人进行通讯录分组的时间,提高了分类效率,提升了用户体验。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的对移动终端的新增联系人进行通讯录分组的方法的流程图;
图2是本发明针对第一个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图;
图3是本发明针对第二个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图;
图4是本发明针对第二个精简的实施例中计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度的方法流程图;
图5是本发明针对第三个精简的实施例对移动终端的新增联系人进行通讯录分组的方法的流程图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
参照图1,本发明的优选实施例提供了一种对移动终端的新增联系人进行通讯录分组的方法,包括:
步骤S101,获取移动终端及其通讯录好友共享的通讯录信息,通讯录信息包括联系人以及联系人的隶属通讯录组别;
步骤S102,判断移动终端的新增联系人是否位于通讯录好友的联系人当中,若是,则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,第一隶属通讯录组别为新增联系人在通讯录好友的联系人当中的隶属通讯录组别,第二隶属通讯录组别为通讯录好友在移动终端的联系人中的隶属通讯录组别,若是,则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,若否,则基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。
本发明公开的对移动终端的新增联系人进行通讯录分组的方法,通过移动终端及其通讯录好友共享的通讯录信息判断移动终端的新增联系人是否位于通讯录好友的联系人当中,并 在判定新增联系人位于通讯录好友的联系人当中后,再判断新增联系人在通讯录好友的联系人当中的隶属通讯录组别是否与通讯录好友在移动终端的联系人当中的隶属通讯录组别是否相同,并在判定结果为是时将新增联系人在通讯录好友的联系人当中的隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,以及在判定新增联系人不位于通讯录好友的联系人当中后,基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题,实现了利用移动终端及其通讯录好友共享的通讯录信息进行逻辑推理,从而间接获取新增联系人在移动终端中的隶属通讯录组别或者基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,大量节省了手动对新增联系人进行通讯录分组的时间,提高了分类效率,提升了用户体验。
需要说明的是,由于移动终端的新增联系人可能位于移动终端的多个通讯录好友的联系人中,并且在每个通讯录好友中的隶属通讯录组别不相同,故本实施例推理出符合要求的隶属通讯录组别可能为多个,针对这种情况,本实施例可以选取任意一个隶属通讯录组别或选取数量最多的隶属通讯录组别作为最终的新增联系人在移动终端的联系人中的隶属通讯录组别。
可选地,将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别包括:
获取新增联系人与通讯录好友的历史联系文本作为第一历史联系文本,以及通讯录好友与移动终端的历史联系文本作为第二历史联系文本,并基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度;
判断逻辑关联度是否大于预设的逻辑关联度阈值,若是,则将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别。
由于根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理,从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题,例如当系统检测到移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”,且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”,若直接将“朋友”通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别,则可能出现分类不准确的问题,即C的朋友并不一定是A的朋友。针对该问题,本实施例通过选取逻辑关联度指标来定量描述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。具体地,本实施例通过获取新增联系人与通讯录好友的历史联系文本作为第一历史联系文本,以及通讯录好友与移动终端的历史联系文本作为第二历史联系文本,并基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例通过获取第一历史联系文本与第二历史联系文本来分析第一隶属通讯录组别与第二通讯录组别的逻辑关联度,并在逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,避免了根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理,从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题,提高了分类的准确性和精确度。
可选地,基于第一历史联系文本和第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
提取第一历史联系文本中的关键词作为第一关键词,并将第一关键词转换成词向量作为第一词向量;
提取第二历史联系文本中的关键词作为第二关键词,并将第二关键词转换成词向量作为第二词向量;
计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
本实施例中的词向量是指词语的向量表示,最简单的表示方法是稀疏描述法(One-hot Representation),该方法将词表中的每个词表示成一个由0和1组成的向量,其中,只有一个维度值为1,其余维度值都为0,向量的维度为词表的大小,词表由所有需要进行向量化词语组成,词语的个数即为词表的大小,例如,一个词表包含10个词语,则该词表的所有词语转换成10维的向量,例如,“话筒”的词向量表示为[0,0,0,0,1,0,0,0,0,0],“麦克”的词向量表示为[0,1,0,0,0,0,0,0,0,0],向量中数值为1的位置对应该词在词表的位置,即“话筒”位于词表中第6个位置,“麦克”位于词表中第2个位置。另一种表示方法为分布式描述方法(Distributed Representation),该方法是一种低维词向量表示方法。例如,一个词表同样包含10个词语时,“话筒”的词向量可以仅通过五维向量进行表示,例如[0.792,-0.177,-0.107,0.109,-0.542],这种方式能够大大减少向量的维数。
由于稀疏描述法一方面存在“词汇鸿沟”的问题,即得到的词向量之间相互孤立,从两个词向量中不能得出两个词之间的相似关系,另一方面该方法容易出现“维数灾难”,即词向量维数过大,导致训练难度、内存占用量过大。分布式描述方法最大的优势在于能够让相关或者相似的词转换得到的词向量在距离上更接近,所谓的距离即余弦夹角的距离。此外,分布式描述方法表示的词向量具有较低的维度,适合于进行机器训练,训练的效率都较高,所占用的内存相对于稀疏描述法较少。因此,本实施例采用分布式描述方法将关键词转换为词向量。
本实施例中的相似度是指第一关键词与第二关键词之间的相似程度,可以是语义的相似程度,也可以是词法的相似程度,通过与第一关键词和第二关键词对应的词向量之间的距离来表示。两个词向量的距离越短,说明该两个词向量对应的词的相似度越大,进一步说明两个词在语义或是词法上更为接近。常用的描述向量距离的方式有欧氏距离、余弦夹角等。通过计算两个词向量的夹角余弦值来表示该词向量对应的两个词的相似度的计算公式为: 其中,X、Y分别表示词向量X和词向量Y。cosθ的取值范围为[0,1],cosθ越接近1时,则表示两词语之间的相似度越高,反之,cosθ值越接近0,则表示两词语之间的相似度越低。通过计算词向量的夹角余弦值能够较为直观的反映出两个关键词的相似度。
可选地,计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
计算第一词向量与第二词向量之间的相似度作为文本逻辑关联度;
计算新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为第一通话逻辑关联度,计算新增联系人和移动终端之间的通话时长与新增联系人和通讯录好友之间的通话时长的比值作为第二通话逻辑关联度,计算移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,其中,选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯,并选择第一通话逻辑关联度,或第二通话逻辑关联度,或第三通话逻辑关联度,或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度;
将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
尽管本实施例通过计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度,并在判定逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,但仍然可能出现推理结果不精确的问题。例如当系统检测到移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“X公司同事”,且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“X公司同事”,且通过计算发现逻辑关联度满足预设的逻辑关联度阈值,此时若将“X公司同事”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别可能出现不准确情况,因为可能出现新增联系人B早已经从X公司离职而通讯录好友C并没有及时更改通讯录,以致导致推理结论不准确,即新增联系人B不是移动终端A的“X公司同事”。
针对该问题,本实施例计算新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为第一通话逻辑关联度,计算新增联系人和移动终端之间的通话时长与新增联系人和通讯录好友之间的通话时长的比值作为第二通话逻辑关联度,计算移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,其中,选择方式包括从通讯录对新增联系人发起通讯、从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯,并选择第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度,以及将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度,这样大大的提高了推理的精确度。
本实施例选取第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度,主要是依据新增联系人分别与移动终端以及与通讯录好友之间的通话密切度情况、以及移动终端对新增联系人发起通讯的选择方式的概率情况来设计的。具体地,假设新增联系人B和移动终端A之间的通话频率(或通话时长)与新增联系人B和通讯录好友C之间的通话频率(或通话时长)的比值越大,则说明依据新增联系人B在通讯录好友C的联系人中的隶属通讯录组别推出新增联系人B在移动终端A的联系人中的隶属通讯录组别的逻辑推理正确率越高。同样地,本实施例较新颖的利用移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,其中,选择方式包括从通讯录对新增联系人发起通讯、 从历史通话记录对新增联系人发起通讯、从短信通讯模块对新增联系人发起通讯,这主要是基于在日常通讯场景中,通讯发起方向通讯接收方发起通讯主要包括三种选择方式,具体为从通讯录、从历史通话记录、从短信通讯模块对通讯接收方发起通讯,而根据经验可知,通讯发起方对于联系较密切的通讯接收方大多数时候会选择从历史通话记录发起通讯、而对于联系较少或不常联系的通讯接收方,则大多数时候会选择从通讯录对通讯接收方发起通讯,本实施例较新颖的利用这种概率事件,将移动终端对新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,在实际实施过程中一般选择移动终端从历史通话记录对新增联系人发起通讯的加权系数大于移动终端从通讯录或短信通讯模块对新增联系人发起通讯的加权系数。例如,若移动终端A对新增联系人B发起通讯的次数为100次,其中,移动终端A从历史通话记录对新增联系人B发起通讯的次数为70次,移动终端A从通讯录对新增联系人B发起通讯的次数为20次,移动终端A从短信通讯模块对新增联系人B发起通讯的次数为10次,则可以得到移动终端对新增联系人发起通讯的选择方式的概率加权和为P=m1*p1+m2*p2+m3*p3,其中P为移动终端对新增联系人发起通讯的选择方式的概率加权和,m1、m2、m3分别为加权系数,p1、p2、p3分别为移动终端对新增联系人发起通讯的选择方式的概率,例如移动终端A从历史通话记录对新增联系人B发起通讯的概率为:p1=70/100=0.7。由此可以看出,移动终端从历史通话记录相对于从通讯录或短信通讯模块对新增联系人发起通讯的概率越大,说明移动终端与新增联系人的关系更密切,故依据新增联系人在通讯录好友的联系人中的隶属通讯录组别推出新增联系人在移动终端的联系人中的隶属通讯录组别的逻辑推理正确率越高。
本实施例基于通话频率、通话时长以及发起通讯的选择方式概率分别设计第一通话逻辑关联度、第二通话逻辑关联度、第三通话逻辑关联度,并将第一通话逻辑关联度、或第二通话逻辑关联度、或第三通话逻辑关联度或第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度充分考虑了新增联系人分别与移动终端以及与通讯录好友之间的关联度,使得通话逻辑关联度的指标设计具有充分的合理性和代表性,以及使得依据新增联系人在通讯录好友的联系人中的隶属通讯录组别推出新增联系人在移动终端的联系人中的隶属通讯录组别的逻辑推理正确率越高。
需要说明的是,本实施例在计算通话频率、通话时长或发起通讯的选择方式概率时可以取任意一个设定时间段的通话频率、通话时长或发起通讯的选择方式概率,一般来说,可以取最近的时间段。且本实施例的文本逻辑关联度与通话逻辑关联度的加权系数可以根据用户自定义。
可选地,基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组包括:
获取移动终端与通讯录好友的历史联系文本作为第三历史联系文本,以及移动终端与新增联系人的历史联系文本作为第四历史联系文本;
提取第三历史联系文本中的关键词作为第三关键词,并将第三关键词转换成词向量作为第三词向量;
提取第四历史联系文本中的关键词作为第四关键词,并将第四关键词转换成词向量作为 第四词向量;
计算第三词向量与第四词向量之间的相似度,并将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别。
本实施例在判定新增联系人不位于通讯录好友的联系人当中后,采用基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组。具体地,通过计算移动终端和通讯录好友之间的历史联系文本与移动终端和新增联系人之间的历史联系文本之间的相似度,将新增联系人归类到最大的相似度对应的通讯录好友的隶属通讯录组别,解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题,实现了基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,大量节省了手动对新增联系人进行通讯录分组的时间,提高了分类效率,提升了用户体验。
可选地,计算第三词向量与第四词向量之间的相似度包括:
利用预先建立的语义信息库对第三关键词进行语义匹配,获得第三关键词的同义词或近义词作为关联词,并将关联词转换成词向量,得到关联词向量,其中,语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库相关联的语义关系库;
计算第三词向量与第四词向量之间的相似度,作为第一相似度,以及计算关联词向量与第四词向量之间的相似度,作为第二相似度;
将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度。
由于仅仅根据第三词向量和第四词向量的相似度决定新增联系人所属的通讯录组别可能出现准确度不高的问题,故本实施例通过对第三关键词进行语义匹配,获得第三关键词的同义词或近义词作为关联词,然后再基于第三关键词向量计算第一相似度以及基于关联词向量计算第二相似度,最后将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度。本实施例中第一相似度和第二相似度的加权系数可以根据实际情况或用户自定义进行设定,在具体的实施过程中,一般定义第一相似度的加权系数大于第二相似度的加权系数。
此外,本实施例除了根据预先建立的语义信息库获得关联词外,还可以采用模糊搜索机制在预先建立的数据库和/或互联网上搜索第三关键词的同义词或近义词作为关联词。本实施例通过结合基于第三关键词向量计算的第一相似度以及基于关联词向量计算的第二相似度,获取新增联系人所属的通讯录组别,解决了仅仅依据基于第三词向量与第四词向量计算出的相似度获取新增联系人所属的通讯录组别准确度不高的问题,并且结合基于关联词计算的第二相似度,使得计算出的相似度更加切合实际情况,同时也更精准。
可选地,将第一相似度和第二相似度的加权相似度作为第三词向量与第四词向量之间的相似度包括:
利用预先建立的语义信息库以及语义规则库,对第三关键词进行语义推理,获得第三关 键词的推理词,并将推理词转换成词向量,得到推理词向量,其中,语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
计算推理词向量与第四词向量之间的相似度,作为第三相似度,将第一相似度、第二相似度以及第三相似度的加权相似度作为第三词向量与第四词向量之间的相似度。
由于在实际实施过程中,仅仅根据第三关键词和关联词计算出的第一相似度和第二相似度并没有考虑第三关键词内部隐藏的语义信息,故本实施例利用预先建立的语义信息库以及语义规则库,对第三关键词进行语义推理,获得推理词,并基于推理词向量和第四词向量计算第三相似度,以及将第一相似度、第二相似度以及第三相似度的加权相似度作为最终的相似度。采用增设第三相似度的加权相似度作为最终的相似度,充分考虑了第三关键词的语义信息和根据第三关键词获得的推理信息,从而使得计算出的最终的相似度更切合实际情况,以及更精准。
可选地,第三词向量为多个,计算第三词向量与第四词向量之间的相似度,作为第一相似度包括:
依次计算第四词向量和多个第三词向量中的每一个第三词向量的相似度集合;
获取相似度集合中值最大的相似度作为第一相似度。
当第三关键词为多个时,其对应的第三词向量也为多个,此时依次计算第四词向量与每一个第三词向量的相似度,得到一个相似度集合。本实施例可以通过统计相似度集合中的最大值作为第一相似度。例如,假设移动终端的通讯录中包括A通讯录好友,且经过对第三历史联系文本提取关键词后,获得第三词向量为{A1},{A2},则在计算A与新增联系人D的第四词向量{D1}的相似度时,分别计算第三词向量{A1}与第四词向量{D1}以及第三词向量{A2}与第四词向量{D1}的夹角余弦值,并选取最大的夹角余弦值作为第一相似度。可选地,本实施例不限于采用最大的夹角余弦值作为第一相似度,例如本实施例还可以选取{A1}与{D1}以及{A2}与{D1}的夹角余弦值的平均值作为第一相似度。通过选取多个第三关键词向量,避免了第三词向量选取不准确的问题,提高了第一相似度计算的准确性和可靠性,同时为后续选取第三关键词的关联词和推理词奠定了基础。
可选地,本实施例中的关联词向量也可以为多个,且当关联词向量为多个时,本实施例计算第二相似度与当第三词向量为多个时计算第一相似度的方法类似。具体地,当关联词向量为多个时,依次计算第四词向量与每一个关联词向量的相似度,,得到一个相似度集合,并获取相似度集合中值最大的相似度作为第二相似度。可选地,推理词向量也可以为多个,且当推理词向量为多个时,本实施例计算第三相似度与当第三词向量为多个时计算第一相似度的方法类似。
可选地,将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别包括:
判断最大的相似度是否大于预设的相似度阈值,若是,则将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别;
若否,则新建通讯录组别,并将新增联系人归类到新建通讯录组别。
由于在实际情况中,移动终端预先设置的通讯录分组有限,如果将任何一个新增联系人根据相似度值直接归类到预先设置的通讯录分组中,可能出现由于通讯录分组的数量太少导致对新增联系人的通讯录分组不准确或不合理。针对该问题,本实施例在将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别之前判断最大的相似度是否大于预设的相似度阈值,若是,则将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别,若否,则新建通讯录组别,并将新增联系人归类到新建通讯录组别。通过设置预设的相似度阈值智能地将新增联系人分类到通讯录好友的隶属通讯录组别或新建的通讯录组别中,从而实现了对新增联系人的隶属通讯录组别的准确分类。可选地,新建通讯录组别,并将新增联系人归类到新建通讯录组别之后还包括:根据第四关键词对新建通讯录组别的名称进行命名。
可选地,历史联系文本包括历史聊天文本和/或历史语音文本,历史语音文本为转换成文本格式的历史语音数据。
本实施例中的历史联系文本可以是历史聊天文本,也可以是历史语音文本或两者的结合,其中历史语音文本为转换成文本格式的历史语音数据,且历史语音数据又包括通话历史语音数据或聊天历史语音数据。
可选地,移动终端的新增联系人为移动终端新增加的联系人或移动终端中没有隶属通讯录组别的联系人。具体地,本实施例可以对移动终端新增加的联系人进行通讯录自动分类,也可以对移动终端中没有隶属通讯录组别的联系人进行通讯录自动分类。
可选地,通讯录好友为移动终端的通讯录中的部分通讯录好友或全部通讯录好友。本实施例中移动终端可以选择部分通讯录好友或全部通讯录好友作为对新增联系人进行通讯录分组的参考和依据对象。
下面以三个精简的实施例对本实施例的对移动终端的新增联系人进行通讯录分组的方法进行更进一步的说明,其中,第一个精简的实施例进行通讯录分组的情景为:移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”,且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”。参照图2,该方法主要包括以下步骤:
步骤S201,获取移动终端A及其通讯录好友C共享的通讯录信息,通讯录信息包括联系人以及联系人的隶属通讯录组别。具体地,本实施例中的通讯录信息包括移动终端A、通讯录好友C的通讯录信息。
步骤S202,判断移动终端A的新增联系人B是否位于通讯录好友C的联系人当中。由于本实施例新增联系人B位于通讯录好友C的联系人当中,故执行步骤S203。
步骤S203,判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,第一隶属通讯录组别为新增联系人B在通讯录好友C的联系人当中的隶属通讯录组别,第二隶属通讯录组别为通讯录好友C在移动终端A的联系人中的隶属通讯录组别,若是,将第一隶属通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。
具体地,本实施例中第一隶属通讯录组别为“朋友”,与第二隶属通讯录组别相同,故本实施例将新增联系人B自动归类到通讯录组别为“朋友”的组别,从而实现了对新增联系人B的自动分组。
本实施例的第二个精简的实施例进行通讯录分组的情景为:移动终端A的新增联系人B在移动终端A的通讯录好友C的联系人当中的隶属通讯录组别名称为“朋友”,且通讯录好友C在移动终端A的联系人当中的隶属通讯录组别名称也为“朋友”。参照图3,该方法主要包括以下步骤:
步骤S301,获取移动终端A及其通讯录好友C共享的通讯录信息,通讯录信息包括联系人以及联系人的隶属通讯录组别。具体地,本实施例中的通讯录信息包括移动终端A、通讯录好友C的通讯录信息。
步骤S302,判断移动终端A的新增联系人B是否位于通讯录好友C的联系人当中。由于本实施例新增联系人B位于通讯录好友C的联系人当中,故执行步骤S303。
步骤S303,判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,第一隶属通讯录组别为新增联系人B在通讯录好友C的联系人当中的隶属通讯录组别,第二隶属通讯录组别为通讯录好友C在移动终端A的联系人中的隶属通讯录组别。具体地,本实施例中第一隶属通讯录组别为“朋友”,与第二隶属通讯录组别相同,则执行步骤S304。
步骤S304,获取新增联系人B与通讯录好友C的历史联系文本作为第一历史联系文本,以及通讯录好友C与移动终端A的历史联系文本作为第二历史联系文本;
步骤S305,提取第一历史联系文本中的关键词作为第一关键词,并将第一关键词转换成词向量作为第一词向量,提取第二历史联系文本中的关键词作为第二关键词,并将第二关键词转换成词向量作为第二词向量。本实施例中的第一关键词和第二关键词的数量可以为多个,且为了提高词向量训练的效率,本实施例在获取关键词之前先对历史联系文本进行分词、去除停用词等预处理操作,然后通过统计特征项文本的词频数获取关键词。本实施例通过对历史联系文本进行预处理,去除停用词,一方面降低了词向量训练过程的复杂度,降低词向量训练的效率,另一方面提高了词向量训练的训练质量,从而提高了训练得到的词向量之间相似度的准确性。
步骤S306,计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例通过第一关键词和第二关键词对应的词向量之间的距离来表示相似度,常用的描述向量距离的方式有欧氏距离、余弦夹角等。例如,当本实施例得到第一词向量为T1(2.5,1,0,1,0,1.1),第二词向量为T2(2.832,0.258,0,0,0.258,0),可以得到两个词向量之间的夹角余弦值为cosθ=0.835。
参照图4,可选地,步骤S306,计算第一词向量与第二词向量之间的相似度作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
步骤S3061,计算第一词向量与第二词向量之间的相似度作为文本逻辑关联度。根据步骤S306可以得到两个词向量之间的夹角余弦值为cosθ=0.835,由于词向量之间的夹角余弦值的取值范围为[0,1],故本实施例无需再将夹角余弦值进行归一化,而直接将夹角余弦值直接作为两个词向量的相似度,即文本逻辑关联度。
步骤S3062,将新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为通话逻辑关联度。
步骤S3063,将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度。本实施例可以由用户自定义文本逻辑关联度与通话逻辑关联度的加权系数,假设本实施例取文本逻辑关联度的加权系数为m1=0.5,通话逻辑关联度的加权系数为m2=0.5,且文本逻辑关联度为cosθ1=0.835,通话逻辑关联度为cosθ2=0/100=0,本实施例采用新增联系人和移动终端之间的通话频率与新增联系人和通讯录好友之间的通话频率的比值作为通话逻辑关联度,具体为新增联系人和移动终端之间的通话次数0次,新增联系人和通讯录好友之间的通话次数100次,此时可以计算出最终的逻辑关联度N=m1*cosθ1+m2*cosθ2=0.418。
步骤S307,判断逻辑关联度是否大于预设的逻辑关联度阈值,若是,则将第一隶属通讯录组别作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。
具体地,如果不考虑通话逻辑关联度,而直接将文本逻辑关联度cosθ1=0.835作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度,且假设预设的逻辑关联度阈值为Tth=0.7,则可知此时可以将第一隶属通讯录组别“朋友”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。但如果考虑通话逻辑关联度,且将文本逻辑关联度与通话逻辑关联度的加权和作为第一隶属通讯录组别与第二通讯录组别的逻辑关联度,即N=0.418,假设预设的逻辑关联度阈值同样为Tth=0.7,则判断出不能将第一隶属通讯录组别“朋友”作为新增联系人B在移动终端A的联系人中的隶属通讯录组别。很明显地,考虑通话逻辑关联度作为逻辑关联度的一部分,可以得出更准确的分类结果,且使得逻辑关联度指标的设计也更合理。
本实施例通过获取第一历史联系文本与第二历史联系文本来分析第一隶属通讯录组别与第二通讯录组别的逻辑关联度,并在逻辑关联度大于预设的逻辑关联度阈值时才将第一隶属通讯录组别作为新增联系人在移动终端的联系人中的隶属通讯录组别,避免了根据移动终端及其通讯录好友共享的通讯录信息进行逻辑推理,从而间接获取新增联系人在移动终端中的隶属通讯录组别可能出现推理的结果不准确的问题,提高了分类的准确性和精确度。
本实施例的第三个精简的实施例进行通讯录分组的情景为:移动终端A的通讯录中包括C和D两个通讯录好友,移动终端A的新增联系人B不在移动终端A的任何通讯录好友的联系人当中,且通讯录好友C在移动终端A的联系人中的隶属通讯录组别为“朋友”,通讯录好友D在移动终端A的联系人中的隶属通讯录组别为“同事”。参照图5,该方法主要包括以下步骤:
步骤S401,获取移动终端与通讯录好友的历史联系文本作为第三历史联系文本,以及移动终端与新增联系人的历史联系文本作为第四历史联系文本。具体地,本实施例的第三历史联系文本包括移动终端A与通讯录好友C的历史联系文本以及移动终端A与通讯录好友D的历史联系文本,第四历史联系文本为移动终端A与新增联系人B的历史联系文本。
步骤S402,提取第三历史联系文本中的关键词作为第三关键词,并将第三关键词转换成词向量作为第三词向量,提取第四历史联系文本中的关键词作为第四关键词,并将第四关键词转换成词向量作为第四词向量。
步骤S403,利用预先建立的语义信息库以及语义规则库对第三关键词进行语义匹配和语义推理,获得第三关键词的关联词和推理词,并对应转换成关联词向量和推理词向量。
步骤S404,计算第三词向量与第四词向量之间的相似度,作为第一相似度,计算关联词向量与第四词向量之间的相似度,作为第二相似度,以及计算推理词向量与第四词向量之间的相似度,作为第三相似度。例如,当本实施例得到第四词向量为T4(2.5,1,0,1,0,1.1),与通讯录好友C对应的第三词向量为TC3(0.354,0,0.708,2.064,0.258,0),关联词向量为TC5(0,0.258,1.416,1.032,0,0),推理词向量为TC6(0,0,0.708,0.516,0,0)时,则可以依次得到与通讯录好友C对应的第一相似度为cosθC3=0.431,第二相似度为cosθC5=0.237,第三相似度为cosθC6=0.191;同理,与通讯录好友D对应的第三词向量为TD3(1.77,0.258,0,0,0,0.354),关联词向量具体为TD5(2.832,0.258,0,0,0.258,0),推理词向量具体为TD6(0.708,1.032,0.354,0.258,0,0)时,则可以依次得到与通讯录好友D对应的第一相似度为cosθD3=0.904,第二相似度为cosθD5=0.835,第三相似度为cosθD6=0.750。
步骤S405,将第一相似度、第二相似度以及第三相似度的加权相似度作为第三词向量与第四词向量之间的相似度,并将新增联系人归类到最大的相似度对应的第三词向量对应的通讯录好友的隶属通讯录组别。本实施例取与第一、第二、第三相似度分别对应的加权系数为k1=0.6,k2=0.2,k3=0.2,则可以计算出与通讯录好友C对应的最终的相似度为:LC=k1*cosθC3+k2*cosθC5+k3*cosθC6=0.333,与通讯录好友D对应的最终的相似度为:LD=k1*cosθD3+k2*cosθD5+k3*cosθD6=0.859,故可以看出,新增联系人B与通讯录好友D的相似度大于新增联系人B与通讯录好友C的相似度,故最终将新增联系人B归类到通讯录好友D在移动终端A的联系人当中的隶属通讯录组别,即“同事”通讯录组别。
本实施例通过结合基于第三关键词向量计算的第一相似度以及基于关联词向量计算的第二相似度,以及基于推理词向量计算的第三相似度,计算出第三词向量与第四词向量之间的相似度,并基于该相似度将新增联系人归类到最大的相似度对应的通讯录好友的隶属通讯录组别,解决了手动添加新增联系人到设置的通讯录组别中操作复杂、过程繁琐的技术问题,实现了基于移动终端与通讯录好友的历史联系文本,以及移动终端与新增联系人的历史联系文本对移动终端的新增联系人进行通讯录分组,大量节省了手动对新增联系人进行通讯录分组的时间,提高了分类效率,提升了用户体验。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种对移动终端的新增联系人进行通讯录分组的方法,其特征在于,包括:
步骤一、获取移动终端及其通讯录好友共享的通讯录信息,所述通讯录信息包括联系人以及所述联系人的隶属通讯录组别;
步骤二、判断所述移动终端的新增联系人是否位于所述通讯录好友的联系人当中,若否,进入步骤三,若是,则判断第一隶属通讯录组别是否与第二隶属通讯录组别相同,所述第一隶属通讯录组别为所述新增联系人在所述通讯录好友的联系人当中的隶属通讯录组别,所述第二隶属通讯录组别为所述通讯录好友在所述移动终端的联系人中的隶属通讯录组别,若否,进入步骤三,若是,则将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别;
步骤三、基于所述移动终端与所述通讯录好友的历史联系文本,以及所述移动终端与所述新增联系人的历史联系文本对所述移动终端的新增联系人进行通讯录分组。
2.根据权利要求1所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别包括:
获取所述新增联系人与所述通讯录好友的历史联系文本作为第一历史联系文本,以及所述通讯录好友与所述移动终端的历史联系文本作为第二历史联系文本,并基于所述第一历史联系文本和所述第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度;
判断所述逻辑关联度是否大于预设的逻辑关联度阈值,若是,则将所述第一隶属通讯录组别作为所述新增联系人在所述移动终端的联系人中的隶属通讯录组别。
3.根据权利要求2所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,基于所述第一历史联系文本和所述第二历史文本计算第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
提取所述第一历史联系文本中的关键词作为第一关键词,并将所述第一关键词转换成词向量作为第一词向量;
提取所述第二历史联系文本中的关键词作为第二关键词,并将所述第二关键词转换成词向量作为第二词向量;
计算所述第一词向量与所述第二词向量之间的相似度作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
4.根据权利要求3所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,计算所述第一词向量与所述第二词向量之间的相似度作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度包括:
计算所述第一词向量与所述第二词向量之间的相似度作为文本逻辑关联度;
计算所述新增联系人和所述移动终端之间的通话频率与所述新增联系人和所述通讯录好友之间的通话频率的比值作为第一通话逻辑关联度,计算所述新增联系人和所述移动终端之间的通话时长与所述新增联系人和所述通讯录好友之间的通话时长的比值作为第二通话逻辑关联度,计算所述移动终端对所述新增联系人发起通讯的选择方式的概率加权和作为第三通话逻辑关联度,其中,所述选择方式包括从通讯录对所述新增联系人发起通讯、从历史通话记录对所述新增联系人发起通讯、从短信通讯模块对所述新增联系人发起通讯,并选择所述第一通话逻辑关联度,或所述第二通话逻辑关联度,或所述第三通话逻辑关联度,或所述第一通话逻辑关联度、第二通话逻辑关联度以及第三通话逻辑关联度的任意组合作为通话逻辑关联度;
将所述文本逻辑关联度与所述通话逻辑关联度的加权和作为所述第一隶属通讯录组别与第二通讯录组别的逻辑关联度。
5.根据权利要求1所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,基于所述移动终端与所述通讯录好友的历史联系文本,以及所述移动终端与所述新增联系人的历史联系文本对所述移动终端的新增联系人进行通讯录分组包括:
获取所述移动终端与所述通讯录好友的历史联系文本作为第三历史联系文本,以及所述移动终端与所述新增联系人的历史联系文本作为第四历史联系文本;
提取所述第三历史联系文本中的关键词作为第三关键词,并将所述第三关键词转换成词向量作为第三词向量;
提取所述第四历史联系文本中的关键词作为第四关键词,并将所述第四关键词转换成词向量作为第四词向量;
计算所述第三词向量与所述第四词向量之间的相似度,并将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别。
6.根据权利要求5所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,计算所述第三词向量与所述第四词向量之间的相似度包括:
利用预先建立的语义信息库对所述第三关键词进行语义匹配,获得所述第三关键词的同义词或近义词作为关联词,并将所述关联词转换成词向量,得到关联词向量,其中,所述语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与所述基本概念库、所述常识知识库、所述句型关系模板库、所述用户综合信息库、所述互联网信息库、所述自定义预输入信息库相关联的语义关系库;
计算所述第三词向量与所述第四词向量之间的相似度,作为第一相似度,以及计算所述关联词向量与所述第四词向量之间的相似度,作为第二相似度;
将所述第一相似度和所述第二相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度。
7.根据权利要求6所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,将所述第一相似度和所述第二相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度包括:
利用预先建立的所述语义信息库以及语义规则库,对所述第三关键词进行语义推理,获得所述第三关键词的推理词,并将所述推理词转换成词向量,得到推理词向量,其中,所述语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中所述自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
计算所述推理词向量与所述第四词向量之间的相似度,作为第三相似度,将所述第一相似度、所述第二相似度以及所述第三相似度的加权相似度作为所述第三词向量与所述第四词向量之间的相似度。
8.根据权利要求7所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,所述第三词向量为多个,计算所述第三词向量与所述第四词向量之间的相似度,作为第一相似度包括:
依次计算所述第四词向量和多个所述第三词向量中的每一个所述第三词向量的相似度集合;
获取所述相似度集合中值最大的相似度作为第一相似度。
9.根据权利要求8所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别包括:
判断最大的所述相似度是否大于预设的相似度阈值,若是,则将所述新增联系人归类到最大的所述相似度对应的第三词向量对应的所述通讯录好友的隶属通讯录组别;
若否,则新建通讯录组别,并将所述新增联系人归类到所述新建通讯录组别。
10.根据权利要求9所述的对移动终端的新增联系人进行通讯录分组的方法,其特征在于,
所述历史联系文本包括历史聊天文本和/或历史语音文本,所述历史语音文本为转换成文本格式的历史语音数据。
CN201510565735.3A 2015-09-08 2015-09-08 一种对移动终端的新增联系人进行通讯录分组的方法 Active CN105100353B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510565735.3A CN105100353B (zh) 2015-09-08 2015-09-08 一种对移动终端的新增联系人进行通讯录分组的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510565735.3A CN105100353B (zh) 2015-09-08 2015-09-08 一种对移动终端的新增联系人进行通讯录分组的方法

Publications (2)

Publication Number Publication Date
CN105100353A CN105100353A (zh) 2015-11-25
CN105100353B true CN105100353B (zh) 2017-11-14

Family

ID=54579858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510565735.3A Active CN105100353B (zh) 2015-09-08 2015-09-08 一种对移动终端的新增联系人进行通讯录分组的方法

Country Status (1)

Country Link
CN (1) CN105100353B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105262875A (zh) * 2015-09-09 2016-01-20 陈包容 对移动终端的新增联系人进行通讯录分组的方法及装置
CN105245680A (zh) * 2015-09-09 2016-01-13 陈包容 对移动终端的新增联系人进行通讯录分组的方法及装置
CN106817472B (zh) * 2015-12-02 2020-03-10 华为技术有限公司 一种通讯账号确定方法、终端设备及服务器
CN105721289A (zh) * 2016-03-03 2016-06-29 陈包容 一种消息通讯附件栏中的功能模块的显示方法
CN106446270A (zh) * 2016-10-19 2017-02-22 广东欧珀移动通信有限公司 一种分类方法及装置
WO2018170889A1 (zh) * 2017-03-24 2018-09-27 华平智慧信息技术(深圳)有限公司 即时通信的好友分组方法及系统
CN107800849B (zh) * 2017-10-18 2021-04-27 北京小米移动软件有限公司 联系对象身份设置方法及装置
CN109960796A (zh) * 2019-02-21 2019-07-02 陈包容 一种通讯录已存联系人自动分组为特定成员的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103561148A (zh) * 2013-10-30 2014-02-05 宇龙计算机通信科技(深圳)有限公司 联系人分组的方法和终端
CN104219133A (zh) * 2013-05-31 2014-12-17 中国电信股份有限公司 通讯录的共享处理方法与系统
CN104462378A (zh) * 2014-12-09 2015-03-25 北京国双科技有限公司 用于文本识别的数据处理方法及装置
CN104836882A (zh) * 2015-05-28 2015-08-12 小米科技有限责任公司 联系信息的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219133A (zh) * 2013-05-31 2014-12-17 中国电信股份有限公司 通讯录的共享处理方法与系统
CN103561148A (zh) * 2013-10-30 2014-02-05 宇龙计算机通信科技(深圳)有限公司 联系人分组的方法和终端
CN104462378A (zh) * 2014-12-09 2015-03-25 北京国双科技有限公司 用于文本识别的数据处理方法及装置
CN104836882A (zh) * 2015-05-28 2015-08-12 小米科技有限责任公司 联系信息的处理方法及装置

Also Published As

Publication number Publication date
CN105100353A (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
CN105100353B (zh) 一种对移动终端的新增联系人进行通讯录分组的方法
CN104598445B (zh) 自动问答系统和方法
CN107515873B (zh) 一种垃圾信息识别方法及设备
CN107515877B (zh) 敏感主题词集的生成方法和装置
WO2020108608A1 (zh) 搜索结果处理方法、装置、终端、电子设备及存储介质
CN106294593B (zh) 结合从句级远程监督和半监督集成学习的关系抽取方法
CN108416375B (zh) 工单分类方法及装置
CN104076944B (zh) 一种聊天表情输入的方法和装置
CN109492026B (zh) 一种基于改进的主动学习技术的电信欺诈分类检测方法
WO2017076205A1 (zh) 一种获取聊天发起句的回复提示内容的方法及装置
CN105787025B (zh) 网络平台公共账号分类方法及装置
CN106372072A (zh) 一种基于位置的移动社会网络用户关系的识别方法
CN104933113A (zh) 一种基于语义理解的表情输入方法和装置
CN106599925A (zh) 一种基于深度学习的植物叶片识别系统与方法
CN106940726B (zh) 一种基于知识网络的创意自动生成方法与终端
CN110019732A (zh) 一种智能问答方法以及相关装置
CN105281925B (zh) 网络业务用户群组划分的方法和装置
CN101784022A (zh) 短信过滤、分类方法及系统
CN109165294A (zh) 一种基于贝叶斯分类的短文本分类方法
CN108228853A (zh) 一种微博谣言识别方法及系统
CN106649404B (zh) 一种会话场景数据库的创建方法及装置
CN109035001A (zh) 智能语音应答处理方法及系统
CN103425777A (zh) 一种基于改进贝叶斯分类的短信智能分类及搜索方法
CN110765266B (zh) 一种裁判文书相似争议焦点合并方法及系统
CN109657063A (zh) 一种海量环保人工上报事件数据的处理方法及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200410

Address after: 410000 room a1380, headquarters building, Changsha Zhongdian Software Park Co., Ltd., No.39, Jianshan Road, high tech Development Zone, Changsha City, Hunan Province

Patentee after: Changsha ge'ermen Intelligent Technology Co., Ltd

Address before: 410000 Hunan province Changsha High-tech Development Zone Lugu industrial base Lu Tin Road No. 8 Building 1036 unit 4 Oaks

Patentee before: Chen Baorong

TR01 Transfer of patent right