CN104320525B - 电话号码识别方法及装置 - Google Patents
电话号码识别方法及装置 Download PDFInfo
- Publication number
- CN104320525B CN104320525B CN201410482122.9A CN201410482122A CN104320525B CN 104320525 B CN104320525 B CN 104320525B CN 201410482122 A CN201410482122 A CN 201410482122A CN 104320525 B CN104320525 B CN 104320525B
- Authority
- CN
- China
- Prior art keywords
- call
- threshold value
- label
- law
- telephone number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本公开是关于一种电话号码识别方法及装置,属于数字识别领域。所述方法包括:获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。本公开通过将电话号码的通话规律与预设身份标签的通话规律进行匹配;解决了用户经常发现某些电话号码对应的身份标签已经不正确,需要人工抽检的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
Description
技术领域
本公开涉及数字识别领域,特别涉及一种电话号码识别方法及装置。
背景技术
随着人们交际的越来越广,电话已成为生活中不可缺少的工具。
在用户使用电话进行沟通交流时,越来越多的陌生电话出现,所以,对电话号码的身份识别就显得尤为重要。相关技术中,用户可以根据黄页中一个电话号码的身份标签来辨别该电话号码的身份。比如,骚扰电话、广告推销、房产中介、快递送餐或者诈骗电话等等。
公开人在实现本公开的过程中,发现上述方式至少存在如下缺陷:
由于黄页中存储着大量的电话号码及其对应的身份标签,且这些电话号码和身份标签不断地更新变化着,用户在使用黄页时,经常会发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的人力资源且能够达到的效果有限。
发明内容
为了解决相关技术中用户经常发现某些电话号码对应的身份标签已经不正确,需要人工抽检的问题,本公开实施例提供了一种电话号码识别方法及装置,所述技术方案如下:
根据本公开实施例的第一方面,提供一种电话号码识别方法,所述方法包括:
获取电话号码在一个历史时间段内的通话记录,电话号码为黄页中已对应有预设身份标签的电话号码;
根据通话记录分析电话号码的通话规律;
将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
在一个实施例中,将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,包括:
在电话号码已对应有一个预设身份标签时,计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数;
若匹配指数大于或等于第一阈值,则电话号码的通话规律与预设身份标签的通话规律匹配,保持预设身份标签不变;
若匹配指数小于第一阈值,则电话号码的通话规律与预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
在一个实施例中,根据通话记录分析电话号码的通话规律,包括:
获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;
按照n个统计维度分别统计每个统计维度上的通话特点;
根据n个维度对应的n个通话特点得出电话号码的通话规律。
根据本公开实施例的第二方面,提供一种电话号码识别装置,所述装置包括:
记录获取模块,被配置为获取电话号码在一个历史时间段内的通话记录,电话号码为黄页中已对应有预设身份标签的电话号码;
规律分析模块,被配置为根据通话记录分析电话号码的通话规律;
规律匹配模块,被配置为将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
在一个实施例中,规律匹配模块,包括:
第一计算子模块,被配置为在电话号码已对应有一个预设身份标签时,计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数;
第一匹配子模块,被配置为若匹配指数大于或等于第一阈值,则电话号码的通话规律与预设身份标签的通话规律匹配,保持预设身份标签不变;
第二匹配子模块,被配置为若匹配指数小于第一阈值,则电话号码的通话规律与预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
在一个实施例中,规律分析模块,包括:
数据获取子模块,被配置为获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;
特点统计子模块,被配置为按照n个统计维度分别统计每个统计维度上的通话特点;
规律得出子模块,被配置为根据n个维度对应的n个通话特点得出电话号码的通话规律。
根据本公开实施例的第三方面,提供了一种电话号码识别装置,包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器被配置为:
获取电话号码在一个历史时间段内的通话记录,所述电话号码为黄页中已对应有预设身份标签的电话号码;
根据通话记录分析电话号码的通话规律;
将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,所述预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
本公开实施例提供的技术方案可以包括以下有益效果:
通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种电话号码识别方法的流程图;
图2是根据另一示例性实施例示出的一种电话号码识别方法的流程图;
图3是根据又一示例性实施例示出的一种电话号码识别方法的流程图;
图4是根据一示例性实施例示出的一种电话号码识别装置的框图;
图5是根据另一示例性实施例示出的一种电话号码识别装置的框图;
图6是根据一示例性实施例示出的一种电话号码识别装置的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种电话号码识别方法的流程图,本实施例以该电话号码识别方法应用于服务器中来举例说明。该电话号码识别方法可以包括如下几个步骤:
在步骤102中,获取电话号码在一个历史时间段内的通话记录。
在步骤104中,根据通话记录分析电话号码的通话规律。
在步骤106中,将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。
综上所述,本实施例提供的电话号码识别方法,通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
本公开实施例的实施场景可以分为两种:
第一种实施场景是该电话号码预先已对应有预设身份标签,比如该电话号码是黄页号码中的一个号码;
第二种实施场景是该电话号码预先未对应有预设身份标签,比如该电话号码是被用户举报的垃圾电话号码,但是该垃圾电话号码尚未分类。
下面分别通过两个实施例来进行说明。
图2是根据另一示例性实施例示出的一种电话号码识别方法的流程图,本实施例以该电话号码识别方法应用于服务器中且该电话号码已对应有预设身份标签(本实施例以预设身份标签为快递员标签为例)来举例说明。该电话号码识别方法可以包括如下几个步骤:
在步骤202中,获取电话号码在一个历史时间段内的通话记录。
服务器获取电话号码在一个历史时间段内的通话记录。对于一个电话号码,服务器可以每隔预定时间获取该电话号码在一个历史时间段内的通话记录;也可以在该电话号码每次有新的通话记录后,获取该电话号码在一个历史时间段内的通话记录。
服务器可以从终端获取电话号码的通话记录。在服务器是云端电话本所对应的服务器时,服务器可以从自身保存的多个电话号码的通话记录中获取某一个电话号码的通话记录。
其中,历史时间段可以是以当前时间为终点,固定时长为长度的时间段;历史时间段也可以是上一个月、上一季度、上半年等历史时间段。
其中,通话记录可以包括:通话时间、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种。
比如,表1示出了服务器获取的一个电话号码在2014年9月9日10:00-16:00的通话记录。
表1
在步骤204中,根据通话记录分析电话号码的通话规律。
服务器根据获取的通话记录分析电话号码的通话规律。该步骤204可以包括但不限于如下子步骤:
一、服务器获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种。
以上述表1所提供的通话记录为例,该通话记录在5个统计维度上的数据分别为:指定时段的通话次数为7次;7次通话对应的每次通话时长分别为10秒、12秒、8秒、9秒、15秒、20秒、10秒;7次通话对应的呼入次数为1次,呼出次数为6次;7次通话对应的通话地点和通话号码所在地均为城市A,两者距离分别为450米、250米、300米、350米、150米、2000米、500米;7次通话对应的通话号码6次不是联系人,1次是联系人。
其中,指定时段可以按照一个月、一天、每天的6:00-10:00、每天的8:00-15:00等等来统计。
二、服务器按照n个统计维度分别统计每个统计维度上的通话特点。
比如,表2示出了该电话号码预设身份标签为快递员标签的5个统计维度上的通话特点。
表2
以上表2所获取的通话记录在5个统计维度上的数据为例。在通话次数统计维度上的通话特点为:指定时段的通话次数为7次;在通话时长统计维度上的通话特点为:平均通话时长为12秒;在呼出次数统计维度上的通话特点为:呼入次数占总通话次数的比例为14%,呼出次数占总通话次数的比例为86%;在通话地点和通话号码所在地统计维度上的通话特点为:通话地点和通话号码所在地均处于同一固定区域且两者平均距离为571米;在通话号码是否是联系人统计维度上的通话特点为:通话号码不是联系人的比例为86%。
三、服务器根据n个维度对应的n个通话特点得出电话号码的通话规律。
以上述步骤二所统计的每个统计维度上的通话特点为例,该电话号码的通话规律为:指定时段的通话次数为7次、平均通话时长为12秒、呼出次数占总通话次数的比例为86%、通话地点和通话号码所在地均处于同一固定区域且两者平均距离为300米、和通话号码不是联系人的比例为86%,即通话号码为陌生号码的比例为86%。
在步骤206中,计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数。
在本实施例中,以预设身份标签是快递员标签为例,快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值。其中,在本实施例中,第三阈值设置为5次,第四阈值设置为20秒,第五阈值设置为80%,第六阈值设置为500米,第七阈值设置为80%。
作为一种可能的实现方式,计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数的方法可以包括如下步骤:
1、统计该电话号码和预设身份标签在每个统计维度上的匹配度。
本实施例中,在通话次数统计维度上的匹配度称为匹配度1、在通话时长统计维度上的匹配度称为匹配度2、在呼出次数统计维度上的匹配度称为匹配度3、在通话地点和通话号码所在地统计维度上的匹配度称为匹配度4、在通话号码是否是联系人统计维度上的匹配度称为匹配度5。
表3示出了该电话号码和预设身份标签为快递员标签在5个统计维度上的匹配度。
匹配度1 | 匹配度2 | 匹配度3 | 匹配度4 | 匹配度5 |
1 | 1 | 1 | 0 | 1 |
本实施例中,指定时段的通话次数7次高于第三阈值5次,故匹配度1为1;平均通话时长12秒低于第四阈值20秒,故匹配度2为1;呼出次数占总通话次数的比例86%高于第五阈值80%,故匹配度3为1;通话地点和通话号码所在地均处于同一固定区域且两者平均距离571米大于第六阈值500米,故匹配度4为0;通话号码不是联系人的比例86%高于第七阈值80%,故匹配度5为1。
2、将每个统计维度上的匹配度和与每个统计维度对应的权重值的乘积和作为匹配指数。
本实施例中,服务器可以预先设置通话次数统计维度对应的权重值为权重1、通话时长统计维度对应的权重值为权重2、呼出次数统计维度对应的权重值为权重3、通话地点和通话号码所在地统计维度对应的权重值为权重4、通话号码是否是联系人统计维度对应的权重值为权重5。
比如,本实施例中,权重1为25%、权重2为20%、权重3为20%、权重4为10%、权重5为25%。
所以,本实施例中,匹配指数=匹配度1*权重1+匹配度2*权重2+匹配度3*权重3+匹配度4*权重4+匹配度5*权重5。
比如,本实施例中,电话号码的通话规律与预设身份标签的通话规律之间的匹配指数=1*25%+1*20%+1*20%+0*10%+1*25%=0.9。
本实施例中,对计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数的方法不做限定。
在步骤208中,若匹配指数大于或等于第一阈值,则电话号码的通话规律与预设身份标签的通话规律匹配,保持预设身份标签不变。
比如,在本实施例中,第一阈值预先设定为0.85。本实施例中,计算出的电话号码的通话规律与预设身份标签的通话规律之间的匹配指数为0.9,0.9>0.85,所以该电话号码的通话规律与预设身份标签的通话规律匹配,保持预设身份标签为快递员标签不变。
在步骤210中,若匹配指数小于第一阈值,则电话号码的通话规律与预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
在另一个实施例中,若第一阈值预先设定为100,若计算出的电话号码的通话规律与预设身份标签的通话规律之间的匹配指数为95,95<100,所以该电话号码的通话规律与预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
可选地,在将预设身份标签确定为错误的身份标签之后,还可以对该电话号码进行重新识别,定义为其他预设身份标签。
其中,预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、业务推销标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种。
快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值。
业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值。
业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值。
订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值。
出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
其中,第三阈值、第四阈值、第五阈值、第六阈值、第七阈值、第八阈值、第九阈值、第十阈值、第十一阈值、第十二阈值、第十三阈值、第十四阈值、第十五阈值、第十六阈值、第十七阈值、第十八阈值、第十九阈值、第二十阈值、第二十一阈值、第二十二阈值、第二十三阈值、第二十四阈值可以是预先设定的数值,也可以是根据大量样本统计学习到的值。
综上所述,本实施例提供的电话号码识别方法,通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
本实施例提供的电话号码识别方法,还通过获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;按照n个统计维度分别统计每个统计维度上的通话特点;根据n个维度对应的n个通话特点得出电话号码的通话规律;解决了如何根据通话记录分析电话号码的通话规律的问题;达到了能够根据通话记录快速、方便地分析出电话号码的通话规律的效果。
本实施例提供的电话号码识别方法,还通过计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数;解决了已有预设身份标签是否错误的问题;达到了若已有预设标签未出错,则保持预设身份标签不变,若已有预设标签出错,则将预设身份标签确定为错误的身份标签的效果。
需要说明的是,上述电话号码识别方法可以应用于黄页中,例如,黄页中存放有500个预设身份标签为快递员标签的电话号码,一个月后,服务器采用上述电话号码识别方法进行识别,发现其中有11个电话号码疑似非快递员标签,则将该11个电话号码存放至疑似错误电话号码库中,等待人工校验;达到了节省人力资源的效果。
图3是根据又一示例性实施例示出的一种电话号码识别方法的流程图,本实施例以该电话号码识别方法应用于服务器中且该电话号码未对应有预设身份标签来举例说明。该电话号码识别方法可以包括如下几个步骤:
在步骤302中,获取电话号码在一个历史时间段内的通话记录。
服务器获取电话号码在一个历史时间段内的通话记录。对于一个电话号码,服务器可以每隔预定时间获取该电话号码在一个历史时间段内的通话记录;也可以在该电话号码每次有新的通话记录后,获取该电话号码在一个历史时间段内的通话记录。
服务器可以从终端获取电话号码的通话记录。在服务器是云端电话本所对应的服务器时,服务器可以从自身保存的多个电话号码的通话记录中获取某一个电话号码的通话记录。
其中,历史时间段可以是以当前时间为终点,固定时长为长度的时间段;历史时间段也可以是上一个月、上一季度、上半年等历史时间段。
其中,通话记录可以包括:通话时间、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种。
比如,表1示出了服务器获取的一个电话号码在2014年9月9日10:00-16:00的通话记录。
在步骤304中,根据通话记录分析电话号码的通话规律。
服务器根据获取的通话记录分析电话号码的通话规律。该步骤304可以包括但不限于如下子步骤:
一、服务器获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种。
以上述表1所提供的通话记录为例,该通话记录在5个统计维度上的数据分别为:指定时段的通话次数为7次;7次通话对应的每次通话时长分别为10秒、12秒、8秒、9秒、15秒、20秒、10秒;7次通话对应的呼入次数为1次,呼出次数为6次;7次通话对应的通话地点和通话号码所在地均为城市A,两者距离分别为450米、250米、300米、350米、150米、2000米、500米;7次通话对应的通话号码6次不是联系人,1次是联系人。
其中,指定时段可以按照一个月、一天、每天的6:00-10:00、每天的8:00-15:00等等来统计。
二、服务器按照n个统计维度分别统计每个统计维度上的通话特点。
以上述步骤一所获取的通话记录在5个统计维度上的数据为例。在通话次数统计维度上的通话特点为:指定时段的通话次数为7次;在通话时长统计维度上的通话特点为:平均通话时长为12秒;在呼出次数统计维度上的通话特点为:呼入次数占总通话次数的比例为14%,呼出次数占总通话次数的比例为86%;在通话地点和通话号码所在地统计维度上的通话特点为:通话地点和通话号码所在地均处于同一固定区域且两者平均距离为571米;在通话号码是否是联系人统计维度上的通话特点为:通话号码不是联系人的比例为86%,即通话号码为陌生号码的比例为86%。
三、服务器根据n个维度对应的n个通话特点得出电话号码的通话规律。
以上述步骤二所统计的每个统计维度上的通话特点为例,该电话号码的通话规律为指定时段的通话次数为7次、平均通话时长为12秒、呼出次数占总通话次数的比例为86%、通话地点和通话号码所在地均处于同一固定区域且两者平均距离为300米、和通话号码不是联系人的比例为86%。
在步骤306中,分别计算电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数。
假设服务器提供有5种预设身份标签的通话规律。分别如下:
第一种:预设身份标签是快递员标签,快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值。
其中,在本实施例中,第三阈值设置为5次,第四阈值设置为20秒,第五阈值设置为80%,第六阈值设置为500米,第七阈值设置为80%。
第二种,预设身份标签是业务咨询标签,业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值。
其中,在本实施例中,第八阈值设置为10次,第九阈值设置为3分钟,第十阈值设置为10%,第十一阈值设置为80%。
第三种,预设身份标签是业务推销标签,业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值。
其中,在本实施例中,第十二阈值设置为20次,第十三阈值设置为5分钟,第十四阈值设置为60%,第十五阈值设置为60%。
第四种,预设身份标签是订餐标签,订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值。
其中,在本实施例中,第十六阈值设置为10次,第十七阈值设置为60秒,第十八阈值设置为10%,第十九阈值设置为1000米,第二十阈值设置为80%。
第五种,预设身份标签是出租车标签,出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
其中,在本实施例中,第二十一阈值设置为5次,第二十二阈值设置为60秒,第二十三阈值设置为10%,第二十四阈值设置为80%。
其中,第三阈值、第四阈值、第五阈值、第六阈值、第七阈值、第八阈值、第九阈值、第十阈值、第十一阈值、第十二阈值、第十三阈值、第十四阈值、第十五阈值、第十六阈值、第十七阈值、第十八阈值、第十九阈值、第二十阈值、第二十一阈值、第二十二阈值、第二十三阈值、第二十四阈值可以是预先设定的数值,也可以是根据大量样本统计学习到的值。
服务器分别计算该电话号码的通话规律与5个预设身份标签的通话规律的匹配指数。
作为一种可能的实现方式,服务器计算电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数的方法可以是如下方法:
1、统计该电话号码和每一个预设身份标签在每个统计维度上的匹配度。
本实施例中,在预设身份标签为快递员标签时,指定时段的通话次数7次高于第三阈值5次,故在通话次数统计维度上的匹配度为1;平均通话时长12秒低于第四阈值20秒,故在通话时长统计维度上的匹配度为1;呼出次数占总通话次数的比例86%高于第五阈值80%,故在呼出次数统计维度上的匹配度为1;通话地点和通话号码所在地均处于同一固定区域且两者平均距离571米大于第六阈值500米,故在通话地点和通话号码所在地统计维度上的匹配度为0;通话号码不是联系人的比例86%高于第七阈值80%,故在通话号码是否是联系人统计维度上的匹配度为1。
本实施例中,在预设身份标签为业务咨询标签时,指定时段的通话次数7次低于第八阈值10次,故在通话次数统计维度上的匹配度为0;平均通话时长12秒低于第九阈值3分钟,故在通话时长统计维度上的匹配度为0;呼出次数占总通话次数的比例86%高于第十阈值10%,故在呼出次数统计维度上的匹配度为0;通话号码不是联系人的比例86%高于第十一阈值80%,故在通话号码是否是联系人统计维度上的匹配度为1。
本实施例中,在预设身份标签为业务推销标签时,指定时段的通话次数7次低于第十二阈值20次,故在通话次数统计维度上的匹配度为0;平均通话时长12秒低于第十三阈值5分钟,故在通话时长统计维度上的匹配度为0;呼出次数占总通话次数的比例86%高于第十四阈值60%,故在呼出次数统计维度上的匹配度为1;通话号码不是联系人的比例86%高于第十五阈值60%,故在通话号码是否是联系人统计维度上的匹配度为1。
本实施例中,在预设身份标签为订餐标签时,指定时段的通话次数7次低于第十六阈值10次,故在通话次数统计维度上的匹配度为0;平均通话时长12秒低于第十七阈值60秒,故在通话时长统计维度上的匹配度为1;呼出次数占总通话次数的比例86%高于第十八阈值10%,故在呼出次数统计维度上的匹配度为0;通话地点和通话号码所在地均处于同一固定区域且两者平均距离571米小于第十九阈值1000米,故在通话地点和通话号码所在地统计维度上的匹配度为1;通话号码不是联系人的比例86%高于第二十阈值80%,故在通话号码是否是联系人统计维度上的匹配度为1。
本实施例中,在预设身份标签为出租车标签时,指定时段的通话次数7次高于第二十一阈值5次,故在通话次数统计维度上的匹配度为1;平均通话时长12秒低于第二十二阈值60秒,故在通话时长统计维度上的匹配度为1;呼出次数占总通话次数的比例86%高于第二十三阈值10%,故在呼出次数统计维度上的匹配度为0;通话地点和通话号码所在地均处于同一固定区域,故在通话地点和通话号码所在地统计维度上的匹配度为1;通话号码不是联系人的比例86%高于第二十四阈值80%,故在通话号码是否是联系人统计维度上的匹配度为1。
2、将每一个预设身份标签对应的每个统计维度上的匹配度和与每个统计维度对应的权重值的乘积和作为匹配指数。
本实施例中,假设通话次数统计维度对应的权重值为权重1、通话时长统计维度对应的权重值为权重2、呼出次数统计维度对应的权重值为权重3、通话地点和通话号码所在地统计维度对应的权重值为权重4、通话号码是否是联系人统计维度对应的权重值为权重5。
比如,本实施例中,权重1为25%、权重2为20%、权重3为20%、权重4为10%、权重5为25%。
在预设身份标签为快递员标签时,该电话号码的通话规律与快递员标签的通话规律之间的匹配指数=1*25%+1*20%+1*20%+0*10%+1*25%=0.9;
在预设身份标签为业务咨询标签时,该电话号码的通话规律与业务咨询标签的通话规律之间的匹配指数=0*25%+0*20%+0*20%+1*25%=0.25;
在预设身份标签为业务推销标签时,该电话号码的通话规律与业务推销标签的通话规律之间的匹配指数=0*25%+0*20%+1*20%+1*25%=0.45;
在预设身份标签为订餐标签时,该电话号码的通话规律与订餐标签的通话规律之间的匹配指数=0*25%+1*20%+0*20%+1*10%+1*25%=0.55;
在预设身份标签为出租车标签时,该电话号码的通话规律与出租车标签的通话规律之间的匹配指数=1*25%+1*20%+0*20%+1*10%+1*25%=0.8。
其中,数值最高的匹配指数为0.9,预设身份标签对应为快递员标签。
本实施例中,对计算电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数的方法不做限定。
在步骤308中,当数值最高的匹配指数大于第二阈值时,将数值最高的匹配指数所对应的预设身份标签确定为与电话号码对应的身份标签。
比如,在本实施例中,第二阈值预先设定为0.88。本实施例中,数值最高的匹配指数为0.9,因为0.9>0.88,所以将数值最高的匹配指数所对应的快递员标签确定为与该电话号码对应的身份标签。
当数值最高的匹配指数小于等于第二阈值时,该电话号码对应的身份标签与预设身份标签均不匹配。
综上所述,本实施例提供的电话号码识别方法,通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
本实施例提供的电话号码识别方法,还通过获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;按照n个统计维度分别统计每个统计维度上的通话特点;根据n个维度对应的n个通话特点得出电话号码的通话规律;解决了如何根据通话记录分析电话号码的通话规律的问题;达到了能够根据通话记录快速、方便地分析出电话号码的通话规律的效果。
本实施例提供的电话号码识别方法,还通过计算电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数;解决了未对应有预设身份标签的电话号码对应什么身份的问题;达到了将数值最高的匹配指数所对应的预设身份标签确定为与电话号码对应的身份标签的效果。
需要说明的是,上述电话号码识别方法可以应用于该电话号码是被用户举报的垃圾电话号码,但是该垃圾电话号码尚未分类中,例如,有100个用户举报的垃圾电话号码,服务器采用上述电话号码识别方法进行识别,发现其中有20个电话号码可能是对应快递员标签的电话号码,则将该20个电话号码存放至可能是快递员标签的电话号码库中,等待人工校验;达到了节省人力资源的效果。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图4是根据一示例性实施例示出的一种电话号码识别装置的框图,该电话号码识别装置可以通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该电话号码识别装置可以包括:记录获取模块420、规律分析模块440和规律匹配模块460。
记录获取模块420,被配置为获取电话号码在一个历史时间段内的通话记录。
规律分析模块440,被配置为根据通话记录分析电话号码的通话规律。
规律匹配模块460,被配置为将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。
综上所述,本实施例提供的电话号码识别装置,通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
图5是根据另一示例性实施例示出的一种电话号码识别装置的框图,该电话号码识别装置可以通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该电话号码识别装置可以包括:记录获取模块520、规律分析模块540和规律匹配模块560。
记录获取模块520,被配置为获取电话号码在一个历史时间段内的通话记录。
规律分析模块540,被配置为根据通话记录分析电话号码的通话规律。
规律匹配模块560,被配置为将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。
在第一种可能的实现方式中,规律匹配模块560,包括:
第一计算子模块561,被配置为在电话号码已对应有一个预设身份标签时,计算电话号码的通话规律与预设身份标签的通话规律之间的匹配指数。
第一匹配子模块563,被配置为若匹配指数大于或等于第一阈值,则电话号码的通话规律与预设身份标签的通话规律匹配,保持预设身份标签不变。
第二匹配子模块565,被配置为若匹配指数小于第一阈值,则电话号码的通话规律与预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
在第二种可能的实现方式中,规律匹配模块560,包括:
第二计算子模块567,被配置为在电话号码未对应有预设身份标签时,分别计算电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数。
标签确定子模块569,被配置为当数值最高的匹配指数大于第二阈值时,将数值最高的匹配指数所对应的预设身份标签确定为与电话号码对应的身份标签。
可选地,规律分析模块540,包括:
数据获取子模块541,被配置为获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种。
特点统计子模块543,被配置为按照n个统计维度分别统计每个统计维度上的通话特点。
规律得出子模块545,被配置为根据n个维度对应的n个通话特点得出电话号码的通话规律。
可选地,预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、业务推销标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种。
快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值。
业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值。
业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值。
订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值。
出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
其中,第三阈值、第四阈值、第五阈值、第六阈值、第七阈值、第八阈值、第九阈值、第十阈值、第十一阈值、第十二阈值、第十三阈值、第十四阈值、第十五阈值、第十六阈值、第十七阈值、第十八阈值、第十九阈值、第二十阈值、第二十一阈值、第二十二阈值、第二十三阈值、第二十四阈值可以是预先设定的数值,也可以是根据大量样本统计学习到的值。
综上所述,本实施例提供的电话号码识别装置,通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
本实施例提供的电话号码识别方法,还通过获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;按照n个统计维度分别统计每个统计维度上的通话特点;根据n个维度对应的n个通话特点得出电话号码的通话规律;解决了如何根据通话记录分析电话号码的通话规律的问题;达到了能够根据通话记录快速、方便地分析出电话号码的通话规律的效果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于电话号码识别的装置600的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当装置600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到装置600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图1、图2或者图3所示的电话号码识别方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述图1、图2或者图3所示的电话号码识别方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置600的处理器执行时,使得装置600能够执行上述图1、图2或者图3所示的电话号码识别方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (7)
1.一种电话号码识别方法,其特征在于,所述方法包括:
获取电话号码在一个历史时间段内的通话记录,所述电话号码为黄页中已对应有预设身份标签的电话号码;
根据所述通话记录分析所述电话号码的通话规律;
将所述电话号码的通话规律与所述预设身份标签的通话规律进行匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新确认,所述预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
2.根据权利要求1所述的方法,其特征在于,所述将所述电话号码的通话规律与所述预设身份标签的通话规律进行匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新确认,包括:
在所述电话号码已对应有一个预设身份标签时,计算所述电话号码的通话规律与所述预设身份标签的通话规律之间的匹配指数;
若所述匹配指数大于或等于第一阈值,则所述电话号码的通话规律与所述预设身份标签的通话规律匹配,保持所述预设身份标签不变;
若所述匹配指数小于所述第一阈值,则所述电话号码的通话规律与所述预设身份标签对应的通话规律不匹配,将所述预设身份标签确定为错误的身份标签。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述通话记录分析所述电话号码的通话规律,包括:
获取所述通话记录在n个统计维度上的数据,所述n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;
按照所述n个统计维度分别统计每个统计维度上的通话特点;
根据所述n个维度对应的n个通话特点得出所述电话号码的通话规律。
4.一种电话号码识别装置,其特征在于,所述装置包括:
记录获取模块,被配置为获取电话号码在一个历史时间段内的通话记录,所述电话号码为黄页中已对应有预设身份标签的电话号码;
规律分析模块,被配置为根据所述通话记录分析所述电话号码的通话规律;
规律匹配模块,被配置为将所述电话号码的通话规律与所述预设身份标签的通话规律进行匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新确认,所述预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
5.根据权利要求4所述的装置,其特征在于,所述规律匹配模块,包括:
第一计算子模块,被配置为在所述电话号码已对应有一个预设身份标签时,计算所述电话号码的通话规律与所述预设身份标签的通话规律之间的匹配指数;
第一匹配子模块,被配置为若所述匹配指数大于或等于第一阈值,则所述电话号码的通话规律与所述预设身份标签的通话规律匹配,保持所述预设身份标签不变;
第二匹配子模块,被配置为若所述匹配指数小于所述第一阈值,则所述电话号码的通话规律与所述预设身份标签对应的通话规律不匹配,将所述预设身份标签确定为错误的身份标签。
6.根据权利要求4或5所述的装置,其特征在于,所述规律分析模块,包括:
数据获取子模块,被配置为获取所述通话记录在n个统计维度上的数据,所述n个统计维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的至少一种;
特点统计子模块,被配置为按照所述n个统计维度分别统计每个统计维度上的通话特点;
规律得出子模块,被配置为根据所述n个维度对应的n个通话特点得出所述电话号码的通话规律。
7.一种电话号码识别装置,其特征在于,包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器被配置为:
获取电话号码在一个历史时间段内的通话记录,所述电话号码为黄页中已对应有预设身份标签的电话号码;
根据所述通话记录分析所述电话号码的通话规律;
将所述电话号码的通话规律与所述预设身份标签的通话规律进行匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新确认,所述预设身份标签的通话规律包括快递员标签的通话规律、业务咨询标签的通话规律、订餐标签的通话规律、出租车标签的通话规律中的至少一种;
所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第七阈值;
所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的比例高于第十一阈值;
所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联系人的比例高于第十五阈值;
所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例高于第二十阈值;
所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410482122.9A CN104320525B (zh) | 2014-09-19 | 2014-09-19 | 电话号码识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410482122.9A CN104320525B (zh) | 2014-09-19 | 2014-09-19 | 电话号码识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104320525A CN104320525A (zh) | 2015-01-28 |
CN104320525B true CN104320525B (zh) | 2017-08-15 |
Family
ID=52375692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410482122.9A Active CN104320525B (zh) | 2014-09-19 | 2014-09-19 | 电话号码识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104320525B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104735671B (zh) * | 2015-02-27 | 2018-11-09 | 腾讯科技(深圳)有限公司 | 一种识别恶意电话的方法和装置 |
CN106302938B (zh) * | 2015-05-22 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 通信事件处理方法和装置 |
CN104994001A (zh) * | 2015-06-26 | 2015-10-21 | 小米科技有限责任公司 | 信息推荐方法、服务器及终端 |
CN105657195B (zh) * | 2015-12-23 | 2018-09-18 | 小米科技有限责任公司 | 一种确定业务员通信账户对应的业务区域的方法和装置 |
CN106993290B (zh) * | 2016-01-20 | 2021-05-18 | 阿里巴巴集团控股有限公司 | 通信记录的检测方法及装置 |
CN105611084B (zh) * | 2016-01-29 | 2019-04-09 | 中国联合网络通信集团有限公司 | 一种欺诈用户的可疑度计算方法及可疑度计算系统 |
CN106713579B (zh) * | 2016-05-05 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种电话号码识别方法及装置 |
CN106101464A (zh) * | 2016-05-26 | 2016-11-09 | 北京小米移动软件有限公司 | 号码标识方法及装置 |
CN107517463A (zh) * | 2016-06-15 | 2017-12-26 | 中国移动通信集团浙江有限公司 | 一种电话号码的识别方法和装置 |
CN106954218B (zh) * | 2017-03-15 | 2019-08-30 | 中国联合网络通信集团有限公司 | 一种骚扰号码分类方法、装置和系统 |
CN107277227B (zh) * | 2017-05-17 | 2020-12-04 | 泾县谷声信息科技有限公司 | 移动终端通话方法、移动终端及计算机可读存储介质 |
CN107273531B (zh) * | 2017-06-28 | 2021-01-08 | 百度在线网络技术(北京)有限公司 | 电话号码分类识别方法、装置、设备及存储介质 |
CN107317935A (zh) * | 2017-07-07 | 2017-11-03 | 北京奇虎科技有限公司 | 电话号码查询、显示方法及装置、云端服务器及终端设备 |
CN107819924A (zh) * | 2017-11-06 | 2018-03-20 | 东软集团股份有限公司 | 一种垃圾电话号码的识别方法、装置及设备 |
CN110010135B (zh) * | 2018-01-05 | 2024-05-07 | 北京搜狗科技发展有限公司 | 一种基于语音的身份识别方法、装置和电子设备 |
CN108449482A (zh) * | 2018-02-09 | 2018-08-24 | 北京泰迪熊移动科技有限公司 | 号码识别的方法和系统 |
CN109474923B (zh) * | 2018-11-23 | 2022-02-01 | 中国联合网络通信集团有限公司 | 对象识别方法及装置、存储介质 |
CN110969861B (zh) * | 2019-12-20 | 2022-10-14 | 中国移动通信集团黑龙江有限公司 | 一种车辆识别方法、装置、设备及计算机存储介质 |
CN113556697B (zh) * | 2021-07-21 | 2022-04-26 | 智慧足迹数据科技有限公司 | 基于手机信令的快递员识别方法及相关装置 |
CN114500743B (zh) * | 2022-01-24 | 2024-07-12 | 浪潮软件科技有限公司 | 一种基于时空碰撞算法的信息分析方法 |
CN114880375A (zh) * | 2022-04-29 | 2022-08-09 | 深圳市金瑞铭科技有限公司 | 云平台的图像处理方法及设备 |
CN116431695B (zh) * | 2023-06-08 | 2023-10-20 | 荣耀终端有限公司 | 一种推荐信息确定方法、电子设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007056577A2 (en) * | 2005-11-09 | 2007-05-18 | Vonage Holdings Corp. | Method and system for customized caller identification |
CN101150625A (zh) * | 2007-11-01 | 2008-03-26 | 华为技术有限公司 | 一种呼叫记录的分析方法及装置 |
CN101217820A (zh) * | 2008-01-15 | 2008-07-09 | 中兴通讯股份有限公司 | 一种骚扰号码的识别系统及识别方法 |
CN103369095A (zh) * | 2012-03-30 | 2013-10-23 | 北京千橡网景科技发展有限公司 | 识别来电或短消息类型的方法和设备 |
CN102665014A (zh) * | 2012-04-13 | 2012-09-12 | 北京搜狗科技发展有限公司 | 号码信息提示方法及系统 |
-
2014
- 2014-09-19 CN CN201410482122.9A patent/CN104320525B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104320525A (zh) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104320525B (zh) | 电话号码识别方法及装置 | |
CN105100366B (zh) | 骚扰电话号码确定方法、装置和系统 | |
CN104836924B (zh) | 号码标记方法及装置 | |
CN104980580B (zh) | 短信息查看方法及装置 | |
CN104978861B (zh) | 车辆标识方法及装置 | |
CN105488025A (zh) | 模板构建方法和装置、信息识别方法和装置 | |
CN104021350A (zh) | 隐私信息隐藏方法及装置 | |
CN104809157B (zh) | 号码识别方法及装置 | |
CN103348659A (zh) | 用于识别处于相似声音环境中的移动装置的方法和设备 | |
KR20160048708A (ko) | 통신 메시지 인식 방법, 장치, 프로그램 및 저장매체 | |
CN107665354A (zh) | 识别身份证的方法及装置 | |
CN107230137A (zh) | 商品信息获取方法及装置 | |
CN106204097A (zh) | 信息推送方法、装置和移动终端 | |
CN106775403A (zh) | 获取卡顿信息的方法及装置 | |
CN107563994A (zh) | 图像的显著性检测方法及装置 | |
CN105302877B (zh) | 用于短信领域分类的方法、短信领域识别方法及装置 | |
CN111428032A (zh) | 内容质量评价方法及装置、电子设备、存储介质 | |
CN109767369A (zh) | 一种考勤统计方法、系统及终端设备 | |
WO2017020487A1 (zh) | 短信处理方法及装置 | |
CN107544802A (zh) | 设备识别方法及装置 | |
CN108733226A (zh) | 一种信息推荐的方法及装置 | |
CN106599191A (zh) | 用户属性分析方法及装置 | |
CN104216969B (zh) | 阅读标记方法及装置 | |
US10244367B2 (en) | Short message identification method and device, and storage medium | |
CN106921958A (zh) | 退订业务的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |