CN108256542A - 一种通信标识的特征确定方法、装置及设备 - Google Patents

一种通信标识的特征确定方法、装置及设备 Download PDF

Info

Publication number
CN108256542A
CN108256542A CN201611247007.9A CN201611247007A CN108256542A CN 108256542 A CN108256542 A CN 108256542A CN 201611247007 A CN201611247007 A CN 201611247007A CN 108256542 A CN108256542 A CN 108256542A
Authority
CN
China
Prior art keywords
communication identifier
identified
confidence level
attribute information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611247007.9A
Other languages
English (en)
Inventor
王志军
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201611247007.9A priority Critical patent/CN108256542A/zh
Publication of CN108256542A publication Critical patent/CN108256542A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及通信领域,公开了一种通信标识的特征确定方法、装置及设备,以解决现有技术中对于不位于云端号码库或本地号码库的通信标识的相关信息无法识别的技术问题。该方法包括:获得待识别通信标识的属性信息;将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。达到了即使云端号码库不存在待识别通信标识,也能够对待识别通信标识的相关信息进行识别的技术效果。

Description

一种通信标识的特征确定方法、装置及设备
技术领域
本发明涉及通信领域,尤其涉及一种通信标识的特征确定方法、装置及设备。
背景技术
号码通是一款基于海量数据,实现了智能拦截方案的号码工具类软件。通过用户上传标记及抓取互联网中的公开电话信息,建立海量号码数据库,让诈骗,中介,推销等骚扰号码无处遁形。面对陌生的骚扰号码用户可以进行分类“标记”,充分利用智慧众包,让那些数据库之外的漏网骚扰电话一一得到标记。
号码通的背后是一个庞大的云端号码库,其来源包括互联网抓取、用户标记、商家合作等等。号码通进行陌电识别的原理是当陌生通信标识打来的时候联网到云端号码库查询并将查询得到的陌生通信标识的信息返回给客户端,客户端将其展示给用户,从而帮助用户得知陌生通信标识的信息。
可见,基于现有技术中的方案,只能识别出位于云端号码库或本地号码库的通信标识的相关信息,而对于不位于云端号码库或本地号码库的通信标识的相关信息则无法识别。
发明内容
本发明提供一种通信标识的特征确定方法、装置及设备,以解决现有技术中对于不位于云端号码库或本地号码库的通信标识的相关信息无法识别的技术问题。
第一方面,本发明实施例提供一种通信标识的特征确定方法,包括:
获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
结合第一方面,在第一种可选的实施例中,所述特征识别模型为可信度识别模型,所述基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数,包括:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
结合第一方面的第一种可选的实施例,在第二种可选的实施例中,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;基于所述可信度值确定出所述可信度参数。
结合第一方面的第二种可选的实施例,在第三种可选的实施例中,所述基于所述可信度值确定出所述可信度参数,包括:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
结合第一方面的第一种可选的实施例,在第四种可选的实施例中,所述可信度识别模型通过以下方式确定:
确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
结合第一方面的第四种可选的实施例,在第五种可选的实施例中,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
基于所述出现概率确定出所述可信度参数。
结合第一方面的第一种可选的实施例,在第六种可选的实施例中,所述可信度识别模型通过以下方式确定:
将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
结合第一方面的第六种可选的实施例,在第七种可选的实施例中,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
基于所述逻辑回归结果确定出所述可信度参数。
结合第一方面的第一种可选的实施例,在第八种可选的实施例中,在所述确定出所述待识别通信标识的可信度参数之后,所述方法进一步包括:
判断所述待识别通信标识是否为无人号码;
如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
结合第一方面的第一种可选的实施例,在第九种可选的实施例中,在所述确定出所述待识别通信标识的可信度参数之后,所述方法进一步包括:
获取电子设备的特征信息;
基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
结合第一方面的第九种可选的实施例,在第十种可选的实施例中,所述获取电子设备的特征信息,包括:
获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
结合第一方面或第一方面的第一至七种可选的实施例中的任一种可选的实施例,在第十一种可选的实施例中,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
第二方面,本发明实施例提供一种通信标识的特征确定装置,包括:
获得模块,用于获得待识别通信标识的属性信息;
输入模块,用于将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
识别模块,用于基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
结合第二方面,在第一种可选的实施例中,所述特征识别模型为可信度识别模型,所述识别模块,用于:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
结合第二方面的第一种可选的实施例,在第二种可选的实施例中,所述识别模块,用于:
第一识别单元,用于基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
第二识别单元,用于基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;第一确定单元,用于基于所述可信度值确定出所述可信度参数。
结合第二方面的第二种可选的实施例,在第三种可选的实施例中,所述第一确定单元,用于:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
结合第二方面的第一种可选的实施例,在第四种可选的实施例中,,所述装置进一步包括:
第一确定模块,用于确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
第二确定模块,用于基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
结合第二方面的第四种可选的实施例,在第五种可选的实施例中,所述识别模块,包括:
第二确定单元,用于基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
第三确定单元,用于基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
第四确定单元,用于基于所述出现概率确定出所述可信度参数。
结合第二方面的第一种可选的实施例,在第六种可选的实施例中,所述装置进一步包括:
划分模块,用于将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
训练模块,用于采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
结合第二方面的第六种可选的实施例,在第七种可选的实施例中,所述识别模块,包括:
第五确定单元,用于基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
输入单元,用于将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
第六确定单元,用于基于所述逻辑回归结果确定出所述可信度参数。
结合第二方面的第一种可选的实施例,在第八种可选的实施例中,所述装置进一步包括:
判断模块,用于判断所述待识别通信标识是否为无人号码;
调整模块,用于如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
结合第二方面的第一种可选的实施例,在第九种可选的实施例中,所述装置进一步包括:
获取模块,用于获取电子设备的特征信息;
提供模块,用于基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
结合第二方面的第九种可选的实施例,在第十种可选的实施例中,所述获取模块,包括:
第一获取单元,用于获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
第二获取单元,用于获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
结合第二方面或第二方面的第一至七种可选的实施例中的任一种可选的实施例,在第十一种可选的实施例中,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
第三方面,本发明实施例提供一种设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
结合第三方面,在第一种可选的实施例中,所述特征识别模型为可信度识别模型,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
结合第三方面的第一种可选的实施例,在第二种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;基于所述可信度值确定出所述可信度参数。
结合第三方面的第二种可选的实施例,在第三种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
结合第三方面的第一种可选的实施例,在第四种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
结合第三方面的第四种可选的实施例,在第五种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
基于所述出现概率确定出所述可信度参数。
结合第三方面的第一种可选的实施例,在第六种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
结合第三方面的第六种可选的实施例,在第七种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
基于所述逻辑回归结果确定出所述可信度参数。
结合第三方面的第一种可选的实施例,在第八种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
判断所述待识别通信标识是否为无人号码;
如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
结合第三方面的第一种可选的实施例,在第九种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取电子设备的特征信息;
基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
结合第三方面的第九种可选的实施例,在第十种可选的实施例中,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
结合第三方面或第三方面的第一至七种可选的实施例中的任一种可选的实施例,在第十一种可选的实施例中,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
本发明有益效果如下:
由于在本发明实施例中,可以通过对应至少两类特征类别的至少两类通信标识样本训练出特征识别模型,每个通信标识样本中都包含通信标识以及对应通信标识的属性信息;从而在获得待识别通信标识之后,可以将待识别通信标识的属性信息输入该特征识别模型,从而识别出待识别通信标识的特征参数,故而达到了即使云端号码库不存在待识别通信标识,也能够对待识别通信标识的相关信息进行识别的技术效果,提高了对通信标识识别的全面性。
附图说明
图1为本发明实施例的通信标识的特征确定方法的流程图;
图2为本发明实施例的通信标识的特征确定装置的结构图;
图3为本发明实施例中实施通信标识的特征确定方法的电子设备的结构图;
图4为本发明实施例中实施通信标识的特征确定方法的服务器的结构图。
具体实施方式
本发明提供一种通信标识的特征确定方法、装置及设备,以解决现有技术中对于不位于云端号码库或本地号码库的通信标识的相关信息无法识别的技术问题。
本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
通过对应至少两类特征类别的至少两类通信标识样本训练出特征识别模型,每个通信标识样本中都包含通信标识以及对应通信标识的属性信息;从而在获得待识别通信标识之后,可以将待识别通信标识的属性信息输入该特征识别模型,从而识别出待识别通信标识的特征参数,故而达到了即使云端号码库不存在待识别通信标识,也能够对待识别通信标识的相关信息进行识别的技术效果,提高了对通信标识识别的全面性。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
第一方面,本发明实施例提供一种通信标识的特征确定方法,请参考图1,所述方法包括:
步骤S101:获得待识别通信标识的属性信息;
步骤S102:将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
步骤S103:基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
举例来说,该方案可以应用于客户端的电子设备,电子设备例如可以为:手机、平板电脑、笔记本电脑等等,电子设备可以在接收到待识别通信标识的通信信息(例如:语音通信请求、短信、彩信等等)之后,通过该方案对待识别通信标识进行识别;该方案也可以应用于服务器,电子设备在接收到待识别通信标识的通信信息之后,将待识别通信标识发送至服务器,服务器基于该方案对待识别通信标识进行识别,然后将识别出的特征参数返回给电子设备;又或者,服务器可以每隔预设时间间隔(例如:1天、2天等等)收集不位于云端号码库的通信标识,然后基于方案对每个通信标识进行识别,该云端号码库往往用于存储具备标签信息的通信标识。
步骤S101中,该属性信息可以包含一种或多种属性信息,例如:①被标记的次数,其中,通信标识在向其他通信标识发起语音通信请求之后,就可能被其他通信标识的用户标记,该标记例如可以为:骚扰电话、广告、诈骗等等,则可以统计其被标记的次数;②作为被叫的次数,也就是可以统计通信标识接收到多少次语音通信请求,从而获得该通信标识作为被叫的次数;③作为被叫的人数,也就是可以统计通信标识接收到多少人的语音通信信息,从而获得该通信标识作为被叫的人数;④作为主叫的通话时长,该通话时长可以为总通话时长,也可以为平均通话时长;⑤作为被叫的通话时长,同样该通话时长可以为总通话时长,也可以为平均通话时长;⑥总通话时长,其可以为作为主叫和被叫的总通话时长;⑦在通讯录中被保存的次数⑧被拉黑的次数等等。在具体实施过程中,上述任意一项属性信息都可以为该通信标识在产生开始的属性信息,也可以为预设时间段(例如:1个月、2个月等等)内的属性信息,本发明实施例不作限制。
步骤S102中,该特征识别模型可以为多种特征识别模型,例如:①所述特征识别模型为可信度识别模型,通过该特征识别模型可以识别出该待识别通信标识的可信度参数。举例来说,该可信度参数往往用于向用户提示该待识别通信标识是否为可信的通信标识,例如:如果该待识别通信标识为骚扰电话、诈骗电话等等,则该待识别通信标识往往为不可信的通信标识,如果该待识别通信标识为普通用户的通信标识,则该待识别通信标识往往为可信的通信标识等等。②所述特征识别模型为标签识别模型,通过该标签识别模型可以识别出该待识别通信标识的标签信息,该标签信息用于对该待识别通信标识的用户的身份进行标识,举例来说,该标签信息例如为:诈骗、骚扰、广告、推销、普通用户等等,在其他用户接收到该待识别通信标识的通信信息之后,可以显示该标签信息,现有技术中往往针对某个通信标识的相同用户标记达到预设数量(例如:100、200等等)时,才将该用户标记作为对应通信标识的标签信息,本申请可以不需要对应通信标识的用户标记达到预设数量,就可以确定出对应通信标识的标签信息,因此其也能够对通信标识产生提示。
步骤S102中,可以通过多种方式建立特征识别模型,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述特征识别模型通过以下方式确定:确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种特征类别中的每种类别出现的概率;基于所述概率确定出贝叶斯模型所述特征识别模型。
举例来说,假设该特征识别模型为可信度识别模型,至少两种特征类别包括:可信、不可信两种特征类别,其中,可以从被标记的通信标识中提取出标记为特定身份(通常为与用户关系密切的身份)的通信标识作为可信类别的通信标识样本,特定身份例如为:“爸爸”、“妈妈”、“朋友”等身份的通信标识;可以从云端号码库中提取出特定标签信息的通信标识作为不可信类别的通信标识样本,该特定标签信息例如为:骚扰电话、诈骗电话、广告推销等等。当然,也可以通过人工方式划分各个通信标识样本所属的类别,本发明实施例不作限制。
属性特征指的是某种属性信息的属性值或者属性值所属的范围,以属性信息为被标记次数、属性值为特征信息为例,如果被标记次数为5,则其属性特征为5,如果被标记次数为7,则其属性特征为7等等。以属性信息为被标记次数、属性值所属的范围为特征信息为例,假设属性值对应三个范围,分别为[0,5]、[6,10]、[10,+∞),则被标记次数5所对应的特征信息为[0,5],被标记次数7所对应的特征信息为[6,10]等等,假设所确定出的属性特征为5,则可以分别确定出属性特征5(也即:被标记次数5)在可信通信标识样本中出现的次数,然后将其除以总样本数量,就可以获得其在可信通信标识样本中出现的概率,确定出属性特征5在不可信通信标识样本中出现的次数,然后将其除以总样本数量,就可以确定出属性特征5在不可信通信标识样本中出现的概率。其他属性信息的属性特征的确定方式以及属性特征在每个类别出现的概率的计算方式与之类似,在此不再赘述。
假设该特征识别模型为标签识别模型,至少两种特征类别包括:诈骗、骚扰、广告、推销、普通用户,其中,可以从云端号码库中提取出标签信息为:诈骗、骚扰、广告、推销的通信标识以及该通信标识的属性信息,从而获得对应类别的通信标识样本,同时获得多个采样用户,并且获得与这多个采样用户的身份关系密切的通信标识以及该通信标识的属性信息作为普通用户类别的通信标识样本,然后获得每类属性信息的属性特征在各个类别下出现的概率。
其中,可以直接将每类属性信息的属性特征在各个类别下出现的概率作为对应的特征识别模型。
第二种,所述特征识别模型通过以下方式确定:将所述至少两类通信标识样本划分为正样本和负样本,正样本对应第一特征,负样本对应第二特征;采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述特征识别模型。
举例来说,如果该特征识别模型为可信度识别模型,则正样本例如为可信度满足预设条件的样本,所对应的第一特征例如为:可信类别,所述负样本例如为可信度不满足所述预设条件的样本,其对应的第二特征例如为:不可信类别,可以提取标签信息为诈骗、骚扰、广告等的通信标识作为不可信类别所包含的样本,将不可信类别之外的其他样本都作为可信类别所包含的样本,通过将正样本和负样本所对应的属性向量输入逻辑回归模型,进而不断的调整该逻辑回归模型的权重值,最终得到收敛的逻辑回归模型,该逻辑回归模型即为可信度识别模型,其中,每个样本对应的属性向量为该样本的每类属性信息的取值,例如,如果某个通信标识的属性信息的取值如下:
被标记的次数(10),作为被叫的次数(5),作为被叫的人数(3),作为主叫的通话时长(10min),作为被叫的通话时长(60min),总通话时长(70min),在通讯录中被保存的次数(30),被拉黑的次数(0)。
则该通信标识所对应的属性向量可为:[10,5,3,10,60,70,30,0]
当然,还可以基于其他原则确定出通信标识的属性向量,本发明实施例不作限制。
该逻辑回归模型例如为:
其中,x表示通信标识的属性向量,p(1|x,θ)表示某通信标识为可信通信标识的概率;
其中,x表示通信标识的属性向量,p(1|x,θ)表示某通信标识为不可信通信标识的概率。
如果该特征识别模型为标签识别模型,则在只存在两类标签信息(例如:骚扰电话、普通用户)的情况下,则可以选取其中一类标签信息所对应的通信标识为正样本,另一类标签信息所对应通信标识为负样本,从而训练出对应的逻辑回顾模型,该逻辑回归模型即为标签识别模型。
当然,在具体实施过程中,还可以基于其他方式建立特征识别模式,例如:随机森林分类算法等,本发明实施例不再详细列举,并且不作限制。
步骤S103中,基于特征识别模型不同,对待识别通信标识的属性信息的识别方式也不同,下面基于前面所列举的两种特征识别模型分别对其进行介绍。
第一种,如果特征识别模型为贝叶斯模型,所述基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数,包括:基于所述特征识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;基于所述出现概率确定出所述特征参数。
举例来说,假设待识别通信标识的各个属性信息的属性特征包括:①被标记的次数,共记7次;②作为被叫的次数,共计5次;③作为被叫的人数,共计2人;④作为主叫的通话时长,共计16min;⑤作为被叫的通话时长,共计21min;⑥总通话时长,共计37min;⑦在通讯录中被保存的次数,共计50次;⑧被拉黑的次数,共计0次。
则可以从贝叶斯模型中获取被标记为7次的通信标识属于可信类别的条件概率,作为被叫的次数为5次的通信标识属于可信类别的条件概率,作为被叫的人数为2人的通信标识属于可信类别的条件概率,作为主叫的通话时长为16min的通信标识属于可信类别的条件概率,作为被叫的通话时长为21min的通信标识属于可信类别的条件概率,总通话时长为37min的通信标识属于可信类别的条件概率,在通讯录中被保存的次数为50次的通信标识属于可信类别的条件概率,被拉黑次数为0次的通信标识属于可信类别的条件概率,然后对这些条件概率进行相乘,就可以获得该待识别通信标识属于可信类别的概率,针对待识别通信标识属于不可信类别的概率,其计算方式与之类似,在此不再赘述。
在确定出待识别通信标识属于各个类别(例如:可信类别、不可信类别)的概率之后,比较该待识别通信标识属于各个类别的概率大小,将概率最大的特征类别作为该待识别通信标识所属的类别;其中,可以将该待识别通信标识所属的类别直接作为该通信标识的特征参数。例如:如果该特征识别模型为可信度识别模型,则可以将该待识别通信标识所属的类别作为该待识别通信标识的可信度参数。如果该特征识别模型为标签识别模型,则可以将该待识别通信标识所属的类别作为待识别通信标识的标签信息等等。如果该特征识别模型为可信度识别模型的话,则还可以基于该待识别通信标识属于各个类别的概率大小确定出该待识别通信标识的可信度值,基于该可信度值确定出该可信度参数,例如,可以通过以下公式计算该可信度值:
若Pb>Pa,Q=50+(Pb-Pa)*50/(Pb+Pa)…………………………[3]
若Pb<Pa,Q=50-(Pa-Pb)*50/(Pb+Pa)…………………………[4]
其中,待通信标识属于是可信类别的概率为Pa,为不可信类别的概率为Pb,Q表示可信度,取值为[0,100]。
在获得该可信度之后,可以直接将该可信度值作为可信度参数提供给用户,也可以对可信度值进行进一步的处理,从而获得可信度参数,例如:基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
举例来说,安全等级例如包括:可信(Q属于80~100),一般(Q属于60~79),可疑(Q属于40~59),很可疑(Q属于0~39)等等,其中,如果计算出可信度值为48,则可以确定出待识别通信标识所对应的安全等级为:可疑。基于该方案可以针对待识别通信标识进行安全等级的提示,从而达到了提示更加准确的技术效果。
第二种,所述基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数,包括:基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;基于所述逻辑回归结果确定出所述特征参数。
举例来说,可以首先确定出待识别通信标识的属性信息的属性向量,然后将该属性向量输入逻辑回归模型,从而获得逻辑回归结果,如果该逻辑回归模型的公式为公式[1],该逻辑回归结果为待识别通信标识属于第一特征的概率,然后通过1减去逻辑识别结果,就可以获得待识别通信标识属于第二类别的概率,如果该逻辑回归模型的公式为公式[2],该逻辑回归结果为待识别通信标识属于第二特征的概率,然后通过1减去逻辑回归结果,就可以获得待识别通信标识属于第一类别的概率。例如:如果第一特征为可信类别,则基于公式[1]可以确定出待识别通信标识属于可信类别的概率(假设:0.6),然后通过1减去逻辑回归结果,则可以确定出该待识别通信标识属于不可信类别的概率(也即:0.4),其中可以直接输出该逻辑回归结果作为待识别通信标识的特征参数,也可以通过该逻辑回归结果确定出待识别通信标识属于哪个类别,例如:如果基于公式[1]的逻辑回归结果大于预设值(例如:0.5、0.6等等),则可以确定出待识别通信标识属于可信类别,否则说明待识别通信标识属于不可信类别等等。针对特征识别模型为标签识别模型的情况下,其获得标签参数的方式与之类似,在此不再一一赘述。
作为一种可选的实施例,如果特征识别模型为可信度识别模型,则在识别出待识别通信标识的可信度参数之后,还可以对待识别通信标识的可信度参数进行调整,下面列举其中的两种调整方式进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,在所述确定出所述待识别通信标识的可信度参数之后,所述方法还包括:判断所述待识别通信标识是否为无人号码;如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
举例来说,对于空号之类的无人号码,运营商一般会冻结3个月,故而针对待识别通信标识如果通过运营商查询出其为被冻结的号码,则可以待识别通信标识为无人号码,无人号码通常不会是其他普通用户拨打过来的,其极有可能是诈骗电话,故而可以将其可信度等级较低降低,例如:降低一个等级、降为最低等级等等,对应对可信度参数调整例如为:不管步骤S101~S103识别出该待识别通信标识属于哪个可信度类别,直接将其调整为不可信类别;又例如,将其可信度值降为0等等。
第二种,在所述确定出所述待识别通信标识的可信度参数之后,所述方法还可以包括:获取电子设备的特征信息;基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
举例来说,该特征信息可以通过多种方式确定,例如:①获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息,该历史操作记录例如为:针对通信标识的拉黑记录、挂断记录等等,其中,如果用户总是拉黑(或者挂断)某特定位置(例如:西安、南京等等)的来电,则如果确定出该待识别通信标识属于该特定位置,则可以通过调整可信度参数的方式降低其可信度等级,例如:将可信度值降低、将安全等级降低一个等级等等;如果用户总是接听某特定位置(例如:北京、成都等等)的来电,则可以通过调整可信度参数的方式增加其可信度等级,例如:升高可信度值、将安全等级增加一级等等。
②获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
举例来说,该关联数据例如可以为:待识别通信标识与电子设备的通信标识之间是否存在共同好友,如果存在共同好友则通过调整可信度参数的方式提高其可信度等级;如果不存在共同好友,则通过调整可信度参数的方式降低其可信度等等。
基于上述方案,能够基于电子设备的通信标识(也即对应的用户)不同,对待识别通信标识确定出不同的可信度参数,其更加准确。
第二方面,基于同一发明构思,本发明实施例提供一种通信标识的特征确定装置,请参考图2,包括:
获得模块20,用于获得待识别通信标识的属性信息;
输入模块21,用于将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
识别模块22,用于基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
可选的,所述特征识别模型为可信度识别模型,所述识别模块22,用于:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
可选的,所述识别模块22,用于:
第一识别单元,用于基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
第二识别单元,用于基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;第一确定单元,用于基于所述可信度值确定出所述可信度参数。
可选的,所述第一确定单元,用于:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
可选的,所述装置进一步包括:
第一确定模块,用于确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
第二确定模块,用于基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
可选的,所述识别模块22,包括:
第二确定单元,用于基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
第三确定单元,用于基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
第四确定单元,用于基于所述出现概率确定出所述可信度参数。
可选的,所述装置进一步包括:
划分模块,用于将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
训练模块,用于采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
可选的,所述识别模块22,包括:
第五确定单元,用于基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
输入单元,用于将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
第六确定单元,用于基于所述逻辑回归结果确定出所述可信度参数。
可选的,所述装置进一步包括:
判断模块,用于判断所述待识别通信标识是否为无人号码;
调整模块,用于如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
可选的,所述装置进一步包括:
获取模块,用于获取电子设备的特征信息;
提供模块,用于基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
可选的,所述获取模块,包括:
第一获取单元,用于获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
第二获取单元,用于获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
可选的,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
由于本发明第二方面所介绍的装置,为实施本发明实施例第一方面所介绍的通信标识的特征确定方法所采用的装置,基于本发明实施例第一方面所介绍的通信标识的特征确定方法,本领域所属技术人员能够了解本发明实施例第二方面所介绍的装置的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的通信标识的特征确定方法所采用的装置都属于本发明所欲保护的范围。
第三方面,本发明实施例提供一种设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
举例来说,该设备可以为位于客户端的电子设备,也可以为服务器,本发明实施例不作限制。
可选的,所述特征识别模型为可信度识别模型,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;基于所述可信度值确定出所述可信度参数。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
基于所述出现概率确定出所述可信度参数。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
基于所述逻辑回归结果确定出所述可信度参数。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
判断所述待识别通信标识是否为无人号码;
如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取电子设备的特征信息;
基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
可选的,所述设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
可选的,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
由于本发明第三方面所介绍的设备,为实施本发明实施例第一方面所介绍的通信标识的特征确定方法所采用的设备,基于本发明实施例第一方面所介绍的通信标识的特征确定方法,本领域所属技术人员能够了解本发明实施例第三方面所介绍的设备的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的通信标识的特征确定方法所采用的设备都属于本发明所欲保护的范围。
图3是根据一示例性实施例示出的一种通信标识的特征确定方法的电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD视频传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图4是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由设备(位于客户端的电子设备或者服务器)的处理器执行时,使得设备能够执行一种通信标识的特征确定方法,所述方法包括:
获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
可选的,所述特征识别模型为可信度识别模型,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;基于所述可信度值确定出所述可信度参数。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
基于所述出现概率确定出所述可信度参数。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
基于所述逻辑回归结果确定出所述可信度参数。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
判断所述待识别通信标识是否为无人号码;
如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取电子设备的特征信息;
基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
可选的,所述可读存储介质还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
可选的,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
本发明一个或多个实施例,至少具有以下有益效果:
由于在本发明实施例中,可以通过对应至少两类特征类别的至少两类通信标识样本训练出特征识别模型,每个通信标识样本中都包含通信标识以及对应通信标识的属性信息;从而在获得待识别通信标识之后,可以将待识别通信标识的属性信息输入该特征识别模型,从而识别出待识别通信标识的特征参数,故而达到了即使云端号码库不存在待识别通信标识,也能够对待识别通信标识的相关信息进行识别的技术效果,提高了对通信标识识别的全面性。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种通信标识的特征确定方法,其特征在于,包括:
获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
2.如权利要求1所述的方法,其特征在于,所述特征识别模型为可信度识别模型,所述基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数,包括:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数。
3.如权利要求2所述的方法,其特征在于,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识所属的可信度类别,所述可信度类别即为所述可信度参数;和/或,
基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度值;基于所述可信度值确定出所述可信度参数。
4.如权利要求3所述的方法,其特征在于,所述基于所述可信度值确定出所述可信度参数,包括:
基于所述可信度值确定出所述待识别通信标识所属的安全等级,将所述安全等级作为所述可信度参数。
5.如权利要求2所述的方法,其特征在于,所述可信度识别模型通过以下方式确定:
确定出所述至少两类通信标识样本中每类属性信息的属性特征在所述至少两种可信度类别中的每种类别出现的概率;
基于所述概率确定出贝叶斯模型作为所述可信度识别模型。
6.如权利要求5所述的方法,其特征在于,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述可信度识别模型确定出所述待识别通信标识中的每类属性信息的属性特征在每种类别下出现的条件概率;
基于所述待识别通信标识的所有属性特征的所述条件概率确定出所述待识别通信标识在每个类别下的出现概率;
基于所述出现概率确定出所述可信度参数。
7.如权利要求2所述的方法,其特征在于,所述可信度识别模型通过以下方式确定:
将所述至少两类通信标识样本划分出正样本和负样本,所述正样本为可信度满足预设条件的样本,所述负样本为可信度不满足所述预设条件的样本;
采用所述正样本和所述负样本进行逻辑回归训练,从而获得逻辑回归模型作为所述可信度识别模型。
8.如权利要求7所述的方法,其特征在于,所述基于所述可信度识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的可信度参数,包括:
基于所述待识别通信标识的属性信息确定出所述待识别通信标识的属性向量;
将所述属性向量输入所述逻辑回归模型获得逻辑回归结果;
基于所述逻辑回归结果确定出所述可信度参数。
9.如权利要求2所述的方法,其特征在于,在所述确定出所述待识别通信标识的可信度参数之后,所述方法进一步包括:
判断所述待识别通信标识是否为无人号码;
如果所述待识别通信标识为所述无人号码,对所述待识别通信标识的所述可信度参数进行调整,以降低所述待识别通信标识的可信度等级。
10.如权利要求2所述的方法,其特征在于,在所述确定出所述待识别通信标识的可信度参数之后,所述方法进一步包括:
获取电子设备的特征信息;
基于所述特征信息对所述可信度参数进行调整,将调整后的所述可信度参数提供给所述电子设备的用户。
11.如权利要求10所述的方法,其特征在于,所述获取电子设备的特征信息,包括:
获取所述电子设备的用户针对通信标识的历史操作记录,将所述历史操作记录作为所述特征信息;和/或,
获取所述电子设备的通信标识,确定出所述通信标识与所述待识别通信标识的关联数据,将所述关联数据作为所述特征信息。
12.如权利要求1-8任一所述的方法,其特征在于,所述属性信息包括以下至少一种属性信息:
被标记的次数,作为被叫的次数,作为被叫的人数,作为主叫的通话时长,作为被叫的通话时长,总通话时长,在通讯录中被保存的次数,被拉黑的次数。
13.一种通信标识的特征确定装置,其特征在于,包括:
获得模块,用于获得待识别通信标识的属性信息;
输入模块,用于将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
识别模块,用于基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
14.一种设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获得待识别通信标识的属性信息;
将所述属性信息输入特征识别模型,其中,所述特征识别模型基于至少两类通信标识样本训练获得,所述至少两类通信标识样本对应至少两种特征类别,每个通信标识样本包含通信标识以及对应通信标识的属性信息;
基于所述特征识别模型对所述属性信息进行识别,从而确定出所述待识别通信标识的特征参数。
CN201611247007.9A 2016-12-29 2016-12-29 一种通信标识的特征确定方法、装置及设备 Pending CN108256542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611247007.9A CN108256542A (zh) 2016-12-29 2016-12-29 一种通信标识的特征确定方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611247007.9A CN108256542A (zh) 2016-12-29 2016-12-29 一种通信标识的特征确定方法、装置及设备

Publications (1)

Publication Number Publication Date
CN108256542A true CN108256542A (zh) 2018-07-06

Family

ID=62720699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611247007.9A Pending CN108256542A (zh) 2016-12-29 2016-12-29 一种通信标识的特征确定方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108256542A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274834A (zh) * 2018-09-27 2019-01-25 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN110110195A (zh) * 2019-05-07 2019-08-09 宜人恒业科技发展(北京)有限公司 一种杂质清除方法及装置
CN110263157A (zh) * 2019-05-24 2019-09-20 阿里巴巴集团控股有限公司 一种数据风险预测方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104023109A (zh) * 2014-06-27 2014-09-03 深圳市中兴移动通信有限公司 来电提示方法和装置及分类方法和装置
CN104717674A (zh) * 2014-12-02 2015-06-17 北京奇虎科技有限公司 号码属性识别方法、装置、终端和服务器
CN105306657A (zh) * 2014-06-20 2016-02-03 中兴通讯股份有限公司 身份识别方法、装置及通讯终端
CN106255116A (zh) * 2016-08-24 2016-12-21 王瀚辰 一种骚扰号码的识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306657A (zh) * 2014-06-20 2016-02-03 中兴通讯股份有限公司 身份识别方法、装置及通讯终端
CN104023109A (zh) * 2014-06-27 2014-09-03 深圳市中兴移动通信有限公司 来电提示方法和装置及分类方法和装置
CN104717674A (zh) * 2014-12-02 2015-06-17 北京奇虎科技有限公司 号码属性识别方法、装置、终端和服务器
CN106255116A (zh) * 2016-08-24 2016-12-21 王瀚辰 一种骚扰号码的识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274834A (zh) * 2018-09-27 2019-01-25 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN109274834B (zh) * 2018-09-27 2021-04-20 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN110110195A (zh) * 2019-05-07 2019-08-09 宜人恒业科技发展(北京)有限公司 一种杂质清除方法及装置
CN110263157A (zh) * 2019-05-24 2019-09-20 阿里巴巴集团控股有限公司 一种数据风险预测方法、装置及设备

Similar Documents

Publication Publication Date Title
RU2649294C2 (ru) Способ и устройство для построения шаблона и способ и устройство для идентификации информации
TW202111609A (zh) 神經網路訓練方法及裝置、圖像處理方法及裝置、電子設備和計算機可讀存儲介質
WO2020000961A1 (zh) 图像标签识别方法、装置及服务器
CN104378441B (zh) 日程创建方法和装置
CN109389162B (zh) 样本图像筛选方法和装置、电子设备及存储介质
CN105512545B (zh) 访问权限管理方法和装置
WO2015196714A1 (zh) 权限管理方法、装置及系统
CN105117207B (zh) 相册创建方法及装置
CN104636453B (zh) 非法用户资料识别方法及装置
CN110188236A (zh) 一种音乐的推荐方法、装置及系统
CN109951476B (zh) 基于时序的攻击预测方法、装置及存储介质
CN111259967B (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
CN110472091A (zh) 图像处理方法及装置、电子设备和存储介质
WO2018210131A1 (zh) 邀请行为预测方法、装置及存储介质
CN111210844B (zh) 语音情感识别模型的确定方法、装置、设备及存储介质
TWI738349B (zh) 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒體
CN109819288A (zh) 广告投放视频的确定方法、装置、电子设备及存储介质
WO2023173660A1 (zh) 用户识别方法、装置、存储介质、电子设备、计算机程序产品及计算机程序
CN110532956A (zh) 图像处理方法及装置、电子设备和存储介质
CN109543536A (zh) 图像标识方法及装置、电子设备和存储介质
CN107948093A (zh) 调节终端设备中应用网速的方法及装置
CN107783715A (zh) 应用启动方法及装置
CN108256542A (zh) 一种通信标识的特征确定方法、装置及设备
TW202145064A (zh) 對象計數方法、電子設備、電腦可讀儲存介質
CN112101216A (zh) 人脸识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180706

RJ01 Rejection of invention patent application after publication