CN113452845B - 识别异常电话号码的方法和电子设备 - Google Patents
识别异常电话号码的方法和电子设备 Download PDFInfo
- Publication number
- CN113452845B CN113452845B CN202010222892.5A CN202010222892A CN113452845B CN 113452845 B CN113452845 B CN 113452845B CN 202010222892 A CN202010222892 A CN 202010222892A CN 113452845 B CN113452845 B CN 113452845B
- Authority
- CN
- China
- Prior art keywords
- telephone number
- telephone
- model
- similarity
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 85
- 238000002372 labelling Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 38
- 238000012795 verification Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/66—Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
- H04M1/667—Preventing unauthorised calls from a telephone set
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Technology Law (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了识别异常电话号码的方法和电子设备,用以解决识别异常电话号码效率低的问题。本方案包括:获取特征电话号码集,特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;根据特征电话号码集中的电话号码具有的电话号码特征为特征电话号码集中的电话号码打标签,以生成训练集;建立待训练模型并通过训练集对待训练模型进行训练,得到训练完成的模型;将待识别的电话号码输入至训练完成的模型,根据训练完成的模型的输出结果确定待识别的电话号码是否是异常电话号码。本方案训练完成的模型能根据电话号码的特征自动地准确识别异常电话号码,帮助用户躲避骚扰,降低骚扰电话对生活带来的影响。
Description
技术领域
本发明涉及信息识别领域,尤其涉及一种识别异常电话号码的方法和电子设备。
背景技术
在通信技术领域,部分不法分子通过拨打电话对用户进行诈骗、骚扰,用户的生活因此受到很大影响。一部分不法分子大范围拨打电话,短时间振铃后挂机,往往用来进行号码探测,以确认号码是否存在,另外还可能诱导用户回拨。还有一部分不法分子拨打用户电话,通过与用户通话从事诈骗活动、进行广告营销等。这些骚扰性电话会打扰用户的正常生活,还会影响用户正常使用通讯功能。
如何高效准确地识别异常电话号码,是本申请所要解决的技术问题。
发明内容
本申请实施例的目的是提供一种识别异常电话号码的方法和电子设备,用以解决识别异常电话号码效率低的问题。。
第一方面,提供了一种识别异常电话号码的方法,包括:
获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。
第二方面,提供了一种电子设备,包括:
获取模块,获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
生成模块,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
训练模块,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
确定模块,将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。
第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面该的方法的步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面该的方法的步骤。
在本申请实施例中,首先获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;然后,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;接着,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;最后,将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。通过本申请实施例提供的方案,训练完成的模型能根据电话号码的特征自动地准确识别异常电话号码,能帮助用户躲避骚扰,降低骚扰电话对用户生活带来的负面影响。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的一个实施例识别异常电话号码的方法的流程示意图之一;
图2是本发明的一个实施例识别异常电话号码的方法的流程示意图之二;
图3是本发明的一个实施例识别异常电话号码的方法的流程示意图之三;
图4是本发明的一个实施例识别异常电话号码的方法的流程示意图之四;
图5是本发明的一个实施例识别异常电话号码的方法的流程示意图之五;
图6是本发明的一个实施例识别异常电话号码的方法的流程示意图之六;
图7是本申请的一个电子设备的结构示意图;
图8为实现本发明各个实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
在通信技术领域,很多用户都接到过异常电话,这些异常电话影响用户的正常生活,还会影响用户正常使用通讯功能。异常电话可以包括以下两种类型:一种是不法分子对用户大范围拨打,短时间振铃后挂机,不以被叫接听为目的,多用来号码探测,测试被叫号码是否存在或者诱导回拨,结合呼叫中心进行嵌套诈骗。另一种是不法分子拨打用户电话,目的为从事诈骗活动、进行广告营销。
为了降低异常电话对用户生活的不良影响,可以通过人为接听骚扰电话的方式来为异常电话做标记。如果采用人为接听标记的方式,往往需要大量用户接听异常电话,并做出标记骚扰电话的操作。而在接听和标记的过程中,实际上已经对用户的生活造成了影响。而且,采用这种人为接听标记的方式,需要较多数量的用户对同一个电话号码进行多次标记,才能确定电话号码确实是异常电话号码,费时费力。
除了人为接听标记的方式以外,还可以采用预设阈值的方式筛选异常电话号码,但是实际情况下,异常电话号码的形式多种多样,很难通过预设阈值的方式实现准确识别。
另外,还可以结合通话记录的音频信息来识别异常电话。这种方式例如可以对通话内容进行录音,并将录制到的语音自动转换为文字,并对文字进行解析筛选,以确定电话号码是否是异常电话号码。但是,由于很多用户通话带有口音,转换为文字的过程中识别率较低,所以这种方法的适用范围有限。
为了解决现有技术中存在的问题,本申请实施例提供一种识别异常电话号码的方法,如图1所示,包括以下步骤:
S11:获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
S12:根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
S13:建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
S14:将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。
本申请实施例提供的方案首先获取特征电话号码集并生成训练集,训练集中包括具有异常电话号码特征标签的子项,也包括具有正常电话号码特征标签的子项。利用该训练集训练模型后,训练完成的模型能用于识别异常电话号码和正常电话号码。将待识别的电话号码输入到训练完成的模型后,模型能分析待识别的电话号码的特征,以判断待识别的电话号码具有异常电话号码的特征还是具有正常电话号码的特征,从而输出判断结果。根据模型输出的判断结果即可确定待识别的电话号码是否是异常电话号码。
本申请实施例提供的方案基于异常电话号码的特征和正常电话号码的特征对模型进行训练,训练完成的模型能根据输入的待识别电话号码的特征来判断待识别电话号码是否是异常电话号码,能实现高效快速的识别,由于识别过程中无人为参与,所以识别结果客观准确。识别结果可以用于屏蔽异常电话号码,避免用户受到异常电话号码的骚扰,有助于提升用户满意度,维护消费者权益。
下面结合实例对本申请方案进行详细阐述:
在步骤S11中,获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码。该特征电话号码集中的电话号码可以是人工挑选的具有明确特征的电话号码,例如特征电话号码集中的电话号码可以包括经过大量用户标记的骚扰电话号码和随机抽取的正常电话号码。可选的,特征电话号码集中的电话号码的通信频率高于预设频率,比如说,特征电话号码集中的电话号码每周接打电话的次数大于10次,收发短信的次数大于20次等。这样能确保特征电话号码集中的电话号码是使用状态,利用使用状态的电话号码来训练模型能提升模型识别准确性,训练得到的模型能更好适用于实际情况。
基于上述实施例提供的方法,可选的,上述步骤S11,所述获取特征电话号码集,如图2所示,包括以下步骤:
S21:获取电话号码集,所述电话号码集包括至少一个异常电话号码和至少一个正常电话号码;
S22:根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量;
S23:根据所述相似度特征向量生成所述特征电话号码集。
在本申请实施例中,首先获取包含异常电话号码和正常电话号码的电话号码集,随后,获取电话号码集中每个电话号码的通话记录信息,并根据电话号码的通话记录信息生成与该电话号码相对应的相似度特征向量。其中,相似度特征向量能表征对应的电话号码的通话特征,例如相似度特征向量能表征以下至少一项:拨出电话数量与接听电话数量的比值、拨出电话的通话时长与接听电话的通话时长的比值、主动挂断通话的次数与被通话对方挂断通话次数的比值。然后,根据相似度特征向量生成特征电话号码集,生成的特征电话号码集中包括正常电话号码的相似度特征向量和异常电话号码的相似度特征向量。在随后的步骤中,根据上述特征电话号码集生成的训练集中的各项能准确表征正常电话号码的特征或异常电话号码的特征。
基于上述实施例提供的方法,可选的,上述步骤S22,根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量,如图3所示,包括以下步骤:
S31:获取所述电话号码集中的电话号码的通话记录信息的预设特征变量;
S32:根据所述通话记录信息的预设特征变量生成与所述电话号码集中的电话号码对应的相似度特征向量。
举例而言,在步骤S31中,可以获取电话号码集中电话号码作为主叫号码的15日内的通话数据,并统计得到每一条获取到的通话数据的特征。可选的,可以在获取到通话数据之后进行预处理,预处理可以包括对通话数据中无数值意义的数据进行编码处理,随后对预处理后的通话数据统计特征。预处理能降低整体计算量,避免对无用信息的处理。
基于上述实施例提供的方法,可选的,所述预设特征变量包括以下至少一项:通话时长、是否接通、振铃时长、结束方式、发起通话的设备的基站控制器(Base StationController,BSC)编码。
其中,通话时长可以指通话开始到电话挂断为止的时间长度,如果电话未接通则通话时长为零。振铃时长可以指通话接通后到通话开始为止的时间长度。结束方式可以包括主动挂断、通话对方挂断、信号故障导致挂断等。上述基站控制器可以是基站收发台(BTS)和移动交换中心(MSC)之间的连接点,也可以为基站收发台和移动交换中心之间交换信息提供接口,通过BSC编码可以间接获取到发起通话的设备的所在区域。
通过本申请实施例提供的方案,由于通话记录信息的预设特征变量能反映出电话号码的通话特征,所以根据所述通话记录信息的预设特征变量生成的与所述电话号码集中的电话号码对应的相似度特征向量以及随后生成的特征电话号码集也能反映出各个电话号码的通话特征。从而使训练得到的模型能根据输入的电话号码的特征更准确地识别该电话号码是否是异常电话号码。
基于上述实施例提供的方法,可选的,上述步骤S31,获取所述电话号码集中的电话号码的通话记录信息的预设特征变量,如图4所示,包括以下步骤:
S41:获取与所述电话号码集中的电话号码对应的电话号码数据集,所述电话号码数据集包括所对应的电话号码的多条通话记录信息;
S42:根据所述电话号码数据集中的多条通话记录信息之间的相似度确定所述电话号码数据集的话单相似度;
其中,步骤S32,根据所述通话记录信息的预设特征变量生成与所述电话号码集中的电话号码对应的相似度特征向量,包括以下步骤:
S43:根据所述通话记录信息的预设特征变量和所述电话号码数据集的话单相似度生成与所述电话号码数据集对应的电话号码的相似度特征向量。
在本实施例中,通话记录也可以称为话单,对于每一个号码产生的数据集,可以使用修正的余弦相似度得到一个对应的矩阵C,C的大小为N×N,其中,N为该号码数据集内通话记录的个数。Ci,j用于表示数据集中的通话记录i与通话记录j的相似度,若i=j,令Ci,j=0。若Ci,j<0。,令Mi,j=0。然后,对于矩阵C,计算每一行的0范式记为Ti,计算每一行的和记为Si,Si=∑Ci,j,计算有效均值Ri=Si/Ti。得到话单相似度S=[S1,S2,S3…,SN],话单平均相似度R=[R1,R2,R3…,RN]。将话单相似度的最值Max(S)记为x1、话单平均相似度的最值Max(R)记为x2。最后,根据上述x1、x2生成与所述电话号码数据集对应的电话号码的相似度特征向量。
通过本申请实施例提供的方案,生成的相似度特征向量能准确表征相对应的电话号码的通话特征,使随后训练得到的模型能准确分辨正常电话号码和异常电话号码。
基于上述实施例提供的方法,可选的,上述步骤S43,根据所述通话记录信息的预设特征变量和所述电话号码数据集的话单相似度生成与所述电话号码数据集对应的电话号码的相似度特征向量,如图5所示,包括以下步骤:
S51:根据所述电话号码数据集中的每条通话记录信息的预设特征变量确定所述电话号码数据集的预设特征变量均值;
S52:根据所述电话号码数据集的话单相似度确定话单相似度最值和话单平均相似度最值;
S53:根据所述电话号码数据集的预设特征变量均值、所述话单相似度最值和所述话单平均相似度最值生成与所述电话号码数据集对应的电话号码的相似度特征向量。
基于上述实施例,在步骤S51中,提取Si值最大的话单,再将与Si值最大的话单的相似度大于0的话单也提取出来,统计上述提取出的所有话单在预设特征变量上的均值。在本实施例中,预设特征变量例如可以包括:通话时长、是否接通、振铃时长以及结束方式,统计这四个预设特征变量的均值,依次记为x3、x4、x5、x6。最后,根据上述x1、x2、x3、x4、x5、x6生成与所述电话号码数据集对应的电话号码的相似度特征向量。
可选的,为使生成的相似度特征向量能进一步准确表征对应的电话号码,还可以根据电话号码的基础信息优化相似度特征向量。上述电话号码的基础信息例如可以包括在网时长、月平均消费额度、是否办理宽带、呼出总数、单月呼出总数等。
通过本申请实施例提供的方案,生成的相似度特征向量能准确表征相对应的电话号码的通话特征,使随后训练得到的模型能准确分辨正常电话号码和异常电话号码。
基于上述实施例提供的方法,可选的,步骤S13,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型,如图6所示,包括以下步骤:
S61:将所述训练集分成多个不相交的子集;
S62:将至少一个所述子集作为训练子集,对建立的待训练模型执行训练,得到待验证模型;
S63:将至少一个所述子集作为验证子集,对所述待验证模型执行验证,得到验证后的模型和所述验证后的模型的准确率,其中,所述验证子集非所述训练子集;
S64:根据所述验证后的模型和所述验证后的模型的准确率确定训练完成的模型。
本申请实施例采用的机器学习方法为随机森林算法,在实际应用中,可以根据实际需求选择其他适用的算法,本方案对选用的算法不做限制。
本申请实施例使用5折交叉验证的方法,评价模型的泛化能力,从而进行模型选择。具体的,在步骤S61中,首先将通过上述实施例得到的训练集D平均分成5个不相交的子集。在训练集D中的子项的数量是5的倍数的情况下,假设D中的训练样例个数为ND,那么每一个子集有ND/5个训练样例,这5个划分得到的子集可以分别记为D1、D2、D3、D4、D5。
随后,在步骤S62中,将至少一个所述子集作为训练子集,对建立的待训练模型执行训练,得到待验证模型。在本实施例中,可以在训练子集中选择出4个作为训练子集(例如D1、D2、D3、D4为训练子集),另1个训练子集作为验证子集(例如D5为验证子集)。使用这4个训练子集训练模型得到模型Mi,然后使用验证子集对训练得到的模型执行验证,得到准确率Acci。
在得到准确率后,可以执行步骤S64,根据所述验证后的模型和所述验证后的模型的准确率确定训练完成的模型。在本申请实施例提供的方案中,使用5折交叉验证的方法来进一步提高模型质量。在执行上述一次训练和一次验证后,可以变换训练子集和验证子集再进行4次训练。
具体的,上述步骤中以D5为验证子集,训练并验证完成后,可以分别以D1、D2、D3、D4为验证子集,验证子集以外的子集为训练子集,再进行4个训练和验证,得到5个准确率。随后,计算这5个准确率的平均值。并根据计算得到的准确率均值选定模型参数,基于选定的模型参数使用训练集再次训练(即使用D1、D2、D3、D4、D5进行训练),得到训练完成的模型M。
通过本申请实施例提供的方案,能充分利用训练集中的各项特征训练模型,训练得到的模型能客观准确地分辨输入的电话号码是否是异常电话号码。
在得到训练完成的模型M之后,可以将待识别的电话号码输入至模型M,根据模型M输出的结果确定该电话号码是否是异常电话号码。具体而言,可以先获取待识别的电话号码,并根据该电话号码的通话记录信息生成与该电话号码对应的相似度特征向量,然后将该相似度特征向量输入至模型M中,获得模型M的输出结果,最后根据输出结果确定该电话号码是否是异常电话号码。
通过本申请实施例提供的方案,训练完成的模型能根据电话号码的特征自动地准确识别异常电话号码,能帮助用户躲避骚扰,降低骚扰电话对用户生活带来的负面影响。
为了解决现有技术中存在的问题,本申请实施例还提供一种电子设备70,如图7所示,包括:
获取模块71,获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
生成模块72,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
训练模块,73建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
确定模块74,将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。
通过本申请实施例提供的方案,训练完成的模型能根据电话号码的特征自动地准确识别异常电话号码,能帮助用户躲避骚扰,降低骚扰电话对用户生活带来的负面影响。
图8为实现本发明各个实施例的一种电子设备的硬件结构示意图,
该电子设备800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、处理器810、以及电源811等部件。本领域技术人员可以理解,图8中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,射频单元801,用于获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
处理器810,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。
在本申请实施例中,首先获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;然后,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;接着,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;最后,将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码。通过本申请实施例提供的方案,训练完成的模型能根据电话号码的特征自动地准确识别异常电话号码,能帮助用户躲避骚扰,降低骚扰电话对用户生活带来的负面影响。
应理解的是,本发明实施例中,射频单元801可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器810处理;另外,将上行的数据发送给基站。通常,射频单元801包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元801还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块802为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元803可以将射频单元801或网络模块802接收的或者在存储器809中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元803还可以提供与电子设备800执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元803包括扬声器、蜂鸣器以及受话器等。
输入单元804用于接收音频或视频信号。输入单元804可以包括图形处理器(Graphics Processing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元806上。经图形处理器8041处理后的图像帧可以存储在存储器809(或其它存储介质)中或者经由射频单元801或网络模块802进行发送。麦克风8042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元801发送到移动通信基站的格式输出。
电子设备800还包括至少一种传感器805,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板8061的亮度,接近传感器可在电子设备800移动到耳边时,关闭显示面板8061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器805还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元806用于显示由用户输入的信息或提供给用户的信息。显示单元806可包括显示面板8061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板8061。
用户输入单元807可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板8071上或在触控面板8071附近的操作)。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器810,接收处理器810发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8071。除了触控面板8071,用户输入单元807还可以包括其他输入设备8072。具体地,其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板8071可覆盖在显示面板8061上,当触控面板8071检测到在其上或附近的触摸操作后,传送给处理器810以确定触摸事件的类型,随后处理器810根据触摸事件的类型在显示面板8061上提供相应的视觉输出。虽然在图8中,触控面板8071与显示面板8061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板8071与显示面板8061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元808为外部装置与电子设备800连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元808可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备800内的一个或多个元件或者可以用于在电子设备800和外部装置之间传输数据。
存储器809可用于存储软件程序以及各种数据。存储器809可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器809可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器810是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器809内的软件程序和/或模块,以及调用存储在存储器809内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器810可包括一个或多个处理单元;优选的,处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
电子设备800还可以包括给各个部件供电的电源811(比如电池),优选的,电源811可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备800包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器810,存储器809,存储在存储器809上并可在所述处理器810上运行的计算机程序,该计算机程序被处理器810执行时实现上述一种识别异常电话号码的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述一种识别异常电话号码的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (7)
1.一种识别异常电话号码的方法,其特征在于,包括:
获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码;
其中,所述获取特征电话号码集,包括:
获取电话号码集,所述电话号码集包括至少一个异常电话号码和至少一个正常电话号码;
根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量;
根据所述相似度特征向量生成所述特征电话号码集;所述特征电话号码集中包含所述正常电话号码的相似度特征向量和所述异常电话号码的相似度特征向量;
所述根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量,包括:
获取所述电话号码集中的电话号码的通话记录信息的预设特征变量;
获取与所述电话号码集中的电话号码对应的电话号码数据集,所述电话号码数据集包括所对应的电话号码的多条通话记录信息;
根据所述电话号码数据集中的多条通话记录信息之间的相似度确定所述电话号码数据集的话单相似度;
根据所述通话记录信息的预设特征变量和所述电话号码数据集的话单相似度生成与所述电话号码数据集对应的电话号码的相似度特征向量。
2.如权利要求1所述的方法,其特征在于,所述预设特征变量包括以下至少一项:通话时长、是否接通、振铃时长、结束方式、发起通话的设备的基站控制器编码。
3.如权利要求1所述的方法,其特征在于,根据所述通话记录信息的预设特征变量和所述电话号码数据集的话单相似度生成与所述电话号码数据集对应的电话号码的相似度特征向量,包括:
根据所述电话号码数据集中的每条通话记录信息的预设特征变量确定所述电话号码数据集的预设特征变量均值;
根据所述电话号码数据集的话单相似度确定话单相似度最值和话单平均相似度最值;
根据所述电话号码数据集的预设特征变量均值、所述话单相似度最值和所述话单平均相似度最值生成与所述电话号码数据集对应的电话号码的相似度特征向量。
4.如权利要求1所述的方法,其特征在于,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型,包括:
将所述训练集分成多个不相交的子集;
将至少一个所述子集作为训练子集,对建立的待训练模型执行训练,得到待验证模型;
将至少一个所述子集作为验证子集,对所述待验证模型执行验证,得到验证后的模型和所述验证后的模型的准确率,其中,所述验证子集非所述训练子集;
根据所述验证后的模型和所述验证后的模型的准确率确定训练完成的模型。
5.一种电子设备,其特征在于,包括:
获取模块,获取特征电话号码集,所述特征电话号码集包括具有异常电话号码特征的第一电话号码以及具有正常电话号码特征的第二电话号码;
生成模块,根据所述特征电话号码集中的电话号码具有的电话号码特征为所述特征电话号码集中的电话号码打标签,以生成训练集;
训练模块,建立待训练模型并通过所述训练集对所述待训练模型进行训练,得到训练完成的模型;
确定模块,将待识别的电话号码输入至所述训练完成的模型,根据所述训练完成的模型的输出结果确定所述待识别的电话号码是否是异常电话号码;
其中,所述获取模块,用于,
获取电话号码集,所述电话号码集包括至少一个异常电话号码和至少一个正常电话号码;
根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量;
根据所述相似度特征向量生成所述特征电话号码集;所述特征电话号码集中包含所述正常电话号码的相似度特征向量和所述异常电话号码的相似度特征向量;
所述根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量,包括:
所述根据所述电话号码集中的电话号码的通话记录信息,生成与所述电话号码集中的电话号码对应的相似度特征向量,包括:
获取所述电话号码集中的电话号码的通话记录信息的预设特征变量;
获取与所述电话号码集中的电话号码对应的电话号码数据集,所述电话号码数据集包括所对应的电话号码的多条通话记录信息;
根据所述电话号码数据集中的多条通话记录信息之间的相似度确定所述电话号码数据集的话单相似度;
根据所述通话记录信息的预设特征变量和所述电话号码数据集的话单相似度生成与所述电话号码数据集对应的电话号码的相似度特征向量。
6.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010222892.5A CN113452845B (zh) | 2020-03-26 | 2020-03-26 | 识别异常电话号码的方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010222892.5A CN113452845B (zh) | 2020-03-26 | 2020-03-26 | 识别异常电话号码的方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113452845A CN113452845A (zh) | 2021-09-28 |
CN113452845B true CN113452845B (zh) | 2024-03-19 |
Family
ID=77807287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010222892.5A Active CN113452845B (zh) | 2020-03-26 | 2020-03-26 | 识别异常电话号码的方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113452845B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113992798A (zh) * | 2021-10-26 | 2022-01-28 | 中国联合网络通信集团有限公司 | 电话识别方法、装置、设备及可读存储介质 |
CN114374769A (zh) * | 2021-12-01 | 2022-04-19 | 恒安嘉新(北京)科技股份公司 | 一种异常号码的获取方法、装置、服务器和存储介质 |
CN114449106B (zh) * | 2022-02-10 | 2024-04-30 | 恒安嘉新(北京)科技股份公司 | 一种异常电话号码的识别方法、装置、设备和存储介质 |
CN114567697A (zh) * | 2022-03-01 | 2022-05-31 | 恒安嘉新(北京)科技股份公司 | 一种异常电话的识别方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109688275A (zh) * | 2018-12-27 | 2019-04-26 | 中国联合网络通信集团有限公司 | 骚扰电话识别方法、装置及存储介质 |
CN109819126A (zh) * | 2017-11-21 | 2019-05-28 | 中移(杭州)信息技术有限公司 | 一种异常号码识别方法及装置 |
CN109995924A (zh) * | 2017-12-30 | 2019-07-09 | 中国移动通信集团贵州有限公司 | 欺诈电话识别方法、装置、设备及介质 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110401780A (zh) * | 2018-04-25 | 2019-11-01 | 中国移动通信集团广东有限公司 | 一种识别诈骗电话的方法及装置 |
-
2020
- 2020-03-26 CN CN202010222892.5A patent/CN113452845B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109819126A (zh) * | 2017-11-21 | 2019-05-28 | 中移(杭州)信息技术有限公司 | 一种异常号码识别方法及装置 |
CN109995924A (zh) * | 2017-12-30 | 2019-07-09 | 中国移动通信集团贵州有限公司 | 欺诈电话识别方法、装置、设备及介质 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110401780A (zh) * | 2018-04-25 | 2019-11-01 | 中国移动通信集团广东有限公司 | 一种识别诈骗电话的方法及装置 |
CN109688275A (zh) * | 2018-12-27 | 2019-04-26 | 中国联合网络通信集团有限公司 | 骚扰电话识别方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113452845A (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113452845B (zh) | 识别异常电话号码的方法和电子设备 | |
CN108345819B (zh) | 一种发送报警消息的方法和装置 | |
CN110109593B (zh) | 一种截屏方法及终端设备 | |
CN106161749B (zh) | 一种恶意电话识别方法,及装置 | |
CN108391008B (zh) | 一种消息提醒方法及移动终端 | |
CN109993821B (zh) | 一种表情播放方法及移动终端 | |
CN109412932B (zh) | 一种截屏方法和终端 | |
CN111401463B (zh) | 检测结果输出的方法、电子设备及介质 | |
CN110149628B (zh) | 一种信息处理方法及终端设备 | |
CN111064654A (zh) | 一种消息显示方法及电子设备 | |
CN109729210B (zh) | 一种信息显示方法及终端设备 | |
CN108093119B (zh) | 一种陌生来电号码的标记方法及移动终端 | |
CN111007980A (zh) | 一种信息录入方法及终端设备 | |
CN109067979B (zh) | 一种提示方法及移动终端 | |
CN108307048B (zh) | 一种消息输出方法和装置及移动终端 | |
CN108632465A (zh) | 一种语音输入的方法及移动终端 | |
CN109361804B (zh) | 来电处理方法及移动终端 | |
CN109714462B (zh) | 一种电话号码的标记方法及其移动终端 | |
CN111491058A (zh) | 工作模式的控制方法、电子设备和存储介质 | |
CN109274814B (zh) | 一种消息提示方法、装置及终端设备 | |
CN109325219B (zh) | 一种生成记录文档的方法、装置及系统 | |
CN110717163B (zh) | 一种交互方法及终端设备 | |
CN111353422B (zh) | 信息提取方法、装置及电子设备 | |
CN109348066B (zh) | 一种来电意图识别方法、终端及计算机可读存储介质 | |
CN115884088A (zh) | 一种设备位置信息的确定方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |