CN113992798A - 电话识别方法、装置、设备及可读存储介质 - Google Patents

电话识别方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113992798A
CN113992798A CN202111249400.2A CN202111249400A CN113992798A CN 113992798 A CN113992798 A CN 113992798A CN 202111249400 A CN202111249400 A CN 202111249400A CN 113992798 A CN113992798 A CN 113992798A
Authority
CN
China
Prior art keywords
network access
behavior data
telephone
access behavior
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111249400.2A
Other languages
English (en)
Other versions
CN113992798B (zh
Inventor
霍明德
及莹
翁国栋
周国语
刘韧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202111249400.2A priority Critical patent/CN113992798B/zh
Publication of CN113992798A publication Critical patent/CN113992798A/zh
Application granted granted Critical
Publication of CN113992798B publication Critical patent/CN113992798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本申请提供一种电话识别方法、装置、设备及可读存储介质,该方法包括:获取待识别电话对应的用户入网行为数据组,根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的包括骚扰电话簇和正常电话簇的电话识别模型,对待识别电话进行识别,获得识别结果。其中,骚扰电话簇中包括多个异常入网行为数据,正常电话簇中包括多个正常入网行为数据。本申请的方法,采用预先建立的可基于入网行为数据进行电话识别的电话识别模型对待识别电话进行识别,从而无需获取通话信息即可实现电话识别,识别更加及时,此外,由于入网行为数据是客观且固定的数据,因此由此进行电话识别准确性更高。

Description

电话识别方法、装置、设备及可读存储介质
技术领域
本申请涉及通信安全技术领域,尤其涉及一种电话识别方法、装置、设备及可读存储介质。
背景技术
通信技术的发展为人们的日常生活提供了便利,但同时也会有人利用电话进行恶意骚扰,如进行电话诈骗等,严重影响人们的日常生活。为了解决这一问题,需要对电话进行识别,从而确定出骚扰电话并进行相应的处理。
目前,常见的电话识别方法为,提取用户通话记录,并采用预先建立的意图识别模型对通话记录进行识别,进而识别出电话是否为骚扰电话。
但是,上述电话识别方法只能在电话进行通话后才能对其进行识别,识别不及时,此外,预先建立的意图识别模型只能对已知的骚扰意图进行识别,若骚扰意图改变,则无法对电话进行准确识别。
发明内容
本申请提供一种电话识别方法、装置、设备及可读存储介质,用以对电话进行及时准确的识别。
第一方面,本申请提供一种电话识别方法,包括:
获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据;
根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
进一步地,如上所述的方法,所述根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果,包括:
将所述待识别电话对应的入网行为数据组中的多个入网行为数据,与所述骚扰电话簇中的异常入网行为数据以及所述正常电话簇中的正常入网行为数据进行比对;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于预设的第一阈值,则识别所述待识别电话为骚扰电话;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于等于预设的第二阈值小于等于预设的第一阈值,则识别所述待识别电话为疑似骚扰电话;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述正常电话簇中的正常入网行为数据相一致的入网行为数据的个数大于预设的第三阈值,则识别所述待识别电话为正常电话。
进一步地,如上所述的方法,所述采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别之前,还包括:
基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
进一步地,如上所述的方法,所述基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型,包括:
获取各样本电话对应的各用户输入的用户信息;
针对每一样本电话对应的用户输入的用户信息,若所述输入的用户信息与注册信息相匹配,则在所述样本电话对应的用户入网行为数据组中,加入是本人使用的入网行为数据,若所述输入的用户信息与注册信息不匹配,则在所述样本电话对应的用户入网行为数据组中,加入非本人使用的入网行为数据;其中,所述注册信息为所述样本电话对应的用户入网时预留的用户信息;
对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理,生成所述骚扰电话簇和所述正常电话簇,获得所述电话识别模型;其中,所述骚扰电话簇为包含有非本人使用的入网行为数据的簇,所述骚扰电话簇中的入网行为数据为异常入网行为数据;所述正常电话簇为包含有是本人使用的入网行为数据的簇,所述正常电话簇中的入网行为数据为正常入网行为数据。
进一步地,如上所述的方法,所述采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果之后,还包括:
若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识,并基于所述第一标识对所述待识别电话进行关停处理。
进一步地,如上所述的方法,所述若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识之后,还包括:
接收所述待识别电话对应的用户发送的申诉信息;所述申诉信息包括用户信息以及入网行为合理性证明信息;其中,所述入网行为合理性证明信息包括工作类型;
若所述申诉信息中的用户信息与注册信息相匹配,且所述入网行为合理性证明信息中的工作类型包含在预设的多种工作类型中,则删除所述待识别电话的第一标识。
第二方面,本申请提供一种电话识别装置,包括:
获取模块,用于获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据;
识别模块,用于根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
进一步地,如上所述的装置,所述装置还包括:
建立模块,用于基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
第三方面,本申请提供一种处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。
本申请提供一种电话识别方法、装置、设备及可读存储介质,获取待识别电话对应的用户入网行为数据组,根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的包括骚扰电话簇和正常电话簇的电话识别模型,对待识别电话进行识别,获得识别结果。其中,骚扰电话簇中包括多个异常入网行为数据,正常电话簇中包括多个正常入网行为数据。识别结果包括骚扰电话、疑似骚扰电话以及正常电话。也就是说,本申请采用预先建立的可基于入网行为数据进行电话识别的电话识别模型对待识别电话进行识别,从而无需获取通话信息即可实现电话识别,识别更加及时,此外,由于入网行为数据是客观且固定的数据,因此由此进行电话识别准确性更高。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种系统架构的示意图;
图2为本申请实施例提供的电话识别方法的流程图;
图3为本申请实施例提供的电话识别方法的流程图;
图4为本申请实施例提供的电话识别方法的流程示意图;
图5为本申请实施例提供的电话识别装置的结构示意图;
图6为本申请的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与本申请的一些方面相一致的装置和方法的例子。
随着通信技术的发展,人们的日常生活提供了便利,但同时也会有人利用电话进行恶意骚扰,如向用户宣传广告、理财、售房等信息或是进行电话诈骗等,严重影响人们的日常生活。为了解决这一问题,需要对电话进行识别,从而确定出骚扰电话并进行相应的处理。
现有的电话识别方法为,提取用户通话记录,并采用预先建立的意图识别模型对通话记录进行识别,进而识别出电话是否为骚扰电话。但是,上述电话识别方法只能在电话进行通话后才能对其进行识别,识别不及时,此外,预先建立的意图识别模型只能对已知的骚扰意图进行识别,若骚扰意图改变,则无法对电话进行准确识别。
本申请提供的电话识别方法、装置、设备及可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种系统架构的示意图,如图1所示,在图1所示的系统架构中,具体可以包括待识别电话1以及服务器2,其中服务器2中设置有电话识别装置。
其中,电话识别装置可搭载于服务器2,用于根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对待识别电话进行识别,获得识别结果。
实施例一
图2为本申请实施例提供的电话识别方法的流程图,如图2所示,本实施例提供的电话识别方法包括以下步骤:
步骤101、获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据。
步骤102、根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
需要说明的是,本实施例提供的电话识别方法的执行主体可以为电话识别装置。在实际应用中,该电话识别装置可以通过计算机程序实现,例如应用软件,计算机程序等,也可以通过存储有相关计算机程序的介质,例如,U盘、光盘等实现;或者,还可以通过集成或安装有相关计算机程序的实体装置实现,例如,芯片等。
在本实施例中,为了对待识别电话进行识别,电话识别装置首先可以获取待识别电话对应的用户入网行为数据组。具体地,可以通过归属位置寄存器(Home LocationRegister,简称HLR)和归属签约用户服务器(Home Subscriber Server,简称HSS),或是其他合适的端口获取,本实施例对此不做限定。
其中,用户入网行为数据组包括多个入网行为数据,具体数据类型可以包括:是否一证多户、是否批量开卡、是否渠道销量异常、是否夜间开卡、是否同一批次卡号集中使用、是否异常缴费、是否超低资费、是否新入网、是否线上开卡以及是否场景营销。
接下来,电话识别装置可以根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对待识别电话进行识别,即可获得识别结果。识别结果具体可以包括骚扰电话、疑似骚扰电话以及正常电话。
其中,预先建立的电话识别模型包括骚扰电话簇和正常电话簇。其中,骚扰电话簇中包括多个异常入网行为数据,正常电话簇中包括多个正常入网行为数据。
在一个示例中,骚扰电话簇中的异常入网行为数据包括:一证多户,批量开卡,渠道销量异常,夜间开卡,同一批次卡号集中使用,异常缴费,超低资费,新入网,线上开卡以及场景营销。正常电话簇中的正常入网行为数据包括:非一证多户、非渠道销量异常、非夜间开卡、非同一批次卡号集中使用、非异常缴费、非超低资费、非新入网、非线上开卡以及非场景营销。
在上述实施例一的基础上,在一种可选的实施方式中,所述根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果,包括:将所述待识别电话对应的入网行为数据组中的多个入网行为数据,与所述骚扰电话簇中的异常入网行为数据以及所述正常电话簇中的正常入网行为数据进行比对;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于预设的第一阈值,则识别所述待识别电话为骚扰电话;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于等于预设的第二阈值小于等于预设的第一阈值,则识别所述待识别电话为疑似骚扰电话;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述正常电话簇中的正常入网行为数据相一致的入网行为数据的个数大于预设的第三阈值,则识别所述待识别电话为正常电话。
在本实施方式中,举例来说,若预设的第一阈值为6,预设的第二阈值为4,预设的第三阈值为6。
在一个示例中,待识别电话对应的入网行为数据组中的多个入网行为数据包括:非一证多户、批量开卡、渠道销量异常、非夜间开卡、同一批次卡号集中使用、异常缴费、超低资费、非新入网、线上开卡以及场景营销。
在进行识别时,电话识别装置可以将待识别电话对应的入网行为数据组中的多个入网行为数据,与骚扰电话簇中的异常入网行为数据以及所述正常电话簇中的正常入网行为数据进行比对。比对结果为待识别电话对应的入网行为数据组中的多个入网行为数据中,与骚扰电话簇中的异常入网行为数据相一致的入网行为数据包括:批量开卡、渠道销量异常、同一批次卡号集中使用、异常缴费、超低资费、线上开卡以及场景营销7个数据,大于预设的第一阈值,则电话识别装置可以识别该待识别电话为骚扰电话。
在又一个示例中,待识别电话对应的入网行为数据组中的多个入网行为数据包括:非一证多户、非批量开卡、非渠道销量异常、非夜间开卡、同一批次卡号集中使用、异常缴费、超低资费、非新入网、线上开卡以及场景营销。
比对结果为待识别电话对应的入网行为数据组中的多个入网行为数据中,与骚扰电话簇中的异常入网行为数据相一致的入网行为数据包括:同一批次卡号集中使用、异常缴费、超低资费、线上开卡以及场景营销5个数据,大于预设的第二阈值小于预设的第一阈值,则电话识别装置可以识别该待识别电话为疑似骚扰电话。
在另一个示例中,待识别电话对应的入网行为数据组中的多个入网行为数据包括:非一证多户、非批量开卡、非渠道销量异常、非夜间开卡、同一批次卡号集中使用、非异常缴费、非超低资费、非新入网、线上开卡以及场景营销。
比对结果为待识别电话对应的入网行为数据组中的多个入网行为数据中,与正常电话簇中的正常入网行为数据相一致的入网行为数据包括:非一证多户、非批量开卡、非渠道销量异常、非夜间开卡、非异常缴费、非超低资费以及非新入网7个数据,大于预设的第三阈值,则电话识别装置可以识别该待识别电话为正常电话。
本实施例提供的电话识别方法,获取待识别电话对应的用户入网行为数据组,根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的包括骚扰电话簇和正常电话簇的电话识别模型,对待识别电话进行识别,获得识别结果。其中,骚扰电话簇中包括多个异常入网行为数据,正常电话簇中包括多个正常入网行为数据。识别结果包括骚扰电话、疑似骚扰电话以及正常电话。也就是说,在本申请实施例中,采用预先建立的可基于入网行为数据进行电话识别的电话识别模型对待识别电话进行识别,从而无需获取通话信息即可实现电话识别,识别更加及时,此外,由于入网行为数据是客观且固定的数据,因此由此进行电话识别准确性更高。
实施例二
在上述实施例一的基础上,本实施例提供的电话识别方法,在步骤102中,所述采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别之前,还包括:基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
图3为本申请实施例提供的电话识别方法的流程图,如图3所示,在上述实施例二的基础上,所述基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型,包括以下步骤:
步骤201、获取各样本电话对应的各用户输入的用户信息。
步骤202、针对每一样本电话对应的用户输入的用户信息,若所述输入的用户信息与注册信息相匹配,则在所述样本电话对应的用户入网行为数据组中,加入是本人使用的入网行为数据,若所述输入的用户信息与注册信息不匹配,则在所述样本电话对应的用户入网行为数据组中,加入非本人使用的入网行为数据;其中,所述注册信息为所述样本电话对应的用户入网时预留的用户信息。
步骤203、对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理,生成所述骚扰电话簇和所述正常电话簇,获得所述电话识别模型;其中,所述骚扰电话簇为包含有非本人使用的入网行为数据的簇,所述骚扰电话簇中的入网行为数据为异常入网行为数据;所述正常电话簇为包含有是本人使用的入网行为数据的簇,所述正常电话簇中的入网行为数据为正常入网行为数据。
在本实施例中,为了建立包括骚扰电话簇和正常电话簇的电话识别模型,电话识别装置可以获取各样本电话对应的各用户输入的用户信息,具体地,用户信息可以为身份证后四位或是其他指定的用户信息,本实施例对此不做限定,相应地,电话识别装置可以对样本电话进行电话拨测,并获取用户输入的指定的用户信息。
针对每一样本电话对应的用户输入的用户信息,如果电话识别装置判断出输入的用户信息与注册信息,也即该样本电话对应的用户入网时预留的用户信息相匹配,则在该样本电话对应的用户入网行为数据组中加入是本人使用的入网行为数据。相应地,如果电话识别装置判断出输入的用户信息与注册信息不匹配,则在该样本电话对应的用户入网行为数据组中,加入非本人使用的入网行为数据。
接下来,电话识别装置可以对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理,即可生成骚扰电话簇和正常电话簇,获得电话识别模型。
其中,骚扰电话簇为包含有非本人使用的入网行为数据的簇,骚扰电话簇中的入网行为数据为异常入网行为数据。正常电话簇为包含有是本人使用的入网行为数据的簇,正常电话簇中的入网行为数据为正常入网行为数据。
在上述实施例二的基础上,在一种可选的实施方式中,对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理的具体方法为:
为全部入网行为数据添加未被访问的标识,随机选择一个未被访问的入网行为数据作为第一目标入网行为数据,并将其添加的未被访问的标识修改为已被访问的标识;
基于预先设定的半径参数,检测第一目标入网行为数据邻域的入网行为数据的个数是否大于预设的邻域密度阈值;
若否,则将第一目标入网行为数据作为异常数据,该异常数据为无法被使用的数据;
若是,则为第一目标入网行为数据创建一个簇C,并将该第一目标入网行为数据邻域的入网行为数据作为簇C的候选集合;
在簇C的候选集合中随机选择一个入网行为数据作为第二目标入网行为数据,并将其添加的未被访问的标识修改为已被访问的标识;
基于预先设定的半径参数,检测该第二目标入网行为数据邻域的入网行为数据的个数是否大于预设的邻域密度阈值;
若是,则将该第二目标入网行为数据邻域的入网行为数据均加入到簇C的候选集合中;
遍历簇C的候选集合中所有添加有未被访问的标识的入网行为数据,依次将其作为第二目标入网行为数据,并执行基于预先设定的半径参数,检测第二目标入网行为数据邻域的入网行为数据的个数是否大于预设的邻域密度阈值的步骤;
将簇C的候选集合中的入网行为数据添加到簇C中,生成簇C;其中,若簇C中包含有非本人使用的入网行为数据,则将簇C作为骚扰电话簇;若簇C中包含有是本人使用的入网行为数据,则将簇C作为正常电话簇;
返回执行随机选择一个未被访问的入网行为数据作为第一目标入网行为数据,并将其添加的未被访问的标识修改为已被访问的标识的步骤;
为本次选择的第一目标入网行为数据创建一个簇D,将簇D的候选集合中不属于簇C的入网行为数据添加到簇D中,生成簇D;其中,若簇D中包含有是本人使用的入网行为数据,则将簇D作为正常电话簇;若簇D中包含有非本人使用的入网行为数据,则将簇D作为骚扰电话簇。
本实施例提供的电话识别方法,根据各样本电话的入网行为数据,基于密度聚类算法建立电话识别模型,由于入网行为数据客观且固定,因此提高了电话识别的准确性。
实施例三
在其它任一实施例的基础上,本实施例提供的电话识别方法,在步骤102之后,还包括:若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识,并基于所述第一标识对所述待识别电话进行关停处理。
在本实施例中,在识别出骚扰电话后,为了避免骚扰电话对其他用户造成影响,需要对骚扰电话进行相应的处理。因此,若识别结果为待识别电话为骚扰电话,则电话识别装置可以为待识别电话添加第一标识,并基于该第一标识对待识别电话进行关停处理。
在上述实施例三的基础上,在一种可选的实施方式中,所述若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识之后,还包括:接收所述待识别电话对应的用户发送的申诉信息;所述申诉信息包括用户信息以及入网行为合理性证明信息;其中,所述入网行为合理性证明信息包括工作类型;若所述申诉信息中的用户信息与注册信息相匹配,且所述入网行为合理性证明信息中的工作类型包含在预设的多种工作类型中,则删除所述待识别电话的第一标识。
在本实施例中,为了避免由于正常电话被误识为骚扰电话进行关停处理,从而导致用户无法正常使用电话的问题。在为待识别电话添加第一标识之后,电话识别装置还可以接收待识别电话对应的用户发送的申诉信息。
其中,申诉信息可以包括用户信息以及入网行为合理性证明信息。
在一个示例中,入网行为合理性证明信息可以包括工作类型。若电话识别装置判断出申诉信息中的用户信息与注册信息相匹配,且入网行为合理性证明信息中的工作类型包含在预设的多种工作类型中,则删除待识别电话的第一标识。
其中,预设的多种工作类型可以包括快递、送餐等,本实施例对此不做限定。
在一个示例中,图4为本申请实施例提供的电话识别方法的流程示意图,如图4所示,本实施例提供的电话识别方法,电话识别装置首先可以获取待识别电话对应用户的入网行为数据组,再采用基于密度聚类算法预先建立的电话识别模型,识别待识别电话是否为骚扰电话,若是,则为该待识别电话添加第一标识,若未收到用户发送的申诉信息,则基于第一标识对待识别电话进行关停处理,若收到用户发送的申诉信息,判断用户发送的申诉信息是否符合预设的正常电话的标准,若符合,则删除待识别电话的第一标识,取消关停处理,若不符合,继续基于第一标识对待识别电话进行关停处理。
本实施例提供的电话识别方法,接收用户发送的用于证明电话为非骚扰电话的申诉信息,并基于该申诉信息再次判断待识别电话是否为骚扰电话,若判断出电话为正常电话,则删除电话的第一标识,取消关停处理,有效解决了由于误判导致的用户无法正常使用电话的问题。
实施例四
图5为本申请实施例提供的电话识别装置的结构示意图,如图5所示,本实施例提供的电话识别装置包括:获取模块51以及识别模块52。其中,所述获取模块51,用于获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据。所述识别模块52,用于根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
本实施例提供的电话识别装置,获取待识别电话对应的用户入网行为数据组,根据待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的包括骚扰电话簇和正常电话簇的电话识别模型,对待识别电话进行识别,获得识别结果。其中,骚扰电话簇中包括多个异常入网行为数据,正常电话簇中包括多个正常入网行为数据。识别结果包括骚扰电话、疑似骚扰电话以及正常电话。也就是说,在本申请实施例中,采用预先建立的可基于入网行为数据进行电话识别的电话识别模型对待识别电话进行识别,从而无需获取通话信息即可实现电话识别,识别更加及时,此外,由于入网行为数据是客观且固定的数据,因此由此进行电话识别准确性更高。
可选实施方式中,所述识别模块52,还用于将所述待识别电话对应的入网行为数据组中的多个入网行为数据,与所述骚扰电话簇中的异常入网行为数据以及所述正常电话簇中的正常入网行为数据进行比对;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于等于预设的第一阈值,则识别所述待识别电话为骚扰电话;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于等于预设的第二阈值小于预设的第一阈值,则识别所述待识别电话为疑似骚扰电话;若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述正常电话簇中的正常入网行为数据相一致的入网行为数据的个数大于等于预设的第三阈值,则识别所述待识别电话为正常电话。
可选实施方式中,所述电话识别装置,还包括:建立模块53,用于基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
可选实施方式中,所述建立模块53,还用于获取各样本电话对应的各用户输入的用户信息;针对每一样本电话对应的用户输入的用户信息,若所述输入的用户信息与注册信息相匹配,则为所述样本电话对应的用户入网行为数据组中最后一个入网行为数据添加正常入网行为标识,若所述输入的用户信息与注册信息不匹配,则为所述样本电话对应的用户入网行为数据组中最后一个入网行为数据添加异常入网行为标识;其中,所述注册信息为所述样本电话对应的用户入网时预留的用户信息;对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理,生成所述骚扰电话簇和所述正常电话簇,获得所述电话识别模型;其中,所述骚扰电话簇为包含有具有异常入网行为标识的入网行为数据的簇,所述骚扰电话簇中的入网行为数据为异常入网行为数据;所述正常电话簇为包含有具有正常入网行为标识的入网行为数据的簇,所述正常电话簇中的入网行为数据为正常入网行为数据。
可选实施方式中,所述电话识别装置,还包括:添加模块54,用于若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识,并基于所述第一标识对所述待识别电话进行关停处理。
可选实施方式中,所述电话识别装置,还包括:删除模块55,用于接收所述待识别电话对应的用户发送的申诉信息;所述申诉信息包括用户信息以及入网行为合理性证明信息;其中,所述入网行为合理性证明信息包括工作类型;若所述申诉信息中的用户信息与注册信息相匹配,且所述入网行为合理性证明信息中的工作类型包含在预设的多种工作类型中,则删除所述待识别电话的第一标识。
需要说明的是,本实施例提供的电话识别装置执行的技术方案和效果可以参见前述方法实施例的相关内容,在此不再赘述。
实施例五
图6为本申请的电子设备的结构示意图,如图6所示,本申请还提供了一种电子设备600,包括:存储器601和处理器602。
存储器601,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机执行指令。存储器601可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器602,用于执行存储器601存放的程序。
其中,计算机程序存储在存储器601中,并被配置为由处理器602执行以实现本申请任意一个实施例提供的电话识别方法。相关说明可以对应参见附图中的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。
其中,本实施例中,存储器601和处理器602通过总线连接。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component Interconnect,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
实施例六
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现本申请任意一个实施例提供的电话识别方法。
实施例七
本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例提供电话识别方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程电话识别装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种电话识别方法,其特征在于,包括:
获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据;
根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果,包括:
将所述待识别电话对应的入网行为数据组中的多个入网行为数据,与所述骚扰电话簇中的异常入网行为数据以及所述正常电话簇中的正常入网行为数据进行比对;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于预设的第一阈值,则识别所述待识别电话为骚扰电话;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述骚扰电话簇中的异常入网行为数据相一致的入网行为数据的个数大于等于预设的第二阈值小于等于预设的第一阈值,则识别所述待识别电话为疑似骚扰电话;
若所述待识别电话对应的入网行为数据组中的多个入网行为数据中,与所述正常电话簇中的正常入网行为数据相一致的入网行为数据的个数大于预设的第三阈值,则识别所述待识别电话为正常电话。
3.根据权利要求1所述的方法,其特征在于,所述采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别之前,还包括:
基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型,包括:
获取各样本电话对应的各用户输入的用户信息;
针对每一样本电话对应的用户输入的用户信息,若所述输入的用户信息与注册信息相匹配,则在所述样本电话对应的用户入网行为数据组中,加入是本人使用的入网行为数据,若所述输入的用户信息与注册信息不匹配,则在所述样本电话对应的用户入网行为数据组中,加入非本人使用的入网行为数据;其中,所述注册信息为所述样本电话对应的用户入网时预留的用户信息;
对各样本电话对应的各用户入网行为数据组中全部入网行为数据进行密度聚类处理,生成所述骚扰电话簇和所述正常电话簇,获得所述电话识别模型;其中,所述骚扰电话簇为包含有非本人使用的入网行为数据的簇,所述骚扰电话簇中的入网行为数据为异常入网行为数据;所述正常电话簇为包含有是本人使用的入网行为数据的簇,所述正常电话簇中的入网行为数据为正常入网行为数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果之后,还包括:
若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识,并基于所述第一标识对所述待识别电话进行关停处理。
6.根据权利要求5所述的方法,其特征在于,所述若所述识别结果为所述待识别电话为骚扰电话,则为所述待识别电话添加第一标识之后,还包括:
接收所述待识别电话对应的用户发送的申诉信息;所述申诉信息包括用户信息以及入网行为合理性证明信息;其中,所述入网行为合理性证明信息包括工作类型;
若所述申诉信息中的用户信息与注册信息相匹配,且所述入网行为合理性证明信息中的工作类型包含在预设的多种工作类型中,则删除所述待识别电话的第一标识。
7.一种电话识别装置,其特征在于,包括:
获取模块,用于获取待识别电话对应的用户入网行为数据组,所述用户入网行为数据组包括多个入网行为数据;
识别模块,用于根据所述待识别电话对应的用户入网行为数据组中的多个入网行为数据,采用基于密度聚类算法预先建立的电话识别模型,对所述待识别电话进行识别,获得识别结果;其中,所述预先建立的电话识别模型包括骚扰电话簇和正常电话簇;其中,所述骚扰电话簇中包括多个异常入网行为数据,所述正常电话簇中包括多个正常入网行为数据;所述识别结果包括骚扰电话、疑似骚扰电话以及正常电话。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
建立模块,用于基于所述密度聚类算法建立包括所述骚扰电话簇和所述正常电话簇的电话识别模型。
9.一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6中任一项所述的方法。
CN202111249400.2A 2021-10-26 2021-10-26 电话识别方法、装置、设备及可读存储介质 Active CN113992798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111249400.2A CN113992798B (zh) 2021-10-26 2021-10-26 电话识别方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111249400.2A CN113992798B (zh) 2021-10-26 2021-10-26 电话识别方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113992798A true CN113992798A (zh) 2022-01-28
CN113992798B CN113992798B (zh) 2024-07-16

Family

ID=79741794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111249400.2A Active CN113992798B (zh) 2021-10-26 2021-10-26 电话识别方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113992798B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质
CN114710590A (zh) * 2022-03-28 2022-07-05 恒安嘉新(北京)科技股份公司 一种骚扰电话检测方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107889111A (zh) * 2016-09-30 2018-04-06 北京金山安全软件有限公司 基于深层类神经网络的骚扰电话识别方法和装置
CN110113748A (zh) * 2019-05-07 2019-08-09 中国联合网络通信集团有限公司 骚扰电话监控方法、装置
CN110401779A (zh) * 2018-04-24 2019-11-01 中国移动通信集团有限公司 一种识别电话号码的方法、装置和计算机可读存储介质
CN112199388A (zh) * 2020-09-02 2021-01-08 卓望数码技术(深圳)有限公司 陌电识别方法、装置、电子设备及存储介质
CN113452845A (zh) * 2020-03-26 2021-09-28 中国移动通信集团福建有限公司 识别异常电话号码的方法和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107889111A (zh) * 2016-09-30 2018-04-06 北京金山安全软件有限公司 基于深层类神经网络的骚扰电话识别方法和装置
CN110401779A (zh) * 2018-04-24 2019-11-01 中国移动通信集团有限公司 一种识别电话号码的方法、装置和计算机可读存储介质
CN110113748A (zh) * 2019-05-07 2019-08-09 中国联合网络通信集团有限公司 骚扰电话监控方法、装置
CN113452845A (zh) * 2020-03-26 2021-09-28 中国移动通信集团福建有限公司 识别异常电话号码的方法和电子设备
CN112199388A (zh) * 2020-09-02 2021-01-08 卓望数码技术(深圳)有限公司 陌电识别方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卢晓妮,褚启伍,赵玺: "《基于运营商数据的骚扰电话识别框架研究》", 《信息通信技术与政策》, no. 1, pages 36 - 39 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质
CN114449106B (zh) * 2022-02-10 2024-04-30 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质
CN114710590A (zh) * 2022-03-28 2022-07-05 恒安嘉新(北京)科技股份公司 一种骚扰电话检测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113992798B (zh) 2024-07-16

Similar Documents

Publication Publication Date Title
CN113992798A (zh) 电话识别方法、装置、设备及可读存储介质
CN108734012A (zh) 恶意软件识别方法、装置及电子设备
CN103995998A (zh) 一种非接触手势命令的认证方法以及用户设备
US20150220929A1 (en) Passenger behaviour rating for improved risk management in transit systems
CN110458401A (zh) 基于区块链的信息处理装置、方法及存储介质
CN111179066A (zh) 业务数据的批量处理方法、装置、服务器和存储介质
CN109727027A (zh) 账户识别方法、装置、设备及存储介质
CN112734436A (zh) 一种支持人脸识别的终端以及方法
CN107330848A (zh) 图片处理方法、移动终端和存储设备
CN111582868A (zh) 一种交易请求的处理方法、装置及设备
CN107705414A (zh) 一种纸币的识别方法、装置、终端设备和存储介质
CN108494765B (zh) 一种账号处理方法、装置及计算机可读存储介质
CN107809758B (zh) 一种sim卡信息保护方法及装置
CN113010885B (zh) 一种检测伪装起始地址的内核线程的方法及装置
CN112232443B (zh) 身份认证方法、装置、设备及存储介质
CN111640007B (zh) 银行账户开户方法、装置、终端及存储介质
CN114021131A (zh) 一种获取数据分析图谱的方法、装置及电子设备
CN108470404B (zh) 用于读卡器的闸门控制方法、装置、金融设备及存储介质
KR20170048358A (ko) 충전 거래에서 위험을 탐지 및 경고하는 시스템 및 방법
CN109447629B (zh) 一种标识卡识别方法、装置、系统和可读存储介质
CN110163083A (zh) 用户信息的匹配方法、装置及终端设备
CN106204042B (zh) 一种自助终端业务敏感信息的处理方法及系统
CN109801092B (zh) 资源安全管理方法、装置、计算机设备和存储介质
US20220318813A1 (en) Method for processing bank transactions and electronic device using method
CN113760939A (zh) 账号类型的确定方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant