CN113763963A - 电话卡冒用检测方法、系统、计算机设备及存储介质 - Google Patents
电话卡冒用检测方法、系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113763963A CN113763963A CN202110974150.2A CN202110974150A CN113763963A CN 113763963 A CN113763963 A CN 113763963A CN 202110974150 A CN202110974150 A CN 202110974150A CN 113763963 A CN113763963 A CN 113763963A
- Authority
- CN
- China
- Prior art keywords
- telephone
- recording
- voiceprint
- voice
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000001514 detection method Methods 0.000 title claims description 23
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000012952 Resampling Methods 0.000 claims abstract description 39
- 238000009826 distribution Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 23
- 230000001427 coherent effect Effects 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本方案涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。所述方法包括:获取包含有疑似被冒用电话卡的电话号码的嫌疑名单;获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;在注册录音底库中查找与电话号码对应的注册声纹特征;将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。
Description
技术领域
本发明涉及通信技术领域,特别是涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。
背景技术
电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常以冒充他人及仿冒、伪造各种合法外衣和形式的方式达到欺骗的目的。随着科学技术的发展,诈骗分子的诈骗手段变得更加隐蔽、溯源追踪变得更困难。骗子在实施诈骗行为时通常会冒用他人电话卡,在使用他人电话卡实施诈骗行为后,受害者以及执法人员通常会打电话至电话卡机主处进行查验,而机主并不是诈骗实施者,从而使得诈骗分子的诈骗成功率不断提升,导致执法人员对诈骗分子的监管打击困难度提高。
传统的拦截诈骗电话的方式通常是在话务端口布置拦截平台,对经过的电话逐一进行甄别。然而,传统的拦截诈骗电话的方式并不能拦截冒用的电话卡,存在检测困难的问题。
发明内容
基于此,为了解决上述技术问题,提供一种电话卡冒用检测方法、系统、计算机设备和存储介质,可以准确检测出电话卡是否被冒用。
一种电话卡冒用检测方法,所述方法包括:
获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
在注册录音底库中查找与所述电话号码对应的注册声纹特征;
将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
在其中一个实施例中,在通过重采样算法将所述电话录音的采集频率调整为目标采集频率之前,所述方法还包括:
截取所述电话录音中的各个语音片段,分别计算各个所述语音片段对应的各个录音时长;
统计各个所述语音时长的时长分布,并根据各个所述录音时长以及所述时长分布确定所述电话录音是否连贯;
当所述电话录音连贯时,通过重采样算法将所述电话录音的采集频率调整为目标采集频率。
在其中一个实施例中,所述方法还包括:
采集电话卡开户用户的开户注册语音;
截取所述开户注册语音中的各个注册语音片段,分别计算各个所述注册语音片段对应的各个注册录音时长;
统计各个所述注册语音时长的标准时长分布,并根据各个所述注册录音时长以及所述标准时长分布确定所述开户注册语音是否连贯;
当所述开户注册录音连贯时,将所述开户注册语音输入至声纹识别算法模型中,得到与所述开户注册录音对应的注册声纹特征,并将所述注册声纹特征存储至注册录音底库中。
在其中一个实施例中,所述方法还包括:
通过第一频率采集所述电话录音;
通过第二频率采集所述开户注册语音;
通过重采样算法将所述第一频率调整为目标采集频率,通过所述重采样算法将所述第二频率调整为目标采集频率。
在其中一个实施例中,所述声纹识别算法模型的训练过程包括:
获取初始识别算法模型,并提取所述初始识别算法模型中的初始参数;
采集样本语音数据,并对所述样本语音数据进行预处理,得到目标样本语音数据;
提取所述目标样本语音数据中的声学特征,并调用编码器将所述声学特征通过神经网络编码为高维嵌入矢量;
将所述高维嵌入矢量输入至所述初始识别算法模型中,得到初始识别结果,并根据所述初始识别结果对所述初始参数进行调整,得到目标参数;
根据所述目标参数调整所述初始识别算法模型,得到所述声纹识别算法模型。
在其中一个实施例中,所述将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,包括:
将所述声纹特征与所述注册声纹特征进行比对,并计算所述声纹特征与所述注册声纹特征的比对分数;
根据所述比对分数得到所述比对结果。
一种电话卡冒用检测系统,所述系统包括:
名单获取模块,用于获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
频率调整模块,用于获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
声纹特征提取模块,用于将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
声纹特征查找模块,用于在注册录音底库中查找与所述电话号码对应的注册声纹特征;
冒用检测模块,用于将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
在注册录音底库中查找与所述电话号码对应的注册声纹特征;
将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
在注册录音底库中查找与所述电话号码对应的注册声纹特征;
将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
上述电话卡冒用检测方法、系统、计算机设备和存储介质,通过获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;在注册录音底库中查找与所述电话号码对应的注册声纹特征;将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。
附图说明
图1为一个实施例中电话卡冒用检测方法的应用环境图;
图2为一个实施例中电话卡冒用检测方法的流程示意图;
图3为一个实施例中电话卡冒用检测系统的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述频率,但这些频率不受这些术语限制。这些术语仅用于将第一频率与另一频率区分。举例来说,在不脱离本申请的范围的情况下,可以将第一频率称为第二频率,且类似地,可将第二频率称为第一频率。第一频率和第二频率两者都是频率,但其不是同一频率。
本申请实施例提供的电话卡冒用检测方法,可以应用于如图1所示的应用环境中。如图1所示,该应用环境包括计算机设备110。计算机设备110可以获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码;计算机设备110可以获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;计算机设备110可以将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;计算机设备110可以在注册录音底库中查找与电话号码对应的注册声纹特征;计算机设备110可以将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。其中,计算机设备110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴等设备。
在一个实施例中,如图2所示,提供了一种电话卡冒用检测方法,包括以下步骤:
步骤202,获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码。
嫌疑名单中包含有疑似被冒用电话卡的电话号码。具体的,疑似被冒用电话卡的电话号码可以是工作人员通过筛选得到的,工作人员可以将疑似被冒用电话卡的电话号码输入至计算机设备中,计算机设备生成嫌疑名单并存储至数据库中。
步骤204,获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率。
工作人员可以拨打疑似被冒用电话卡的电话号码,与电话号码对应机主进行通话。计算机设备可以通过客服系统对工作人员和机主的通话进行录音。
重采样算法可以用于将通过不同频率采集的音频统一为指定的采集频率。在本实施例中,计算机设备在获取到电话录音后,可以提取电话录音的采集频率,并通过重采样算法将电话录音的采集频率调整为目标采集频率。其中,目标采集频率可以是预先设置好的。
步骤206,将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征。
声纹识别算法模型可以是预先训练好的,用于识别各个电话录音的声纹,并得到识别结果的模型。计算机设备中可以存储有声纹识别算法模型,计算机设备可以将含有目标采集频率的电话录音输入至声纹识别算法模型中,从而得到与电话录音对应的声纹特征。
步骤208,在注册录音底库中查找与电话号码对应的注册声纹特征。
其中,各个注册用户在注册电话卡的时候存储有各个注册电话录音。计算机设备可以将各个注册电话录音输入至声纹识别算法模型中,从而得到各个注册电话录音对应的各个注册声纹特征。
注册录音底库中存储有各个注册声纹特征,具体的,各个注册声纹特征可以分别与各个电话号码相对应,且一个电话号码可以对应有多个注册声纹特征,例如,一个电话号码可以对应有500个注册声纹特征。属于同一个电话号码的各个注册声纹特征可以打包存储在注册录音底库中。计算机设备可以在注册录音底库中查找与电话号码对应的各个注册声纹特征。
步骤210,将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。
其中,声纹特征是工作人员当前与电话号码的机主通话语音的声纹识别结果,而注册声纹特征是电话卡注册用户在注册时语音的声纹识别结果,计算机设备可以将声纹特征与注册声纹特征进行比对,得到比对结果。其中,比对结果可以包括结果相同、结果不相同,结果相同可以表示当前电话号码的机主的声纹与电话卡注册用户的声纹相似度较高,可以认定为是同一人,表示电话卡没有被冒用;结果不相同可以表示当前电话号码的机主的声纹与电话卡注册用户的声纹相似度较低,二者不是同一人,表示电话卡被冒用。
在本实施例中,计算机设备通过获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码;获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;在注册录音底库中查找与电话号码对应的注册声纹特征;将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。
在一个实施例中,提供的一种电话卡冒用检测方法还可以包括对电话录音进行检测的过程,具体过程包括:截取电话录音中的各个语音片段,分别计算各个语音片段对应的各个录音时长;统计各个语音时长的时长分布,并根据各个录音时长以及时长分布确定电话录音是否连贯;当电话录音连贯时,通过重采样算法将电话录音的采集频率调整为目标采集频率。
计算机设备在采集的电话录音后,可以截取电话录音中的各个语音片段。具体的,计算机设备可以去除电话录音中的静默或者非语音的片段,从而得到各个语音片段。
计算机设备可以分别计算出各个语音片段对应的各个录音时长。具体的,计算机设备可以计算纯语音部分的累计时长作为有效的录音时长。计算机设备还可以统计各个语音时长的时长分布,并根据各个录音时长以及时长分布确定电话录音是否连贯,当电话录音连贯时,表示该电话录音检测合格,计算机设备可以进一步通过重采样算法将电话录音的采集频率调整为目标采集频率。
在本实施例中,计算机设备通过对电话录音进行处理,可以提高电话录音的识别效率。
在一个实施例中,提供的一种电话卡冒用检测方法还可以包括采集开户注册语音的过程,具体过程包括:采集电话卡开户用户的开户注册语音;截取开户注册语音中的各个注册语音片段,分别计算各个注册语音片段对应的各个注册录音时长;统计各个注册语音时长的标准时长分布,并根据各个注册录音时长以及标准时长分布确定开户注册语音是否连贯;当开户注册录音连贯时,将开户注册语音输入至声纹识别算法模型中,得到与开户注册录音对应的注册声纹特征,并将注册声纹特征存储至注册录音底库中。
用户在进行开户注册电话卡时,工作人员可以通过计算机设备采集电话卡开户用户的开户注册语音。计算机设备可以对采集到的开户注册语音进行处理,具体的,计算机设备可以截取开户注册语音中的各个注册语音片段,即去除开户注册语音中的静默或者非语音的片段,并计算纯语音部分的累计时间作为有效的注册录音时长。
计算机设备可以进一步统计各个注册语音时长的标准时长分布,并根据各个注册录音时长以及标准时长分布判断开户注册语音是否连贯,从而得到判断结果。当判断结果为开户注册语音连贯时,计算机设备可以将开户注册语音输入至声纹识别算法模型中,得到与开户注册录音对应的注册声纹特征,并将注册声纹特征存储至注册录音底库中;当判断结果为开户注册语音不连贯时,计算机设备可以确定开户注册语音的语音质量不合格,可以返回语音质量不合格的判断结果,便于工作人员重新采集开户注册语音。
在一个实施例中,提供的一种电话卡冒用检测方法还可以包括统一语音采集频率的过程,具体过程包括:通过第一频率采集电话录音;通过第二频率采集开户注册语音;通过重采样算法将所述第一频率调整为目标采集频率,通过所述重采样算法将所述第二频率调整为目标采集频率。
计算机设备可以使用麦克风、声卡等通过第一频率采集电话录音,其中,第一频率可以是8KHz,计算机设备可以通过客服系统对语音通话录制8KHz的电话录音。
在本实施例中,计算机设备可以使用麦克风、声卡等通过第二频率采集开户注册语音,其中,第二频率可以是48kHz,计算机设备可以通过48kHz指向性麦克风进行采集开户注册语音。
计算机设备可以获取第一频率、第二频率,通过使用重采样算法进行上采样以及下采样处理,使得二者频率相同,得到目标采集频率。通过对两种不同传输信道的语音信号使用重采样算法得到相同的采集频率,使得两种不通信道、不同采样率语音信号可以使用同一个声纹识别算法模型得到声纹识别结果,提高了声纹识别的效率。
在一个实施例中,提供的一种电话卡冒用检测方法还可以包括声纹识别算法模型的训练过程,具体过程包括:获取初始识别算法模型,并提取初始识别算法模型中的初始参数;采集样本语音数据,并对样本语音数据进行预处理,得到目标样本语音数据;提取目标样本语音数据中的声学特征,并调用编码器将声学特征通过神经网络编码为高维嵌入矢量;将高维嵌入矢量输入至初始识别算法模型中,得到初始识别结果,并根据初始识别结果对初始参数进行调整,得到目标参数;根据目标参数调整初始识别算法模型,得到声纹识别算法模型。
在本实施例中,声纹识别算法模型可以划分为预处理模块、声学特征提取器、编码器、说话人序号编码器、分类器、训练器等模块。其中,每个模块上可以设置有相关接口供其他模块调用;训练器可以作为程序入口,调用预处理模块对样本语音数据进行预处理,调用声学特征提取器从目标样本语音数据中提取相关声学特征,调用编码器将声学特征通过神经网络编码为高维嵌入矢量,调用说话人序号编码器对数据集中的说话人使用数字编号进行编码,调用分类器将对高维嵌入矢量进行多分类,分类误差通过训练器反馈给声学特征提取器、编码器、分类器进行参数调整。其中,各模块可以将其内部参数作为一个独立文件进行存储;需要进行参数调整时,可以对切换所需模块,并指对特定模块进行参数调整优化。
其中,声纹识别算法模型中的数据权重可以进行训练。具体的,计算机设备可以提取声纹识别算法模型中的损失函数,在损失函数中对数据样本的推理误差引入可变权重,在每次遍历数据集进行参数优化时,为每个数据样本统计其错误率,并对错误率更高的难例提高其权重,提高模型对难例数据的准确性。另外,用户可以根据实际需要,对于错误拒绝和错误接受两种不同的错误类型设置不同的权重,以提高模型对其中一类错误的敏感性。
在一个实施例中,提供的一种电话卡冒用检测方法还可以包括声纹比对的过程,具体过程包括:将声纹特征与注册声纹特征进行比对,并计算声纹特征与注册声纹特征的比对分数;根据比对分数得到比对结果。
计算机设备在得到声纹特征与注册声纹特征后,可以将声纹特征与注册声纹特征结果进行比对。具体的,工作人员可以对疑似名单中的电话号码进行客服回访,将客服电话录音与其机主开户注册录音进行声纹比对,得到比对分数;同时,计算机设备可以使用该客服回访的电话录音,在包含有疑似名单中的电话号码对应的开户注册录音的数据库中进行声纹检索,并找出最相似的一个或多个用户,计算出客服电话录音与最相似用户之间的识别结果。计算机设备可以比较比对分数、识别结果。若比对分数为“相同“,且识别结果为该机机主最相似,则认为机主与使用者是同一人,不存在冒用行为;若比对分数为“不同”,且识别结果不是该机机主,则认为机主与使用者不是同一个人,存在电话卡冒用行为。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种电话卡冒用检测系统,包括:名单获取模块310、频率调整模块320、声纹特征提取模块330、声纹特征查找模块340和冒用检测模块350,其中:
名单获取模块310,用于获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码;
频率调整模块320,用于获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;
声纹特征提取模块330,用于将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;
声纹特征查找模块340,用于在注册录音底库中查找与电话号码对应的注册声纹特征;
冒用检测模块350,用于将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。
在一个实施例中,频率调整模块320还用于截取电话录音中的各个语音片段,分别计算各个语音片段对应的各个录音时长;统计各个语音时长的时长分布,并根据各个录音时长以及时长分布确定电话录音是否连贯;当电话录音连贯时,过重采样算法将电话录音的采集频率调整为目标采集频率。
在一个实施例中,声纹特征查找模块340还用于采集电话卡开户用户的开户注册语音;截取开户注册语音中的各个注册语音片段,分别计算各个注册语音片段对应的各个注册录音时长;统计各个注册语音时长的标准时长分布,并根据各个注册录音时长以及标准时长分布确定开户注册语音是否连贯;当开户注册录音连贯时,将开户注册语音输入至声纹识别算法模型中,得到与开户注册录音对应的注册声纹特征,并将注册声纹特征存储至注册录音底库中。
在一个实施例中,频率调整模块320还用于通过第一频率采集电话录音;通过第二频率采集开户注册语音;通过重采样算法将第一频率调整为目标采集频率,通过重采样算法将第二频率调整为目标采集频率。
在一个实施例中,声纹特征提取模块330还用于获取初始识别算法模型,并提取初始识别算法模型中的初始参数;采集样本语音数据,并对样本语音数据进行预处理,得到目标样本语音数据;提取目标样本语音数据中的声学特征,并调用编码器将声学特征通过神经网络编码为高维嵌入矢量;将高维嵌入矢量输入至初始识别算法模型中,得到初始识别结果,并根据初始识别结果对初始参数进行调整,得到目标参数;根据目标参数调整初始识别算法模型,得到声纹识别算法模型。
在一个实施例中,冒用检测模块350还用于将声纹特征与注册声纹特征进行比对,并计算声纹特征与注册声纹特征的比对分数;根据比对分数得到比对结果。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电话卡冒用检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;
将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;
在注册录音底库中查找与电话号码对应的注册声纹特征;
将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:截取电话录音中的各个语音片段,分别计算各个语音片段对应的各个录音时长;统计各个语音时长的时长分布,并根据各个录音时长以及时长分布确定电话录音是否连贯;当电话录音连贯时,通过重采样算法将电话录音的采集频率调整为目标采集频率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:采集电话卡开户用户的开户注册语音;截取开户注册语音中的各个注册语音片段,分别计算各个注册语音片段对应的各个注册录音时长;统计各个注册语音时长的标准时长分布,并根据各个注册录音时长以及标准时长分布确定开户注册语音是否连贯;当开户注册录音连贯时,将开户注册语音输入至声纹识别算法模型中,得到与开户注册录音对应的注册声纹特征,并将注册声纹特征存储至注册录音底库中。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过第一频率采集电话录音;通过第二频率采集开户注册语音;通过重采样算法将第一频率调整为目标采集频率,通过重采样算法将第二频率调整为目标采集频率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取初始识别算法模型,并提取初始识别算法模型中的初始参数;采集样本语音数据,并对样本语音数据进行预处理,得到目标样本语音数据;提取目标样本语音数据中的声学特征,并调用编码器将声学特征通过神经网络编码为高维嵌入矢量;将高维嵌入矢量输入至初始识别算法模型中,得到初始识别结果,并根据初始识别结果对初始参数进行调整,得到目标参数;根据目标参数调整初始识别算法模型,得到声纹识别算法模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将声纹特征与注册声纹特征进行比对,并计算声纹特征与注册声纹特征的比对分数;根据比对分数得到比对结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取嫌疑名单,嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;
将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;
在注册录音底库中查找与电话号码对应的注册声纹特征;
将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:截取电话录音中的各个语音片段,分别计算各个语音片段对应的各个录音时长;统计各个语音时长的时长分布,并根据各个录音时长以及时长分布确定电话录音是否连贯;当电话录音连贯时,通过重采样算法将电话录音的采集频率调整为目标采集频率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:采集电话卡开户用户的开户注册语音;截取开户注册语音中的各个注册语音片段,分别计算各个注册语音片段对应的各个注册录音时长;统计各个注册语音时长的标准时长分布,并根据各个注册录音时长以及标准时长分布确定开户注册语音是否连贯;当开户注册录音连贯时,将开户注册语音输入至声纹识别算法模型中,得到与开户注册录音对应的注册声纹特征,并将注册声纹特征存储至注册录音底库中。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过第一频率采集电话录音;通过第二频率采集开户注册语音;通过重采样算法将第一频率调整为目标采集频率,通过重采样算法将第二频率调整为目标采集频率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取初始识别算法模型,并提取初始识别算法模型中的初始参数;采集样本语音数据,并对样本语音数据进行预处理,得到目标样本语音数据;提取目标样本语音数据中的声学特征,并调用编码器将声学特征通过神经网络编码为高维嵌入矢量;将高维嵌入矢量输入至初始识别算法模型中,得到初始识别结果,并根据初始识别结果对初始参数进行调整,得到目标参数;根据目标参数调整初始识别算法模型,得到声纹识别算法模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将声纹特征与注册声纹特征进行比对,并计算声纹特征与注册声纹特征的比对分数;根据比对分数得到比对结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种电话卡冒用检测方法,其特征在于,所述方法包括:
获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
在注册录音底库中查找与所述电话号码对应的注册声纹特征;
将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
2.根据权利要求1所述的电话卡冒用检测方法,其特征在于,在通过重采样算法将所述电话录音的采集频率调整为目标采集频率之前,所述方法还包括:
截取所述电话录音中的各个语音片段,分别计算各个所述语音片段对应的各个录音时长;
统计各个所述语音时长的时长分布,并根据各个所述录音时长以及所述时长分布确定所述电话录音是否连贯;
当所述电话录音连贯时,通过重采样算法将所述电话录音的采集频率调整为目标采集频率。
3.根据权利要求1所述的电话卡冒用检测方法,其特征在于,所述方法还包括:
采集电话卡开户用户的开户注册语音;
截取所述开户注册语音中的各个注册语音片段,分别计算各个所述注册语音片段对应的各个注册录音时长;
统计各个所述注册语音时长的标准时长分布,并根据各个所述注册录音时长以及所述标准时长分布确定所述开户注册语音是否连贯;
当所述开户注册录音连贯时,将所述开户注册语音输入至声纹识别算法模型中,得到与所述开户注册录音对应的注册声纹特征,并将所述注册声纹特征存储至注册录音底库中。
4.根据权利要求3所述的电话卡冒用检测方法,其特征在于,所述方法还包括:
通过第一频率采集所述电话录音;
通过第二频率采集所述开户注册语音;
通过重采样算法将所述第一频率调整为目标采集频率,通过所述重采样算法将所述第二频率调整为目标采集频率。
5.根据权利要求1所述的电话卡冒用检测方法,其特征在于,所述声纹识别算法模型的训练过程包括:
获取初始识别算法模型,并提取所述初始识别算法模型中的初始参数;
采集样本语音数据,并对所述样本语音数据进行预处理,得到目标样本语音数据;
提取所述目标样本语音数据中的声学特征,并调用编码器将所述声学特征通过神经网络编码为高维嵌入矢量;
将所述高维嵌入矢量输入至所述初始识别算法模型中,得到初始识别结果,并根据所述初始识别结果对所述初始参数进行调整,得到目标参数;
根据所述目标参数调整所述初始识别算法模型,得到所述声纹识别算法模型。
6.根据权利要求1所述的电话卡冒用检测方法,其特征在于,所述将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,包括:
将所述声纹特征与所述注册声纹特征进行比对,并计算所述声纹特征与所述注册声纹特征的比对分数;
根据所述比对分数得到所述比对结果。
7.一种电话卡冒用检测系统,其特征在于,所述系统包括:
名单获取模块,用于获取嫌疑名单,所述嫌疑名单中包含有疑似被冒用电话卡的电话号码;
频率调整模块,用于获取与所述电话号码对应机主的电话录音,并通过重采样算法将所述电话录音的采集频率调整为目标采集频率;
声纹特征提取模块,用于将含有所述目标采集频率的所述电话录音输入至声纹识别算法模型中,得到与所述电话录音对应的声纹特征;
声纹特征查找模块,用于在注册录音底库中查找与所述电话号码对应的注册声纹特征;
冒用检测模块,用于将所述声纹特征与所述注册声纹特征进行比对,得到比对结果,并根据所述比对结果确定所述电话号码对应的电话卡是否被冒用。
8.根据权利要求7所述的电话卡冒用检测系统,其特征在于,所述频率调整模块,用于截取所述电话录音中的各个语音片段,分别计算各个所述语音片段对应的各个录音时长;统计各个所述语音时长的时长分布,并根据各个所述录音时长以及所述时长分布确定所述电话录音是否连贯;当所述电话录音连贯时,通过重采样算法将所述电话录音的采集频率调整为目标采集频率。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974150.2A CN113763963A (zh) | 2021-08-24 | 2021-08-24 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974150.2A CN113763963A (zh) | 2021-08-24 | 2021-08-24 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113763963A true CN113763963A (zh) | 2021-12-07 |
Family
ID=78791107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110974150.2A Pending CN113763963A (zh) | 2021-08-24 | 2021-08-24 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113763963A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142254A (zh) * | 2011-03-25 | 2011-08-03 | 北京得意音通技术有限责任公司 | 基于声纹识别和语音识别的防录音假冒的身份确认方法 |
CN106162321A (zh) * | 2016-08-31 | 2016-11-23 | 成都广电视讯文化传播有限公司 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
CN106210239A (zh) * | 2016-09-14 | 2016-12-07 | 北京奇虎科技有限公司 | 恶意来电者声纹的自动识别方法、装置和移动终端 |
KR20170062726A (ko) * | 2015-11-30 | 2017-06-08 | (주)포스원아이티코리아 | 보이스피싱, 스미싱 , 대출사기 등 금융사기 방지, 범죄예방 및 범죄자 식별 음성인식 시스템 및 그 방법 |
CN106991312A (zh) * | 2017-04-05 | 2017-07-28 | 百融(北京)金融信息服务股份有限公司 | 基于声纹识别的互联网反欺诈认证方法 |
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN109858917A (zh) * | 2019-02-13 | 2019-06-07 | 苏州意能通信息技术有限公司 | 一种基于人工智能的反欺诈系统及其方法 |
CN111327752A (zh) * | 2018-11-28 | 2020-06-23 | 中国电信股份有限公司 | 通话处理方法、装置以及通信系统、存储介质 |
CN111641756A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 诈骗识别方法、装置及计算机可读存储介质 |
CN112818316A (zh) * | 2021-03-08 | 2021-05-18 | 南京大正智能科技有限公司 | 基于声纹的身份识别及应用方法、装置与设备 |
-
2021
- 2021-08-24 CN CN202110974150.2A patent/CN113763963A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142254A (zh) * | 2011-03-25 | 2011-08-03 | 北京得意音通技术有限责任公司 | 基于声纹识别和语音识别的防录音假冒的身份确认方法 |
KR20170062726A (ko) * | 2015-11-30 | 2017-06-08 | (주)포스원아이티코리아 | 보이스피싱, 스미싱 , 대출사기 등 금융사기 방지, 범죄예방 및 범죄자 식별 음성인식 시스템 및 그 방법 |
CN106162321A (zh) * | 2016-08-31 | 2016-11-23 | 成都广电视讯文化传播有限公司 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
CN106210239A (zh) * | 2016-09-14 | 2016-12-07 | 北京奇虎科技有限公司 | 恶意来电者声纹的自动识别方法、装置和移动终端 |
CN106991312A (zh) * | 2017-04-05 | 2017-07-28 | 百融(北京)金融信息服务股份有限公司 | 基于声纹识别的互联网反欺诈认证方法 |
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN111327752A (zh) * | 2018-11-28 | 2020-06-23 | 中国电信股份有限公司 | 通话处理方法、装置以及通信系统、存储介质 |
CN109858917A (zh) * | 2019-02-13 | 2019-06-07 | 苏州意能通信息技术有限公司 | 一种基于人工智能的反欺诈系统及其方法 |
CN111641756A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 诈骗识别方法、装置及计算机可读存储介质 |
CN112818316A (zh) * | 2021-03-08 | 2021-05-18 | 南京大正智能科技有限公司 | 基于声纹的身份识别及应用方法、装置与设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022201831B2 (en) | Call classification through analysis of DTMF events | |
CN108417216B (zh) | 语音验证方法、装置、计算机设备和存储介质 | |
CN110378228A (zh) | 面审视频数据处理方法、装置、计算机设备和存储介质 | |
CN105244031A (zh) | 说话人识别方法和装置 | |
US10909991B2 (en) | System for text-dependent speaker recognition and method thereof | |
CN107766868A (zh) | 一种分类器训练方法及装置 | |
CN110765850A (zh) | 基于残差网络的报警方法、装置、计算机设备和存储介质 | |
CN113191787A (zh) | 电信数据的处理方法、装置电子设备及存储介质 | |
CN110246503A (zh) | 黑名单声纹库构建方法、装置、计算机设备和存储介质 | |
CN111816185A (zh) | 一种对混合语音中说话人的识别方法及装置 | |
JP2010273130A (ja) | 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 | |
CN107274912A (zh) | 一种手机录音的设备来源辨识方法 | |
CN111063359B (zh) | 电话回访有效性判别方法、装置、计算机设备和介质 | |
Neelima et al. | Mimicry voice detection using convolutional neural networks | |
CN113763963A (zh) | 电话卡冒用检测方法、系统、计算机设备及存储介质 | |
CN107154996B (zh) | 来电拦截方法、装置、存储介质及终端 | |
KR102332997B1 (ko) | 금융사기 위험도 판단 서버, 방법 및 프로그램 | |
CN114023331A (zh) | 声纹识别系统的性能检测方法、装置、设备和存储介质 | |
CN107341457A (zh) | 人脸检测方法及装置 | |
CN112417007A (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
Guerra-Casanova et al. | A sequence alignment approach applied to a mobile authentication technique based on gestures | |
De Prisco et al. | An Accelerometer-based Privacy Attack on Smartphones. | |
CN116092514A (zh) | 多异构设备下的扬声器音频分类方法 | |
CN117577107A (zh) | 一种基于语音对话信息匹配劝阻策略的方法、装置及设备 | |
CN116665708A (zh) | 一种违规业务操作检测系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |