CN110767238B - 基于地址信息的黑名单识别方法、装置、设备及存储介质 - Google Patents

基于地址信息的黑名单识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110767238B
CN110767238B CN201910884630.2A CN201910884630A CN110767238B CN 110767238 B CN110767238 B CN 110767238B CN 201910884630 A CN201910884630 A CN 201910884630A CN 110767238 B CN110767238 B CN 110767238B
Authority
CN
China
Prior art keywords
blacklist
target
address information
file
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910884630.2A
Other languages
English (en)
Other versions
CN110767238A (zh
Inventor
李江
王健宗
彭俊清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910884630.2A priority Critical patent/CN110767238B/zh
Priority to PCT/CN2019/117117 priority patent/WO2021051533A1/zh
Publication of CN110767238A publication Critical patent/CN110767238A/zh
Application granted granted Critical
Publication of CN110767238B publication Critical patent/CN110767238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/08Use of distortion metrics or a particular distance between probe pattern and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及人工智能领域,公开了基于地址信息的黑名单识别方法、装置、设备及存储介质,用于将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。本发明方法包括:获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和互联网协议地址IP信息;通过预置算法对音频进行特征提取,得到特征文件;判断特征文件是否有效;若特征文件无效,则生成提取失败的状态码;若特征文件有效,则根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。

Description

基于地址信息的黑名单识别方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及基于地址信息的黑名单识别方法、装置、设备及存储介质。
背景技术
声纹识别是通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,简单的说就是辨别某一句话是否是某一个人说的技术。声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。决定声纹特征最重要的两个因素是声腔的尺寸和发声器官被操纵的方式。
声纹是人体非常重要的特征,理论上来讲,没有任何两个人具备完全相同的声纹特征。而基于声纹识别的说话人辨认技术在实际生产中具有重要的意义,比如银行信用卡业务,可以通过记录黑名单用户的声纹特征库,比对用户语音是否在黑名单特征库中,以此分析辨认出用户是否在黑名单,从而指导银行信用卡业务人员做出对应的处理应对策略。
现有方案中,黑名单特征库的建立覆盖全国,覆盖全年龄段,因此,黑名单特征库会非常庞大,基于庞大黑名单特征库的比对效率会非常慢,很难快速得到响应。
发明内容
本发明提供了基于地址信息的黑名单识别方法、装置、设备及存储介质,用于将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
本发明实施例的第一方面提供一种基于地址信息的黑名单识别方法,包括:获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和互联网协议地址IP信息;通过预置算法对所述音频进行特征提取,得到特征文件;判断所述特征文件是否有效;若所述特征文件无效,则生成提取失败的状态码,所述状态码用于指示提取失败的原因;若所述特征文件有效,则根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
可选的,在本发明实施例第一方面的第一种实现方式中,所述若所述特征文件有效,则根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作,包括:若所述特征文件有效,则基于所述进线电话区段或所述互联网协议地址IP信息确定所述目标用户所属的目标地址范围;根据所述目标地址范围在所述预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;通过所述目标黑名单模型对所述特征文件进行相似度评分,得到目标分值;若所述目标分值大于或等于第一阈值,则确定所述目标用户在所述目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,所述第一提示消息用于指示所述目标用户被禁止接受正常服务;若所述目标分值小于所述第一阈值,则确定所述目标用户不在所述目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,所述第二提示消息用于指示所述目标用户接受正常服务。
可选的,在本发明实施例第一方面的第二种实现方式中,所述获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和IP信息包括:接收目标用户的语音文件;对所述语音文件进行解析,得到所述目标用户的音频和地址标识;根据所述地址标识查询预置表格,得到与所述地址标识对应的地址信息,所述地址信息包括进线电话区段或/和IP信息。
可选的,在本发明实施例第一方面的第三种实现方式中,所述通过预置算法对所述音频进行特征提取,得到特征文件包括:将所述音频从模拟信号形式转换成数字信号形式;对数字信号形式的音频进行预加重;将预加重后的音频进行加窗处理;将加窗处理后的音频进行离散傅里叶变换,得到目标复数;将所述目标复数对应到梅尔频谱上,得到对数能量;将所述对数能量进行转换,得到倒谱系数;根据所述倒谱系数计算能量和差分,生成特征文件。
可选的,在本发明实施例第一方面的第四种实现方式中,所述将加窗处理后的音频进行离散傅里叶变换,得到目标复数包括:获取加窗后的音频信号x[n],...,[m],n和m为大于0的整数;调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure BDA0002206920950000031
N为2的幂,k为整数,X[k]表示所述加窗后的音频信号中某一频率成分的幅度和相位。
可选的,在本发明实施例第一方面的第五种实现方式中,所述将所述目标复数对应到梅尔频谱上,得到对数能量包括:通过预置的滤波器组将所述目标复数进行平滑处理;将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;通过第二预置公式将所述平滑处理后的复数对应到梅尔刻度上,得到目标刻度,所述第二预置公式为:
Figure BDA0002206920950000032
0<f≤1000;根据第三预置公式计算所述目标刻度的对数能量,所述第三预置公式为:/>
Figure BDA0002206920950000033
m=1,2,...,M,22≤M≤26,Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。
可选的,在本发明实施例第一方面的第六种实现方式中,所述获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和IP信息之前,所述方法还包括:生成预置的黑名单模型,所述预置的黑名单模型用于黑名单注册。
本发明实施例的第二方面提供了一种基于地址信息的黑名单识别装置,包括:获取单元,用于获取目标用户的语音文件,所述语音文件包括音频和地址信息;提取单元,用于通过预置算法对所述音频进行特征提取,得到特征文件;判断单元,用于判断所述特征文件是否有效;第一生成单元,若所述特征文件无效,则用于生成提取失败的状态码,所述状态码用于指示提取失败的原因;评分单元,若所述特征文件有效,则用于根据所述进线电话区段或所述互联网协议地址IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
可选的,在本发明实施例第二方面的第一种实现方式中,评分单元具体用于:若所述特征文件有效,则基于所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围;根据所述目标地址范围在所述预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;通过所述目标黑名单模型对所述特征文件进行相似度评分,得到目标分值;若所述目标分值大于或等于第一阈值,则确定所述目标用户在所述目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,所述第一提示消息用于指示所述目标用户被禁止接受正常服务;若所述目标分值小于所述第一阈值,则确定所述目标用户不在所述目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,所述第二提示消息用于指示所述目标用户接受正常服务。
可选的,在本发明实施例第二方面的第二种实现方式中,获取单元具体用于:接收目标用户的语音文件;对所述语音文件进行解析,得到所述目标用户的音频和地址标识;根据所述地址标识查询预置表格,得到与所述地址标识对应的地址信息,所述地址信息包括进线电话区段或/和IP信息。
可选的,在本发明实施例第二方面的第三种实现方式中,提取单元包括:第一转换模块,用于将所述音频从模拟信号形式转换成数字信号形式;预加重模块,用于对数字信号形式的音频进行预加重;加窗模块,用于将预加重后的音频进行加窗处理;变换模块,用于将加窗处理后的音频进行离散傅里叶变换,得到目标复数;对应模块,用于将所述目标复数对应到梅尔频谱上,得到对数能量;第二转换模块,用于将所述对数能量进行转换,得到倒谱系数;计算模块,用于根据所述倒谱系数计算能量和差分,生成特征文件。
可选的,在本发明实施例第二方面的第四种实现方式中,变换模块具体用于:获取加窗后的音频信号x[n],...,[m],n和m为大于0的整数;调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure BDA0002206920950000041
N为2的幂,k为整数,X[k]表示所述加窗后的音频信号中某一频率成分的幅度和相位。
可选的,在本发明实施例第二方面的第五种实现方式中,对应模块具体用于:通过预置的滤波器组将所述目标复数进行平滑处理;将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;通过第二预置公式将所述平滑处理后的复数对应到梅尔刻度上,得到目标刻度,所述第二预置公式为:
Figure BDA0002206920950000042
0<f≤1000;根据第三预置公式计算所述目标刻度的对数能量,所述第三预置公式为:
Figure BDA0002206920950000043
m=1,2,...,M,22≤M≤26,Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。
可选的,在本发明实施例第二方面的第六种实现方式中,基于地址信息的黑名单识别装置还包括:第二生成单元,用于生成预置的黑名单模型,所述预置的黑名单模型用于黑名单注册。
本发明实施例的第三方面提供了一种基于地址信息的黑名单识别设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施方式所述的基于地址信息的黑名单识别方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行上述任一实施方式所述的基于地址信息的黑名单识别方法的步骤。
本发明实施例提供的技术方案中,获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和互联网协议地址IP信息;通过预置算法对音频进行特征提取,得到特征文件;判断特征文件是否有效;若特征文件无效,则生成提取失败的状态码,状态码用于指示提取失败的原因;若特征文件有效,则根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。本发明实施例,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
附图说明
图1为本发明实施例中基于地址信息的黑名单识别方法的一个实施例示意图;
图2为本发明实施例中基于地址信息的黑名单识别方法的另一个实施例示意图;
图3为本发明实施例中基于地址信息的黑名单识别装置的一个实施例示意图;
图4为本发明实施例中基于地址信息的黑名单识别装置的另一个实施例示意图;
图5为本发明实施例中基于地址信息的黑名单识别设备的一个实施例示意图。
具体实施方式
本发明提供了基于地址信息的黑名单识别方法、装置、设备及存储介质,于将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,本发明实施例提供的基于地址信息的黑名单识别方法的流程图,具体包括:
101、获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和互联网协议地址IP信息。
服务器获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和IP信息。具体的,服务器接收目标用户的语音文件;服务器对语音文件进行解析,得到目标用户的音频和地址标识;服务器根据地址标识查询预置表格,得到与地址标识对应的地址信息,地址信息包括进线电话区段或/和IP信息。
例如,服务器在通过电话或网络获取到目标用户的音频的同时,也会相应的根据进线电话区段或者互联网协议地址(internet protocol address,IP)信息确定目标用户的具体地址。而对于某一具体业务而言,会维护有目标用户的基本信息(敏感信息除外),例如,当服务器通过网络获取到目标用户语音文件,该语音文件中除了包括音频和地址标识,还包括有指示目标用户基本信息的身份标识,其中,基本信息包括年龄、性别等。
可以理解的是,本发明的执行主体可以为基于地址信息的黑名单识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、通过预置算法对音频进行特征提取,得到特征文件。
服务器通过预置算法对音频进行特征提取,得到特征文件。具体的,服务器将音频从模拟信号形式转换成数字信号形式;服务器对数字信号形式的音频进行预加重;服务器将预加重后的音频进行加窗处理;服务器将加窗处理后的音频进行离散傅里叶变换,得到目标复数;服务器将目标复数对应到梅尔频谱上,得到对数能量;服务器将对数能量进行转换,得到倒谱系数;服务器根据倒谱系数计算能量和差分,生成特征文件。
需要说明的是,再进行特征提取之前,服务器需要对采集到的音频进行采样和量化,即以一定的采样率和采样位数把音频连续波形转换为离散的数据点。由于日常生活中的声音一般都在8kHz以下,根据Nyquist定律,16kHz采样率足以使得采样出来的数据包含大多数声音信息。16kHz意味着1s的时间内采样16k个样本,这些样本都是以幅度值存储,为了有效存储幅度值,需要将其量化为整数。对于16位采样位数来说,可以表示-32768~32767之间的整数值,所以可以将采样幅度值量化为最近的整数值。
例如,对于声音信号的频谱来说,通常低频部分的能量高于高频部分的能量,每经过10倍Hz,频谱能量就会衰减20dB,而且由于麦克风在采集声音信号时电路本身噪声的影响,也会增加低频部分的能量,为使高频部分的能量和低频部分能量有相似的幅度,需要预加强采集到声音的高频能量,即对数字信号形式的音频进行预加重。
在一段相当短的时间内,可以认为预加重后的音频是平稳的,这就是加窗。窗由三个参数来描述:窗长(单位毫秒)、偏移和形状。每一个加窗的音频信号叫做一帧,每一帧的毫秒数叫做帧长,相邻两帧左边界的距离叫帧移。从音频信号s[n]中提取一帧的过程可表示为y[n]=w[n]s[n],如果w[n]是矩形窗,则信号会在边界处切断,这些不连续会对傅里叶分析造成影响。因此在梅尔频率倒谱系数中,加窗一般使用边缘平滑降到0的汉明窗,表达式如下:
Figure BDA0002206920950000071
L为帧长。
可以理解的是,服务器将加窗处理后的音频进行离散傅里叶变换,得到目标复数的过程具体包括:服务器获取加窗后的音频信号x[n],...,[m],n和m为大于0的整数;服务器调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure BDA0002206920950000081
N为2的幂,k为整数,X[k]表示加窗后的音频信号中某一频率成分的幅度和相位。
服务器将目标复数对应到梅尔频谱上,得到对数能量的过程具体包括:
服务器通过预置的滤波器组将目标复数进行平滑处理;服务器将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;服务器通过第二预置公式将平滑处理后的复数对应到梅尔刻度上,得到目标刻度,第二预置公式为:
Figure BDA0002206920950000082
0<f≤1000;服务器根据第三预置公式计算目标刻度的对数能量,第三预置公式为:/>
Figure BDA0002206920950000083
m=1,2,...,M,22≤M≤26,Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。需要说明的是,一般人对声音声压的反应呈对数关系,人对高声压的细微变化敏感度不如低声压。此外,使用对数可以降低提取的特征对输入声音能量变化的敏感度,因为声音与麦克风之间的距离是变化的,因而麦克风采集到的声音能量也是变化的。人耳听觉对不同频带的敏感度是不同的,人耳对高频不如低频敏感,这一分界线大约是1000Hz,在提取声音特征时模拟人耳听觉这一性质可以提高识别性能。滤波器组是一组梅尔刻度的三角形滤波器组,1000Hz以下的10个滤波器线性相隔,1000Hz以上的剩余滤波器对数相隔。
服务器根据倒谱系数计算能量和差分,生成特征文件的过程具体包括:
具体的,某一帧的能量定义为某一帧样本点的平方和,对于一个加窗信号x,其从样本点t1到样本点t2的能量为:
Figure BDA0002206920950000084
以上提取的特征每一帧单独考虑,是静态的,而实际声音是连续的,帧与帧之间是有联系的,因而需要增加特征来表示这种帧间的动态变化,这通常通过计算每一帧13个特征(12个倒谱特征加上1个能量)的一阶差分甚至二阶差分来实现。一个简单计算差分的方法就是计算当前帧前后各一帧的13个特征的差值:/>
Figure BDA0002206920950000085
如果不考虑二阶差分,最终每一帧的梅尔频率倒谱系数特征为26维度:12维倒谱系数、12维倒谱系数差分、1维能量和1维能量差分。
103、判断特征文件是否有效。
服务器判断特征文件是否有效。具体的,服务器判断特征文件的格式是否符合预置质量要求;若特征文件的格式不符合预置质量要求,则服务器确定特征文件无效;若特征文件的格式符合预置质量要求,则服务器判断特征文件中是否存在多个用户的声音;若特征文件中不存在多个用户的声音,则服务器确定特征文件有效;若特征文件中存在多个用户的声音,则服务器确定特征文件无效。
104、若特征文件无效,则生成提取失败的状态码,状态码用于指示提取失败的原因。
若特征文件无效,则服务器生成提取失败的状态码,状态码用于指示提取失败的原因,即提取失败的状态码可以简单告知没有提取成功的原因,如语音质量不佳,多人说话等。不同的失败原因对应不同的状态码。例如,若特征文件的格式不符合预置质量要求,则服务器确定特征文件无效,生成提取失败的第一状态码;若特征文件中存在多个用户的声音,则服务器确定特征文件无效,生成提取失败的第二状态码,其中,第一状态码和第二状态码不同。
105、若特征文件有效,则根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
若特征文件有效,则服务器根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。具体的,若特征文件有效,则服务器基于进线电话区段或IP信息确定目标用户所属的目标地址范围;服务器根据目标地址范围在预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;服务器通过目标黑名单模型对特征文件进行相似度评分,得到目标分值;若目标分值大于或等于第一阈值,则服务器确定目标用户在目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,第一提示消息用于指示目标用户被禁止接受正常服务;若目标分值小于第一阈值,则服务器确定目标用户不在目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,第二提示消息用于指示目标用户接受正常服务。
需要说明的是,不同的地址,对应不同的目标黑名单模型,对应的黑名单特征分库也不同。不在黑名单特征分库内,即表示为正常用户,接受正常服务,如果此次服务过程中不顺利,也可将该用户注册到黑名单特征分库中;如果在黑名单特征分库内,则视为黑名单用户,不予正常服务(如不予办理贷款等等)。
目标用户的总分数,对语音所提取的声纹特征(特征文件)与黑名单特征分库中的声纹特征进行比对,然后结合地址信息进行评分。这里的打分是计算声纹特征的相似度。通常会根据模型训练有一个阈值,当打分高于阈值时,即证明两个声纹特征接近,也就可以认为是比对到了。
可以理解的是,本发明主要可以应用到银行贷款业务,根据用户的信用等级决定是否将该用户纳入黑名单,同时,根据该用户的地区、年龄、性别将其声纹特征注册到黑名单特征分库。当一个用户的声纹特征被注册到黑名单特征分库后,日后,若此人有来电,可以根据其声纹特征判别出其属于黑名单,因此可以不予办理贷款业务。
本发明实施例,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
请参阅图2,本发明实施例提供的基于地址信息的黑名单识别方法的另一个流程图,具体包括:
201、生成预置的黑名单模型,预置的黑名单模型用于黑名单注册。
服务器生成预置的黑名单模型,预置的黑名单模型用于黑名单注册。具体的,服务器对黑名单进行分库注册处理,从客户信息(非敏感)、电话区段、网络IP等获知用户的年龄、地区、性别等关键信息,以其通话语音提取声纹特征;根据注册用户的基本信息将声纹特征保存到对应的库中,此即为黑名单的分库注册。分库注册只保存维度最细的黑名单特征分库,如(华东地区男50岁以上),而维度较大的库将由最细的库合成,如(华东地区男可由华东地区男50岁以上、华东地区男50岁以下两个黑名单特征分库合成)。基于此分库注册方案,可以根据用户的地区、性别以及年龄直接在对应的小库中进行匹配,(如果用户的地区、性别或年龄三个要素其中有某个要素无法确定,即可根据要素找到应该要合成的库,在这几个黑名单特征分库中进行匹配。)此分库注册方案在实际使用过程中,避免了单次匹配庞大黑名单库的弊端,同时也非常符合银行信用卡的实际业务场景。
需要说明的是,除了可以获取地区、年龄段、性别等维度信息,还可以获取其他维度信息,比如客户的职业或者客户在系统中的ID等等,但是,对于客户的敏感信息不宜作为维度。
可以理解的是,本发明的执行主体可以为基于地址信息的黑名单识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
202、获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和互联网协议地址IP信息。
服务器获取目标用户的语音文件,语音文件包括音频和地址信息,地址信息包括进线电话区段或/和IP信息。具体的,服务器接收目标用户的语音文件;服务器对语音文件进行解析,得到目标用户的音频和地址标识;服务器根据地址标识查询预置表格,得到与地址标识对应的地址信息,地址信息包括进线电话区段或/和IP信息。
例如,服务器在通过电话或网络获取到目标用户的音频的同时,也会相应的根据进线电话区段或者网络互联网协议地址地址(internet protocol,IP)信息确定目标用户的具体地址。而对于某一具体业务而言,会维护有目标用户的基本信息(敏感信息除外),例如,当服务器通过网络获取到目标用户语音文件,该语音文件中除了包括音频和地址标识,还包括有指示目标用户基本信息的身份标识,其中,基本信息包括年龄、性别等。
203、通过预置算法对音频进行特征提取,得到特征文件。
服务器通过预置算法对音频进行特征提取,得到特征文件。具体的,服务器将音频从模拟信号形式转换成数字信号形式;服务器对数字信号形式的音频进行预加重;服务器将预加重后的音频进行加窗处理;服务器将加窗处理后的音频进行离散傅里叶变换,得到目标复数;服务器将目标复数对应到梅尔频谱上,得到对数能量;服务器将对数能量进行转换,得到倒谱系数;服务器根据倒谱系数计算能量和差分,生成特征文件。
需要说明的是,再进行特征提取之前,服务器需要对采集到的音频进行采样和量化,即以一定的采样率和采样位数把音频连续波形转换为离散的数据点。由于日常生活中的声音一般都在8kHz以下,根据Nyquist定律,16kHz采样率足以使得采样出来的数据包含大多数声音信息。16kHz意味着1s的时间内采样16k个样本,这些样本都是以幅度值存储,为了有效存储幅度值,需要将其量化为整数。对于16位采样位数来说,可以表示-32768~32767之间的整数值,所以可以将采样幅度值量化为最近的整数值。
例如,对于声音信号的频谱来说,通常低频部分的能量高于高频部分的能量,每经过10倍Hz,频谱能量就会衰减20dB,而且由于麦克风在采集声音信号时电路本身噪声的影响,也会增加低频部分的能量,为使高频部分的能量和低频部分能量有相似的幅度,需要预加强采集到声音的高频能量,即对数字信号形式的音频进行预加重。
在一段相当短的时间内,可以认为预加重后的音频是平稳的,这就是加窗。窗由三个参数来描述:窗长(单位毫秒)、偏移和形状。每一个加窗的音频信号叫做一帧,每一帧的毫秒数叫做帧长,相邻两帧左边界的距离叫帧移。从音频信号s[n]中提取一帧的过程可表示为y[n]=w[n]s[n],如果w[n]是矩形窗,则信号会在边界处切断,这些不连续会对傅里叶分析造成影响。因此在梅尔频率倒谱系数中,加窗一般使用边缘平滑降到0的汉明窗,表达式如下:
Figure BDA0002206920950000121
L为帧长。
可以理解的是,服务器将加窗处理后的音频进行离散傅里叶变换,得到目标复数的过程具体包括:服务器获取加窗后的音频信号x[n],...,[m],n和m为大于0的整数;服务器调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure BDA0002206920950000122
N为2的幂,k为整数,X[k]表示加窗后的音频信号中某一频率成分的幅度和相位。
服务器将目标复数对应到梅尔频谱上,得到对数能量的过程具体包括:
服务器通过预置的滤波器组将目标复数进行平滑处理;服务器将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;服务器通过第二预置公式将平滑处理后的复数对应到梅尔刻度上,得到目标刻度,第二预置公式为:
Figure BDA0002206920950000123
0<f≤1000;服务器根据第三预置公式计算目标刻度的对数能量,第三预置公式为:/>
Figure BDA0002206920950000124
m=1,2,...,M,22≤M≤26,Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。需要说明的是,一般人对声音声压的反应呈对数关系,人对高声压的细微变化敏感度不如低声压。此外,使用对数可以降低提取的特征对输入声音能量变化的敏感度,因为声音与麦克风之间的距离是变化的,因而麦克风采集到的声音能量也是变化的。人耳听觉对不同频带的敏感度是不同的,人耳对高频不如低频敏感,这一分界线大约是1000Hz,在提取声音特征时模拟人耳听觉这一性质可以提高识别性能。滤波器组是一组梅尔刻度的三角形滤波器组,1000Hz以下的10个滤波器线性相隔,1000Hz以上的剩余滤波器对数相隔。
服务器根据倒谱系数计算能量和差分,生成特征文件的过程具体包括:
具体的,某一帧的能量定义为某一帧样本点的平方和,对于一个加窗信号x,其从样本点t1到样本点t2的能量为:
Figure BDA0002206920950000131
以上提取的特征每一帧单独考虑,是静态的,而实际声音是连续的,帧与帧之间是有联系的,因而需要增加特征来表示这种帧间的动态变化,这通常通过计算每一帧13个特征(12个倒谱特征加上1个能量)的一阶差分甚至二阶差分来实现。一个简单计算差分的方法就是计算当前帧前后各一帧的13个特征的差值:
Figure BDA0002206920950000132
如果不考虑二阶差分,最终每一帧的梅尔频率倒谱系数特征为26维度:12维倒谱系数、12维倒谱系数差分、1维能量和1维能量差分。
204、判断特征文件是否有效。
服务器判断特征文件是否有效。具体的,服务器判断特征文件的格式是否符合预置质量要求;若特征文件的格式不符合预置质量要求,则服务器确定特征文件无效;若特征文件的格式符合预置质量要求,则服务器判断特征文件中是否存在多个用户的声音;若特征文件中不存在多个用户的声音,则服务器确定特征文件有效;若特征文件中存在多个用户的声音,则服务器确定特征文件无效。
205、若特征文件无效,则生成提取失败的状态码,状态码用于指示提取失败的原因。
若特征文件无效,则服务器生成提取失败的状态码,状态码用于指示提取失败的原因,即提取失败的状态码可以简单告知没有提取成功的原因,如语音质量不佳,多人说话等。不同的失败原因对应不同的状态码。例如,若特征文件的格式不符合预置质量要求,则服务器确定特征文件无效,生成提取失败的第一状态码;若特征文件中存在多个用户的声音,则服务器确定特征文件无效,生成提取失败的第二状态码,其中,第一状态码和第二状态码不同。
206、若特征文件有效,则根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
若特征文件有效,则服务器根据进线电话区段或IP信息确定目标用户所属的目标地址范围,调用预置的黑名单模型和目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。具体的,若特征文件有效,则服务器基于进线电话区段或IP信息确定目标用户所属的目标地址范围;服务器根据目标地址范围在预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;服务器通过目标黑名单模型对特征文件进行相似度评分,得到目标分值;若目标分值大于或等于第一阈值,则服务器确定目标用户在目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,第一提示消息用于指示目标用户被禁止接受正常服务;若目标分值小于第一阈值,则服务器确定目标用户不在目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,第二提示消息用于指示目标用户接受正常服务。
需要说明的是,不同的地址,对应不同的目标黑名单模型,对应的黑名单特征分库也不同。不在黑名单特征分库内,即表示为正常用户,接受正常服务,如果此次服务过程中不顺利,也可将该用户注册到黑名单特征分库中;如果在黑名单特征分库内,则视为黑名单用户,不予正常服务(如不予办理贷款等等)。
目标用户的总分数,对语音所提取的声纹特征(特征文件)与黑名单特征分库中的声纹特征进行比对,然后结合地址信息进行评分。这里的打分是计算声纹特征的相似度。通常会根据模型训练有一个阈值,当打分高于阈值时,即证明两个声纹特征接近,也就可以认为是比对到了。
可以理解的是,本发明主要可以应用到银行贷款业务,根据用户的信用等级决定是否将该用户纳入黑名单,同时,根据该用户的地区、年龄、性别将其声纹特征注册到黑名单特征分库。当一个用户的声纹特征被注册到黑名单特征分库后,日后,若此人有来电,可以根据其声纹特征判别出其属于黑名单,因此可以不予办理贷款业务。
本发明实施例,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
上面对本发明实施例中基于地址信息的黑名单识别方法进行了描述,下面对本发明实施例中基于地址信息的黑名单识别装置进行描述,请参阅图3,本发明实施例中基于地址信息的黑名单识别装置的一个实施例包括:
获取单元301,用于获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和互联网协议地址IP信息;
提取单元302,用于通过预置算法对所述音频进行特征提取,得到特征文件;
判断单元303,用于判断所述特征文件是否有效;
第一生成单元304,若所述特征文件无效,则用于生成提取失败的状态码,所述状态码用于指示提取失败的原因;
评分单元305,若所述特征文件有效,则用于根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
本发明实施例,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
请参阅图4,本发明实施例中基于地址信息的黑名单识别装置的另一个实施例包括:
获取单元301,用于获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和互联网协议地址IP信息;
提取单元302,用于通过预置算法对所述音频进行特征提取,得到特征文件;
判断单元303,用于判断所述特征文件是否有效;
第一生成单元304,若所述特征文件无效,则用于生成提取失败的状态码,所述状态码用于指示提取失败的原因;
评分单元305,若所述特征文件有效,则用于根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
可选的,评分单元305具体用于:
若所述特征文件有效,则基于所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围;根据所述目标地址范围在所述预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;通过所述目标黑名单模型对所述特征文件进行相似度评分,得到目标分值;若所述目标分值大于或等于第一阈值,则确定所述目标用户在所述目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,所述第一提示消息用于指示所述目标用户被禁止接受正常服务;若所述目标分值小于所述第一阈值,则确定所述目标用户不在所述目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,所述第二提示消息用于指示所述目标用户接受正常服务。
可选的,获取单元301具体用于:
接收目标用户的语音文件;对所述语音文件进行解析,得到所述目标用户的音频和地址标识;根据所述地址标识查询预置表格,得到与所述地址标识对应的地址信息,所述地址信息包括进线电话区段或/和IP信息。
可选的,提取单元302包括:
第一转换模块3021,用于将所述音频从模拟信号形式转换成数字信号形式;
预加重模块3022,用于对数字信号形式的音频进行预加重;
加窗模块3023,用于将预加重后的音频进行加窗处理;
变换模块3024,用于将加窗处理后的音频进行离散傅里叶变换,得到目标复数;
对应模块3025,用于将所述目标复数对应到梅尔频谱上,得到对数能量;
第二转换模块3026,用于将所述对数能量进行转换,得到倒谱系数;
计算模块3027,用于根据所述倒谱系数计算能量和差分,生成特征文件。
可选的,变换模块3024具体用于:
获取加窗后的音频信号x[n],...,[m],n和m为大于0的整数;调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure BDA0002206920950000171
N为2的幂,k为整数,X[k]表示所述加窗后的音频信号中某一频率成分的幅度和相位。
可选的,对应模块3025具体用于:
通过预置的滤波器组将所述目标复数进行平滑处理;将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;通过第二预置公式将所述平滑处理后的复数对应到梅尔刻度上,得到目标刻度,所述第二预置公式为:
Figure BDA0002206920950000172
0<f≤1000;根据第三预置公式计算所述目标刻度的对数能量,所述第三预置公式为:
Figure BDA0002206920950000173
m=1,2,...,M,22≤M≤26,Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。
可选的,基于地址信息的黑名单识别装置还包括:
第二生成单元306,用于生成预置的黑名单模型,所述预置的黑名单模型用于黑名单注册。
本发明实施例,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。
上面图3至图4从模块化功能实体的角度对本发明实施例中的基于地址信息的黑名单识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于地址信息的黑名单识别设备进行详细描述。
图5是本发明实施例提供的基于地址信息的黑名单识别设备的结构示意图,该基于地址信息的黑名单识别设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)501(例如,一个或一个以上处理器)和存储器509,一个或一个以上存储应用程序507或数据506的存储介质508(例如一个或一个以上海量存储设备)。其中,存储器509和存储介质508可以是短暂存储或持久存储。存储在存储介质508的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于地址信息的黑名单识别设备中的一系列指令操作。更进一步地,处理器501可以设置为与存储介质508通信,在基于地址信息的黑名单识别设备500上执行存储介质508中的一系列指令操作。
基于地址信息的黑名单识别设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统505,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5中示出的基于地址信息的黑名单识别设备结构并不构成对基于地址信息的黑名单识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。处理器501可以执行上述实施例中获取单元301、提取单元302、判断单元303、生成单元304、评分单元305和生成单元306的功能。
下面结合图5对基于地址信息的黑名单识别设备的各个构成部件进行具体的介绍:
处理器501是基于地址信息的黑名单识别设备的控制中心,可以按照设置的基于地址信息的黑名单识别方法进行处理。处理器501利用各种接口和线路连接整个基于地址信息的黑名单识别设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行基于地址信息的黑名单识别设备的各种功能,将黑名单特征库划分为维度更小的黑名单特征分库,根据地址信息对应的黑名单特征分库对声纹特征进行对比,提高了声纹识别效率。存储介质508和存储器509都是存储数据的载体,本发明实施例中,存储介质508可以是指储存容量较小,但速度快的内存储器,而存储器509可以是储存容量大,但储存速度慢的外存储器。
存储器509可用于存储软件程序以及模块,处理器501通过运行存储在存储器509的软件程序以及模块,从而执行基于地址信息的黑名单识别设备500的各种功能应用以及数据处理。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如通过预置算法对所述音频进行特征提取,得到特征文件)等;存储数据区可存储根据基于地址信息的黑名单识别设备的使用所创建的数据(比如提取失败的状态码)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在本发明实施例中提供的基于地址信息的黑名单识别方法程序和接收到的数据流存储在存储器中,当需要使用时,处理器501从存储器509中调用。
在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、双绞线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,光盘)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于地址信息的黑名单识别方法,其特征在于,包括:
获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和互联网协议地址IP信息;
通过预置算法对所述音频进行特征提取,得到特征文件;
判断所述特征文件是否有效;
若所述特征文件无效,则生成提取失败的状态码,所述状态码用于指示提取失败的原因;
若所述特征文件有效,则根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
2.根据权利要求1所述的基于地址信息的黑名单识别方法,其特征在于,所述若所述特征文件有效,则根据所述进线电话区段或所述互联网协议地址IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作,包括:
若所述特征文件有效,则基于所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围;
根据所述目标地址范围在所述预置的黑名单模型中确定对应的目标黑名单模型,每个预置的黑名单模型对应一个不同的黑名单特征分库;
通过所述目标黑名单模型对所述特征文件进行相似度评分,得到目标分值;
若所述目标分值大于或等于第一阈值,则确定所述目标用户在所述目标黑名单模型对应的黑名单特征分库中,并返回第一提示消息,所述第一提示消息用于指示所述目标用户被禁止接受正常服务;
若所述目标分值小于所述第一阈值,则确定所述目标用户不在所述目标黑名单模型对应的黑名单特征分库中,并返回第二提示消息,所述第二提示消息用于指示所述目标用户接受正常服务。
3.根据权利要求1所述的基于地址信息的黑名单识别方法,其特征在于,所述获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和IP信息包括:
接收目标用户的语音文件;
对所述语音文件进行解析,得到所述目标用户的音频和地址标识;
根据所述地址标识查询预置表格,得到与所述地址标识对应的地址信息,所述地址信息包括进线电话区段或/和IP信息。
4.根据权利要求1所述的基于地址信息的黑名单识别方法,其特征在于,所述通过预置算法对所述音频进行特征提取,得到特征文件包括:
将所述音频从模拟信号形式转换成数字信号形式;
对数字信号形式的音频进行预加重;
将预加重后的音频进行加窗处理;
将加窗处理后的音频进行离散傅里叶变换,得到目标复数;
将所述目标复数对应到梅尔频谱上,得到对数能量;
将所述对数能量进行转换,得到倒谱系数;
根据所述倒谱系数计算能量和差分,生成特征文件。
5.根据权利要求4所述的基于地址信息的黑名单识别方法,其特征在于,所述将加窗处理后的音频进行离散傅里叶变换,得到目标复数包括:
获取加窗后的音频信号x[n],...,x[m],其中,x[n]、x[m]为音频信号,n、m为信号序号,n和m为大于0的整数;
调用第一预置公式生成目标复数X[k],第一预置公式为:
Figure FDA0004228688610000021
N为2的幂,k为整数,j为虚数,实部为0的复数,在物理中常记作j,X[k]表示所述加窗后的音频信号中某一频率成分的幅度和相位。
6.根据权利要求5所述的基于地址信息的黑名单识别方法,其特征在于,所述将所述目标复数对应到梅尔频谱上,得到对数能量包括:
通过预置的滤波器组将所述目标复数进行平滑处理;
将平滑处理后的复数与梅尔频谱上的梅尔刻度进行对应,一个梅尔刻度表示一个高音单位;
通过第二预置公式将所述平滑处理后的复数对应到梅尔刻度上,得到目标刻度mel(f),所述第二预置公式为:
Figure FDA0004228688610000031
根据第三预置公式计算所述目标刻度的对数能量s(m),所述第三预置公式为:
Figure FDA0004228688610000032
Hm(k)为滤波器组的频率响应,M表示预置的滤波器组中滤波器个数。
7.根据权利要求1-6中任一所述的基于地址信息的黑名单识别方法,其特征在于,所述获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和IP信息之前,所述方法还包括:
生成预置的黑名单模型,所述预置的黑名单模型用于黑名单注册。
8.一种基于地址信息的黑名单识别装置,其特征在于,包括:
获取单元,用于获取目标用户的语音文件,所述语音文件包括音频和地址信息,所述地址信息包括进线电话区段或/和互联网协议地址IP信息;
提取单元,用于通过预置算法对所述音频进行特征提取,得到特征文件;
判断单元,用于判断所述特征文件是否有效;
第一生成单元,若所述特征文件无效,则用于生成提取失败的状态码,所述状态码用于指示提取失败的原因;
评分单元,若所述特征文件有效,则用于根据所述进线电话区段或所述IP信息确定所述目标用户所属的目标地址范围,调用预置的黑名单模型和所述目标地址范围对特征文件进行相似度评分,并根据评分结果进行相应操作。
9.一种基于地址信息的黑名单识别设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一项所述的基于地址信息的黑名单识别方法。
10.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-7中任意一项所述的基于地址信息的黑名单识别方法。
CN201910884630.2A 2019-09-19 2019-09-19 基于地址信息的黑名单识别方法、装置、设备及存储介质 Active CN110767238B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910884630.2A CN110767238B (zh) 2019-09-19 2019-09-19 基于地址信息的黑名单识别方法、装置、设备及存储介质
PCT/CN2019/117117 WO2021051533A1 (zh) 2019-09-19 2019-11-11 基于地址信息的黑名单识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910884630.2A CN110767238B (zh) 2019-09-19 2019-09-19 基于地址信息的黑名单识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110767238A CN110767238A (zh) 2020-02-07
CN110767238B true CN110767238B (zh) 2023-07-04

Family

ID=69329776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910884630.2A Active CN110767238B (zh) 2019-09-19 2019-09-19 基于地址信息的黑名单识别方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN110767238B (zh)
WO (1) WO2021051533A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741457B (zh) * 2020-07-16 2023-06-09 Oppo广东移动通信有限公司 一种蓝牙通讯方法、装置及计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262524A (zh) * 2008-04-23 2008-09-10 沈阳东软软件股份有限公司 垃圾语音过滤的方法及系统
CN103338211A (zh) * 2013-07-19 2013-10-02 腾讯科技(深圳)有限公司 一种恶意url鉴定方法及装置
CN105872185A (zh) * 2016-04-20 2016-08-17 乐视控股(北京)有限公司 信息提示方法、装置及系统
CN106372572B (zh) * 2016-08-19 2019-11-12 北京旷视科技有限公司 监控方法和装置
CN107105108A (zh) * 2017-04-21 2017-08-29 天维尔信息科技股份有限公司 一种防报警骚扰电话的处理方法及其系统
CN109995732A (zh) * 2017-12-30 2019-07-09 中国移动通信集团安徽有限公司 网站安全访问监控方法、装置、设备及介质
CN109858917A (zh) * 2019-02-13 2019-06-07 苏州意能通信息技术有限公司 一种基于人工智能的反欺诈系统及其方法

Also Published As

Publication number Publication date
CN110767238A (zh) 2020-02-07
WO2021051533A1 (zh) 2021-03-25

Similar Documents

Publication Publication Date Title
CN108900725B (zh) 一种声纹识别方法、装置、终端设备及存储介质
WO2021139425A1 (zh) 语音端点检测方法、装置、设备及存储介质
JP4177755B2 (ja) 発話特徴抽出システム
KR100636317B1 (ko) 분산 음성 인식 시스템 및 그 방법
CN109147796B (zh) 语音识别方法、装置、计算机设备及计算机可读存储介质
CN109215665A (zh) 一种基于3d卷积神经网络的声纹识别方法
US20080215322A1 (en) Method and System for Generating Training Data for an Automatic Speech Recogniser
Leu et al. An MFCC-based speaker identification system
Thakur et al. Speech recognition using euclidean distance
CN110767239A (zh) 一种基于深度学习的声纹识别方法、装置及设备
CN113223536B (zh) 声纹识别方法、装置及终端设备
CN112382300A (zh) 声纹鉴定方法、模型训练方法、装置、设备及存储介质
CN110738980A (zh) 歌声合成模型的训练方法、系统及歌声合成方法
CN113327626A (zh) 语音降噪方法、装置、设备及存储介质
CN115602165B (zh) 基于金融系统的数字员工智能系统
Siam et al. A novel speech enhancement method using Fourier series decomposition and spectral subtraction for robust speaker identification
CN110767238B (zh) 基于地址信息的黑名单识别方法、装置、设备及存储介质
CN113744715A (zh) 声码器语音合成方法、装置、计算机设备及存储介质
Nirjon et al. sMFCC: exploiting sparseness in speech for fast acoustic feature extraction on mobile devices--a feasibility study
CN107993666B (zh) 语音识别方法、装置、计算机设备及可读存储介质
WO2021217979A1 (zh) 声纹识别方法、装置、设备及存储介质
Alkhatib et al. Voice identification using MFCC and vector quantization
Abushariah et al. Voice based automatic person identification system using vector quantization
Upadhyay et al. Robust recognition of English speech in noisy environments using frequency warped signal processing
Zhipeng et al. Voiceprint recognition based on BP Neural Network and CNN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant