CN110602332A - 通信线路特征提取方法、通信线路识别方法及装置 - Google Patents

通信线路特征提取方法、通信线路识别方法及装置 Download PDF

Info

Publication number
CN110602332A
CN110602332A CN201910708779.5A CN201910708779A CN110602332A CN 110602332 A CN110602332 A CN 110602332A CN 201910708779 A CN201910708779 A CN 201910708779A CN 110602332 A CN110602332 A CN 110602332A
Authority
CN
China
Prior art keywords
communication line
noise
feature
audio
call audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910708779.5A
Other languages
English (en)
Other versions
CN110602332B (zh
Inventor
林格平
戚梦苑
沈亮
李娅强
刘发强
孙旭东
孙晓晨
宁珊
莫晓颜
王玉龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
National Computer Network and Information Security Management Center
Original Assignee
Beijing University of Posts and Telecommunications
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications, National Computer Network and Information Security Management Center filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910708779.5A priority Critical patent/CN110602332B/zh
Publication of CN110602332A publication Critical patent/CN110602332A/zh
Application granted granted Critical
Publication of CN110602332B publication Critical patent/CN110602332B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/229Wire identification arrangements; Number assignment determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。

Description

通信线路特征提取方法、通信线路识别方法及装置
技术领域
本发明涉及通信技术领域,特别是指一种通信线路特征提取方法、通信线路识别方法及装置。
背景技术
通信是人类生活中最重要的元素之一,打电话、视频聊天、微信语音等都是通信的一种模式。通信线路指的是在通信过程中,将电磁波信号从一个地点传送到另一个地点的传输媒介。通信往往依赖于通信线路作为媒介,而不同的通信线路会有不同的特征,这些特征是区分通信线路的关键。
通信线路的区分,将为运营商、来源地等的区分提供辅助帮助。然而,现有技术通过通信线路中的信令对通信线路进行识别,而信令的完整获取非常困难,且一条信令只包括一段出入节点的信息,导致无法准确且高效的识别通信线路对应的运营商、来源地等,进而导致无法对电话通信的可靠性进行快速判断。
发明内容
有鉴于此,本发明的目的在于提出一种通信线路特征提取方法、通信线路识别方法及装置,能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
基于上述目的本发明提供的通信线路特征提取方法,包括:
获取主叫端与被叫端之间的通话音频;
对所述通话音频进行处理,以去除所述通话音频中的人声音频;
分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
进一步地,所述对所述通话音频进行处理,以去除所述通话音频中的人声音频,具体包括:
将所述通话音频中能量大于预设阈值的音频识别为人声音频,并将所述人声音频的能量设置为0,以去除所述通话音频中的人声音频。
进一步地,所述分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,具体包括:
对处理后的通话音频进行傅里叶变换,得到频谱图;
采用差分方法从所述频谱图中提取第一噪声特征;
采用频率划分方法从所述频谱图中提取第二噪声特征;
采用自编码网络方法从所述频谱图中提取第三噪声特征。
进一步地,所述采用差分方法从所述频谱图中提取第一噪声特征,具体包括:
设置差分参数,以分别对所述频谱图进行一阶差分计算和二阶差分计算,对应得到一阶差分特征和二阶差分特征;
将所述频谱图、所述一阶差分特征和所述二阶差分特征构成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第一卷积神经网络,获得第一噪声特征。
进一步地,所述采用频率划分方法从所述频谱图中提取第二噪声特征,具体包括:
将所述频谱图等分为多个频谱子图;
将所述多个频谱子图组合成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第二卷积神经网络,获得第二噪声特征。
进一步地,所述采用自编码网络方法从所述频谱图中提取第三噪声特征,具体包括:
采用训练好的深度降噪自编码器对所述频谱图进行降维处理,获得第三噪声特征。
本发明实施例还提供了一种通信线路识别方法,包括:
获取主叫端与被叫端之间的通话音频;
对所述通话音频进行处理,以去除所述通话音频中的人声音频;
分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征;
采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,所述通信线路信息包括所述主叫端的所在地和所使用的运营商。
进一步地,所述模型融合方法包括平均法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果及相应的概率;
计算每个信息分类结果的平均概率,并将平均概率最大的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
进一步地,所述模型融合方法包括投票法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果;
将获取最多的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
相应地,本发明实施例还提供了一种通信线路特征提取装置,能够实现上述通信线路特征提取方法,所述装置包括:
通话音频获取模块,用于获取主叫端与被叫端之间的通话音频;
通话音频处理模块,用于对所述通话音频进行处理,以去除所述通话音频中的人声音频;以及,
特征提取模块,用于分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
从上面所述可以看出,本发明提供的通信线路特征提取方法、通信线路识别方法及装置,能够获取主叫端与被叫端之间的通话音频,并去除通话音频中的人声音频后,分别采用差分方法、频率划分方法和自编码网络方法从通话音频中提取噪声特征,作为主叫端和被叫端之间的通信线路特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。
附图说明
图1为本发明实施例提供的通信线路特征提取方法的流程示意图;
图2为本发明实施例提供的通信线路特征提取方法中的深度降噪自编码器的网络结构示意图;
图3为本发明实施例提供的通信线路识别方法的流程示意图;
图4为本发明实施例提供的通信线路特征提取装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
参见图1,是本发明实施例提供的通信线路特征提取方法的流程示意图,所述方法包括:
S1、获取主叫端与被叫端之间的通话音频。
本实施例中,在主叫端与被叫端建立连接后,截取主叫用户与被叫用户通话开始预设时间段内的通话音频。通话音频一般是PCM数字信号,通过编解码可以将数字信号转换为音频信号。
S2、对所述通话音频进行处理,以去除所述通话音频中的人声音频。
具体地,步骤S2包括:
将所述通话音频中能量大于预设阈值的音频识别为人声音频,并将所述人声音频的能量设置为0,以去除所述通话音频中的人声音频。
需要说明的是,电话通信以通信线路作媒介,而存在通信线路就不可避免的要引入通信线路噪声。通信线路噪声虽然会对通信过程造成干扰,但是其能影响通话音频并记录在每一个通信节点上,这在一定程度上能对通话音频通过的线路进行标识。提取通信线路噪声能够为判断主叫端的所在地和运营商提供佐证。然而,通信线路噪声的提取是困难的,通话音频包含的主要信息是人声,未经处理的通信线路噪声很容易被说话者的个人特征所影响,导致提取到的特征包含了大量说话者的个人的特点,如音调、音色、音量等。因此,在获取通话音频后需先对通话音频中的人声进行去除。
本实施例中,根据音频的信号波形表示的能量范围,可以界定人声与噪声的能量划分阈值。例如,通过人工观察部分通话音频,大致确认在数据采集点的能量大小,并界定人声的能量阈值。通常人声能量大于噪声能量,在一定程度上设置能量阈值可以去除通话音频中的大部分人声。在设置阈值后,能量高于阈值的音频即为人声音频,将这部分人声音频的能量设置为0,即可去除这部分的人声音频。通常情况下,还有部分能量低于阈值的音频也为人声音频,但这部分人声音频不会对后续特征提取的结果有太大影响,因此与噪声音频共同保留。
S3、分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
具体地,步骤S3包括:
对处理后的通话音频进行傅里叶变换,得到频谱图;
采用差分方法从所述频谱图中提取第一噪声特征;
采用频率划分方法从所述频谱图中提取第二噪声特征;
采用自编码网络方法从所述频谱图中提取第三噪声特征。
本实施例中,可采用任意一种频谱生成方法,例如梅尔频谱法、等距带频谱法、巴克带频谱法等,对处理后的通话音频进行傅里叶变换,将一维音频信号转换为二维时频信号,得到频谱图。其中,频谱图的表达形式由频谱生成方法来确定,例如梅尔频谱图会放大0-2048HZ频率范围内的信息,缩小大于2048HZ频率范围的信息。
进一步地,所述采用差分方法从所述频谱图中提取第一噪声特征,具体包括:
设置差分参数,以分别对所述频谱图进行一阶差分计算和二阶差分计算,对应得到一阶差分特征和二阶差分特征;
将所述频谱图、所述一阶差分特征和所述二阶差分特征构成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第一卷积神经网络,获得第一噪声特征。
需要说明的是,差分参数包括频率带划分方式的选择以及计算差分特征的信号帧数。其中,频率带划分方式包括梅尔频谱法、巴克带频谱法、等距带频谱法。梅尔频谱法的等长频率带划分范围是[0.0,512.0,1024.0,2048.0,4096.0,8192.0],巴克带频谱法的等长频率带划分范围是[0.0,50.0,100.0,150.0,200.0,300.0,400.0,510.0,630.0,770.0,920.0,1080.0,1270.0,1480.0,1720.0,2000.0,2320.0,2700.0,3150.0,3700.0,4400.0,5300.0,6400.0,7700.0,9500.0,12000.0,15500.0,20500.0,27000.0],等距带频谱法的等长频率带划分范围按照自定义步长设定。计算差分特征的信号帧数是一个超参,差分的计算运用在频谱图的频率维度,是对数据的求导估计。其中,一阶差分对应一阶导数,即一阶差分特征,二阶差分对应二阶导数,即二阶差分特征。差分可以计算出不同频率的能量之间的变化关系,可以反映频域变化的信息。
频谱图及其差分特征一共构成了三个二维特征向量,三个二维特征向量叠加构成三通道图像特征。由于噪声特征并非是与时间先后顺序强相关的特征,在噪声特性的应用中更多的是分类问题而非时序预测问题。这使得卷积神经网络对特征的训练具有合理性,卷积核的平移不变性可以学习到频谱图像中分布在不同时间区域、不同频率区域的噪声共性特征。
利用两层卷积神经网络,第一层卷积输入的通道数为频谱图及其差分特征的通道数量3,输出的通道数为64,并用池化对图像下采样。第二层卷积输入的通道数为上层输出的64个,输出的通道数为128,并用池化对图像下采样。最后输出的图像特征铺展成一维向量,作为一层全连接网络的输入,最后得到的结果是经过第一卷积神经网络训练的第一噪声特征。
进一步地,所述采用频率划分方法从所述频谱图中提取第二噪声特征,具体包括:
将所述频谱图等分为多个频谱子图;
将所述多个频谱子图组合成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第二卷积神经网络,获得第二噪声特征。
需要说明的是,按不同频率区间等长地将频谱图切分成多个频谱子图。例如,频谱图频率维度的像素范围是8000,以200个像素作为频谱图划分单位,则频谱图可切割成40个频谱子图。
由于不同频率中能量的大小不同,且噪声特征与频率维度强相关,在没有进行差分计算的情况下,需要切割频谱图再利用卷积核进行特征计算。卷积核的平移不变性不能直接应用在与频率维度强相关的频谱图中。
利用两层卷积神经网络,第一层卷积输入的通道数为频谱子图数量为大概为几十到上千,输出的通道数为1024,并用池化对图像下采样。第二层卷积输入的通道数为上层输出的1024个,输出的通道数为2048,并用池化对图像下采样。最后输出的图像特征铺展成一维向量,作为一层全连接网络的输入,最后得到的结果是经过第二卷积神经网络训练的第二噪声特征。
进一步地,所述采用自编码网络方法从所述频谱图中提取第三噪声特征,具体包括:
采用训练好的深度降噪自编码器对所述频谱图进行降维处理,获得第三噪声特征。
需要说明的是,利用自编码网络通过编码和解码网络以无监督学习的方式训练信息量庞大的频谱图。采用深度自编码器与降噪自编码器两种基本的网络结构组合的深度降噪自编码器,深度自编码器是由卷积神经网络、全连接网络等基本结构多层连接构成,编码部分与解码部分对称的自编码网络。降噪自编码器是由网络结构中某些层加入随机高斯噪声,以提高模型泛化能力的自编码网络。深度自编码器与降噪自编码器的组合即深度降噪自编码器,用以训练频谱图并提取编码部分最后一个隐藏层作为输出。
图2为本发明实施例提供的深度降噪自编码器的网络结构示意图。深度降噪编码网络包括网络层1、网络层2、网络层3等,深度降噪解码网络与深度降噪编码网络结构对称,也包括网络层1、网络层2、网络层3等。深度降噪编码网络与深度降噪解码网络之间设有输出隐藏层,深度降噪编码网络的网络层2和深度降噪解码网络的网络层2中添加高斯噪声,从而构成深度降噪自编码器。
频谱图是高维特征,包含了大量的冗余信息,这些信息不具备区分能力。通过自编码网络训练大量的噪声信号,可以捕捉其中的关键信息,并实现对频谱图的降维,得到第三噪声特征。
进一步地,在步骤S1之前,还包括:
收集电话音频样本;
对所述电话音频样本进行处理,去除所述电话音频样本中的人声音频;
根据处理后的电话音频样本训练第一神经网络;
根据处理后的电话音频样本训练第二神经网络;
根据处理后的电话音频样本训练自编码网络。
需要说明的是,为了控制变量,防止不同的数据采集点信号强度不同,需要在同一个运营商电话局点统一收集电话音频样本。在收集电话音频样本后,根据预设阈值对电话音频样本进行批处理,将能量高于预设阈值的音频的能量设为0,并保持音频的时长不变。
进而,将电话音频样本转换为频谱图。采用差分方法获取频谱图的差分特征,并构成多通道的图像特征,用于第一卷积神经网络的训练,训练的第一卷积神经网络用于具体的分类问题中,例如通话的主叫端的所在地以及所使用的运营商。另外,采用频率划分方法将频谱图切分为多个频谱子图,构成多通道的图像特征,用于第二卷积神经网络的训练,训练的第二卷积神经网络用于具体的分类问题,例如通话的主叫端的所在地以及所使用的运营商。另外,利用频谱图对自编码网络进行训练,使训练后的自编码网络对频谱图进行降维处理,而降维后的噪声特征可以应用于支持向量机、逻辑回归、随机森林、Boosting提升树等机器学习模型。而机器学习算法的复杂度低于神经网络,可以在海量数据的训练中节省时间和空间资源的开销。
本发明提供的通信线路特征提取方法,能够获取主叫端与被叫端之间的通话音频,并去除通话音频中的人声音频后,分别采用差分方法、频率划分方法和自编码网络方法从通话音频中提取噪声特征,作为主叫端和被叫端之间的通信线路特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。
参见图3,是本发明实施例提供的通信线路识别方法的流程示意图,该方法包括:
S301、获取主叫端与被叫端之间的通话音频。
S302、对所述通话音频进行处理,以去除所述通话音频中的人声音频。
S303、分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
需要说明的是,本实施例采用上述实施例提供的通信线路特征提取方法来提取通信线路特征,在此不再详细赘述。
S304、采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,所述通信线路信息包括所述主叫端的所在地和所使用的运营商。
本实施例中,采用多模型融合的策略强化系统特征分析的能力,便于提高在分类问题中的精确度。先分别对第一卷积神经网络输出的第一噪声特征、第二卷积神经网络输出的第二噪声特征和深度降噪自编码器输出的第三噪声特征进行信息分类,再将三个分类结果综合得出最终结果。
在一个实施方式中,所述模型融合方法包括平均法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果及相应的概率;
计算每个信息分类结果的平均概率,并将平均概率最大的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
需要说明的是,第一噪声特征、第二噪声特征和第三噪声特征对应的分类以概率分布的方式呈现结果,每个噪声特征的信息分类结果为概率最大值对应的类别,平均法综合了各个噪声特征对应的概率值,即对各个噪声特征对应的概率值求平均,平均概率最大的信息分类结果即为通信线路信息。采用平均法能够得到更准确的信息分类结果,进而识别出更准确的通信线路信息。
在另一个实施方式中,所述模型融合方法包括投票法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果;
将获取最多的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
需要说明的是,投票法是对每个噪声特征对应的信息分类结果进行投票,投票遵守少数服从多数的原则,在三个模型的应用场景下主要针对二分类问题,以两个模型输出的噪声特征对应的分类结果作为最终结果。模型融合方法的选择主要由实际应用来决定,可通过验证集来评估平均法和投票法的优劣。
本发明提供的通信线路识别方法,能够获取主叫端与被叫端之间的通话音频,并去除通话音频中的人声音频后,分别采用差分方法、频率划分方法和自编码网络方法从通话音频中提取噪声特征,作为主叫端和被叫端之间的通信线路特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。
相应地,本发明还提供一种通信线路特征提取装置,能够实现上述通信线路特征提取方法的所有流程。
参见图4,是本发明实施例提供的通信线路特征提取装置的结构示意图,该装置包括:
通话音频获取模块41,用于获取主叫端与被叫端之间的通话音频;
通话音频处理模块42,用于对所述通话音频进行处理,以去除所述通话音频中的人声音频;以及,
特征提取模块43,用于分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
本发明提供的通信线路识别装置,能够获取主叫端与被叫端之间的通话音频,并去除通话音频中的人声音频后,分别采用差分方法、频率划分方法和自编码网络方法从通话音频中提取噪声特征,作为主叫端和被叫端之间的通信线路特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种通信线路特征提取方法,其特征在于,包括:
获取主叫端与被叫端之间的通话音频;
对所述通话音频进行处理,以去除所述通话音频中的人声音频;
分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
2.根据权利要求1所述的通信线路特征提取方法,其特征在于,所述对所述通话音频进行处理,以去除所述通话音频中的人声音频,具体包括:
将所述通话音频中能量大于预设阈值的音频识别为人声音频,并将所述人声音频的能量设置为0,以去除所述通话音频中的人声音频。
3.根据权利要求1所述的通信线路特征提取方法,其特征在于,所述分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,具体包括:
对处理后的通话音频进行傅里叶变换,得到频谱图;
采用差分方法从所述频谱图中提取第一噪声特征;
采用频率划分方法从所述频谱图中提取第二噪声特征;
采用自编码网络方法从所述频谱图中提取第三噪声特征。
4.根据权利要求3所述的通信线路特征提取方法,其特征在于,所述采用差分方法从所述频谱图中提取第一噪声特征,具体包括:
设置差分参数,以分别对所述频谱图进行一阶差分计算和二阶差分计算,对应得到一阶差分特征和二阶差分特征;
将所述频谱图、所述一阶差分特征和所述二阶差分特征构成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第一卷积神经网络,获得第一噪声特征。
5.根据权利要求3所述的通信线路特征提取方法,其特征在于,所述采用频率划分方法从所述频谱图中提取第二噪声特征,具体包括:
将所述频谱图等分为多个频谱子图;
将所述多个频谱子图组合成多通道的图像特征;
将所述多通道的图像特征输入至训练好的第二卷积神经网络,获得第二噪声特征。
6.根据权利要求3所述的通信线路特征提取方法,其特征在于,所述采用自编码网络方法从所述频谱图中提取第三噪声特征,具体包括:
采用训练好的深度降噪自编码器对所述频谱图进行降维处理,获得第三噪声特征。
7.一种通信线路识别方法,其特征在于,包括:
获取主叫端与被叫端之间的通话音频;
对所述通话音频进行处理,以去除所述通话音频中的人声音频;
分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征;
采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,所述通信线路信息包括所述主叫端的所在地和所使用的运营商。
8.根据权利要求7所述的通信线路识别方法,其特征在于,所述模型融合方法包括平均法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果及相应的概率;
计算每个信息分类结果的平均概率,并将平均概率最大的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
9.根据权利要求7所述的通信线路识别方法,其特征在于,所述模型融合方法包括投票法;
所述采用模型融合方法对所述通信线路特征进行识别,获得所述主叫端与所述被叫端之间的通信线路信息,具体包括:
分别获取所述第一噪声特征、所述第二噪声特征和所述第三噪声特征对应的信息分类结果;
将获取最多的信息分类结果识别为所述主叫端与所述被叫端之间的通信线路信息。
10.一种通信线路特征提取装置,能够实现如权利要求1至6任一项所述的通信线路特征提取方法,其特征在于,所述装置包括:
通话音频获取模块,用于获取主叫端与被叫端之间的通话音频;
通话音频处理模块,用于对所述通话音频进行处理,以去除所述通话音频中的人声音频;以及,
特征提取模块,用于分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征。
CN201910708779.5A 2019-08-01 2019-08-01 通信线路特征提取方法、通信线路识别方法及装置 Expired - Fee Related CN110602332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910708779.5A CN110602332B (zh) 2019-08-01 2019-08-01 通信线路特征提取方法、通信线路识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910708779.5A CN110602332B (zh) 2019-08-01 2019-08-01 通信线路特征提取方法、通信线路识别方法及装置

Publications (2)

Publication Number Publication Date
CN110602332A true CN110602332A (zh) 2019-12-20
CN110602332B CN110602332B (zh) 2021-06-15

Family

ID=68853360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910708779.5A Expired - Fee Related CN110602332B (zh) 2019-08-01 2019-08-01 通信线路特征提取方法、通信线路识别方法及装置

Country Status (1)

Country Link
CN (1) CN110602332B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101534352A (zh) * 2008-03-10 2009-09-16 华为技术有限公司 一种线路状态检测方法、装置和预测式外呼系统
CN101662543A (zh) * 2008-08-29 2010-03-03 中兴通讯股份有限公司 一种语音业务可用性评估方法及系统
CN103607669A (zh) * 2013-10-12 2014-02-26 公安部第三研究所 一种楼宇对讲系统音频传输特性检测方法及检测系统
CN104322043A (zh) * 2012-04-13 2015-01-28 适应性频谱和信号校正股份有限公司 基于线路数据分布分析的双绞电话线路诊断方法
US20170099538A1 (en) * 2014-04-08 2017-04-06 Doppler Labs, Inc. Active acoustic filter with automatic selection of filter parameters based on ambient sound
CN106973171A (zh) * 2017-03-28 2017-07-21 上海联彤网络通讯技术有限公司 用于多模通讯设备的建立最优通讯线路的系统及方法
US20170272869A1 (en) * 2016-03-21 2017-09-21 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101534352A (zh) * 2008-03-10 2009-09-16 华为技术有限公司 一种线路状态检测方法、装置和预测式外呼系统
CN101662543A (zh) * 2008-08-29 2010-03-03 中兴通讯股份有限公司 一种语音业务可用性评估方法及系统
CN104322043A (zh) * 2012-04-13 2015-01-28 适应性频谱和信号校正股份有限公司 基于线路数据分布分析的双绞电话线路诊断方法
CN103607669A (zh) * 2013-10-12 2014-02-26 公安部第三研究所 一种楼宇对讲系统音频传输特性检测方法及检测系统
US20170099538A1 (en) * 2014-04-08 2017-04-06 Doppler Labs, Inc. Active acoustic filter with automatic selection of filter parameters based on ambient sound
US20170272869A1 (en) * 2016-03-21 2017-09-21 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding
CN106973171A (zh) * 2017-03-28 2017-07-21 上海联彤网络通讯技术有限公司 用于多模通讯设备的建立最优通讯线路的系统及方法

Also Published As

Publication number Publication date
CN110602332B (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
JP6535706B2 (ja) データセットの3値ビットマップを作成するための方法
CN109326299B (zh) 基于全卷积神经网络的语音增强方法、装置及存储介质
CN111312286A (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN111312292A (zh) 基于语音的情绪识别方法、装置、电子设备及存储介质
CN113870892A (zh) 基于语音识别的会议记录方法、装置、设备及存储介质
CN111798875A (zh) 一种基于三值量化压缩的vad实现方法
CN110765868A (zh) 唇读模型的生成方法、装置、设备及存储介质
CN115884032B (zh) 一种后馈式耳机的智慧通话降噪方法及系统
CN110602332B (zh) 通信线路特征提取方法、通信线路识别方法及装置
CN111009262A (zh) 语音性别识别的方法及系统
CN115831138A (zh) 一种音频信息处理方法、装置和电子设备
CN111444381B (zh) 一种基于深度学习语料库分类方法和存储设备
CN113327616A (zh) 声纹识别方法、装置、电子设备及存储介质
CN109065066B (zh) 一种通话控制方法、装置及设备
CN110782901A (zh) 一种识别网络电话语音的方法、存储介质及装置
CN117238311B (zh) 一种多声源及噪声环境中的语音分离增强方法及系统
CN112634942B (zh) 一种手机录音原始性的鉴定方法、存储介质及设备
CN114093380B (zh) 一种语音增强方法、电子设备、芯片系统及可读存储介质
CN115376501B (zh) 语音增强方法及装置、存储介质、电子设备
CN113178196B (zh) 音频数据提取方法、装置、计算机设备和存储介质
CN117351988B (zh) 一种基于数据分析的远程音频信息处理方法及系统
CN114420109B (zh) 语音性别联合识别方法、装置、电子设备及存储介质
CN116189055A (zh) 视频识别模型训练方法、视频识别方法、设备和存储介质
CN116825124A (zh) 音频特征提取方法及装置
CN114512141A (zh) 音频分离的方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210615