CN105760403A - 一种筛选电话号码的方法及装置 - Google Patents

一种筛选电话号码的方法及装置 Download PDF

Info

Publication number
CN105760403A
CN105760403A CN201410804405.0A CN201410804405A CN105760403A CN 105760403 A CN105760403 A CN 105760403A CN 201410804405 A CN201410804405 A CN 201410804405A CN 105760403 A CN105760403 A CN 105760403A
Authority
CN
China
Prior art keywords
recording
sample
correlation coefficient
telephone number
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410804405.0A
Other languages
English (en)
Inventor
史川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navinfo Co Ltd
Original Assignee
Navinfo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navinfo Co Ltd filed Critical Navinfo Co Ltd
Priority to CN201410804405.0A priority Critical patent/CN105760403A/zh
Publication of CN105760403A publication Critical patent/CN105760403A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

本发明提供了一种筛选电话号码的方法及装置,该方法包括:获取并存储待筛选电话号码被呼叫时的第一录音,且第一录音的时长为一预设时间段;获取并存储对第一录音进行预处理后的第二录音,预处理包括采样、归一化以及降噪;分别计算第二录音与预先存储的各样本录音的相关系数,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的待筛选电话号码为空号或停机号码,本发明的方法能快速、有效的筛选出空号和已停机的号码。

Description

一种筛选电话号码的方法及装置
技术领域
本发明涉及通信技术领域,特别涉及一种筛选电话号码的方法及装置。
背景技术
随着通信技术的发展,人们经常通过电话等方式提前查询或预定商家(例如酒吧、电影院、银行等)的业务,但是,有时候拨打的电话号码是空号或者是已停机,这样很不方便。因此,最好是商家提前将自己数据库中的空号和已停机的号码筛选出来,并公布最新的号码。而目前现有技术中,一般通过AT指令分析串口信号来判断电话号码的状况,或者是通过访问中国的通信数据库,直接查看电话号码状态,但是前者由于串口信号不稳定,导致返回值不准确;后者由于管控严格,一般人不可能有访问权限而受到限制。
发明内容
本发明的目的在于提供了一种筛选电话号码的方法及装置,能快速、有效的筛选出空号和已停机的号码。
为了达到上述目的,本发明的实施例提供了一种筛选电话号码的方法,该方法包括:
获取并存储待筛选电话号码被呼叫时的第一录音,且第一录音的时长为一预设时间段;
获取并存储对第一录音进行预处理后的第二录音,预处理包括采样、归一化以及降噪;
分别计算第二录音与预先存储的各样本录音的相关系数,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的待筛选电话号码为空号或停机号码。
其中,分别计算第二录音与预先存储的各样本录音的相关系数的步骤之前,方法还包括:
检测第二录音的能量值是否大于预设值;
若第二录音的能量值大于预设值,则执行分别计算第二录音与预先存储的各样本录音的相关系数的步骤;否则结束流程。
其中,获取并存储对第一录音进行预处理后的第二录音的步骤包括:
对第一录音进行采样;
对采样后的第一录音进行归一化处理;
对归一化后的第一录音进行降噪处理,得到第二录音。
其中,第二录音的序列长度小于各样本录音的序列长度,分别计算第二录音与预先存储的各样本录音的相关系数的步骤包括:
针对每一个样本录音,分别执行以下处理:
将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;
在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;
选择出多次移位后计算得到的相关值中的最大者,作为第二录音与该样本录音的相关系数。
其中,若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的待筛选电话号码为空号或停机号码的步骤之前,方法还包括:
比较计算得到的各个相关系数,并从中选出最大的相关系数。
本发明的实施例还提供了一种筛选电话号码的装置,该装置包括:
第一获取模块,用于获取并存储待筛选电话号码被呼叫时的第一录音,且第一录音的时长为一预设时间段;
第二获取模块,用于获取并存储对第一录音进行预处理后的第二录音,预处理包括采样、归一化以及降噪;
计算模块,用于分别计算第二录音与预先存储的各样本录音的相关系数,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
确定模块,用于若计算得到的相关系数的最大值在一预设门限以上时,确定该第二录音对应的待筛选电话号码为空号或停机号码。
其中,装置还包括:
检测模块,用于检测第二录音的能量值是否大于预设值,并在第二录音的能量值大于预设值时,触发计算模块执行分别计算第二录音与预先存储的各样本录音的相关系数的操作。
其中,第二获取模块包括:
第一单元,用于对第一录音进行采样;
第二单元,用于对采样后的第一录音进行归一化处理;
第三单元,用于对归一化后的第一录音进行降噪处理,得到第二录音。
其中,第二录音的序列长度小于各样本录音的序列长度,计算模块包括:
第四单元,用于针对每一个样本录音,分别执行以下处理:
将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;
在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;
选择出多次移位后计算得到的相关值中的最大者,作为第二录音与该样本录音的相关系数。
其中,装置还包括:
比较模块,用于比较计算得到的各个相关系数,并从中选出最大的相关系数。
本发明的上述方案至少包括以下有益效果:
在本发明的实施例的筛选电话号码的方法中,通过获取待筛选电话号码被呼叫时的第一录音,并对第一录音进行预处理得到第二录音,再计算第二录音与预先得到的各样本录音的相关系数,若各相关系数的最大值在一预设门限以上时,则认为该待筛选电话号码为空号或已停机号码,从而快速、有效的筛选出空号和已停机的号码。
附图说明
图1为本发明实施例中筛选电话号码的方法的步骤流程图;
图2为本发明实施例中图1中步骤12的具体步骤流程图;
图3为本发明实施例中降噪处理前的第一语音的波形图;
图4为本发明实施例中降噪处理后的第二语音的波形图;
图5为本发明实施例中筛选电话号码的装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有中筛选空号和已停机号码不方便的问题,提供了一种筛选电话号码的方法及装置,能快速、有效的筛选出空号和已停机的号码。
如图1所示,本发明实施例提供了一种筛选电话号码的方法,该方法包括:
步骤11,获取并存储待筛选电话号码被呼叫时的第一录音,且第一录音的时长为一预设时间段;
在本发明的具体实施例中,可以用支持AT指令的全球移动通讯系统(GSM,GlobalSystemforMobileCommunications)调制解调器拨打待筛选电话号码并录音,并将通话录音保存到电脑硬盘,可以将录音格式存储为wav,44100HZ,两声道。其中,AT指令是调制解调器的命令语言,而GSM调制解调器与电脑的连接方式采用现有技术实现,在此不再赘述。
步骤12,获取并存储对第一录音进行预处理后的第二录音,预处理包括采样、归一化以及降噪;
步骤13,分别计算第二录音与预先存储的各样本录音的相关系数,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
步骤14,若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的待筛选电话号码为空号或停机号码。
可选地,在本发明的上述实施例中,在执行步骤14之前,上述方法还包括:比较计算得到的各个相关系数,并从中选出最大的相关系数。
在本发明的具体实施例中,当需要筛选出兴趣点(例如酒吧、电影院、银行等)的数据库中的空号和已停机号码时,可以通过获取待筛选数据库中的每一电话号码被呼叫时的第一录音,并对第一录音依次进行采样、归一化以及降噪处理,得到第二录音,再计算第二录音与预先存储的各样本录音的相关系数,其中,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音,当各相关系数的最大值在一预设门限以上时,则认为该第二录音对应的电话号码为空号或停机号码。这样便能快速、有效的筛选出待筛选数据库中的空号和已停机的号码。
可选地,在本发明的上述实施例中,在步骤13执行之前,上述方法还包括:检测第二录音的能量值是否大于预设值;若第二录音的能量值大于预设值,则执行分别计算第二录音与预先存储的各样本录音的相关系数的步骤;否则结束流程。
在本发明的具体实施例中,在呼叫待筛选数据库中的电话号码时,有可能出现空语音的情况,因此,在计算相关系数之前需要检测第二语音的能量值是否大于一预设值,对于能量值大于该预设值的第二录音继续执行步骤13,而认为能量值小于该预设值的第二录音为空录音,这样可以减少第二录音的数据量,加快筛选速度。
在本发明的上述实施例中,如图2所示,图1中步骤12的具体步骤为:
步骤21,对第一录音进行采样;
在本发明的具体实施例中,首先需要通过公式:时间长度=语音总帧数/语音帧率计算出第一录音的时间长度,可以将第一录音的帧率设为100帧/秒,但为了防止由于帧数过高导致内存溢出,当第一录音的总帧数超过5000帧时,则将其强制降至5000帧。优选地,可以直接将第一录音的时间长度设为一预设时间段。
步骤22,对采样后的第一录音进行归一化处理;
在本发明的具体实施例中,由于不同的拨号硬件或运营商网络返回语音的强度具有很大的差异,因此需要对采样后的第一录音进行归一化处理,即将不同强度的语音拉伸至相同的规范空间,降低由于数据范围不同带来的影响。其中可以通过公式 V normalize = 2 × ( V ory - min ( V org ) ) - max ( V org ) max ( V org ) - min ( V org ) 完成归一化处理,公式中的Vorg和Vnormalize分别为第一语音的能量和归一化后的第一语音的能量,且本发明的实施例中的Vnormalize的范围为[-1,1]即上述规范空间为[-1,1]。
步骤23,对归一化后的第一录音进行降噪处理,得到第二录音。
在本发明的具体实施例中,电流噪声会对第一录音产生干扰,主要会对第一语音空白处产生大量的扰动,如图3中的线圈处所示,这一扰动会影响对第一语音的判别。因此,需要对第一录音进行降噪处理,从而克服电流噪声对第一语音的影响。在本发明的实施例中,认为能量低于第一语音的最大能量的5%的帧为噪声帧,对图3所示的第一语音进行降噪预处理,得到的第一语音波形如图4所示,其中,降噪采用现有技术实现,在此不再赘述。
在本发明的上述实施例中,第二录音的序列长度小于各样本录音的序列长度,图1中的步骤13的具体步骤为:针对每一个样本录音,分别执行以下处理:将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;选择出多次移位后计算得到的相关值中的最大者,作为第二录音与该样本录音的相关系数,从而得到第二录音与各样本录音的相关系数。
在本发明的具体实施例中,每次移位后,通过公式计算第二录音的序列与每一样本录音中相同长度的相关值,其中分别为第二语音的能量平均值和样本录音的能量的平均值,r为相关值,n为总采样点数,i为采样点数,V(i)1为第二语音的第i个采样点的能量,V(i)2为样本录音的第i个采样点的能量。
为了更好的实现上述目的,本发明的实施例还提供了一种筛选电话号码的装置,该装置包括:
第一获取模块51,用于获取并存储待筛选电话号码被呼叫时的第一录音,且第一录音的时长为一预设时间段;
第二获取模块52,用于获取并存储对第一录音进行预处理后的第二录音,预处理包括采样、归一化以及降噪;
计算模块53,用于分别计算第二录音与预先存储的各样本录音的相关系数,样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
确定模块54,用于若计算得到的相关系数的最大值在一预设门限以上时,确定该第二录音对应的待筛选电话号码为空号或停机号码。
其中,装置还包括:
比较模块,用于比较计算得到的各个相关系数,并从中选出最大的相关系数。
其中,装置还包括:
检测模块,用于检测第二录音的能量值是否大于预设值,并在第二录音的能量值大于预设值时,触发计算模块53执行分别计算第二录音与预先存储的各样本录音的相关系数的操作。
其中,第二获取模块52包括:
第一单元,用于对第一录音进行采样;
第二单元,用于对采样后的第一录音进行归一化处理;
第三单元,用于对归一化后的第一录音进行降噪处理,得到第二录音。
其中,第二录音的序列长度小于各样本录音的序列长度,计算模块53包括:
第四单元,用于针对每一个样本录音,分别执行以下处理:
将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;
在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;
选择出多次移位后计算得到的相关值中的最大者,作为第二录音与该样本录音的相关系数。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种筛选电话号码的方法,其特征在于,包括:
获取并存储待筛选电话号码被呼叫时的第一录音,且所述第一录音的时长为一预设时间段;
获取并存储对所述第一录音进行预处理后的第二录音,所述预处理包括采样、归一化以及降噪;
分别计算所述第二录音与预先存储的各样本录音的相关系数,所述样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的所述待筛选电话号码为空号或停机号码。
2.如权利要求1所述的方法,其特征在于,所述分别计算所述第二录音与预先存储的各样本录音的相关系数的步骤之前,所述方法还包括:
检测所述第二录音的能量值是否大于预设值;
若所述第二录音的能量值大于预设值,则执行分别计算所述第二录音与预先存储的各样本录音的相关系数的步骤;否则结束流程。
3.如权利要求1所述的方法,其特征在于,所述获取并存储对所述第一录音进行预处理后的第二录音的步骤包括:
对所述第一录音进行采样;
对采样后的第一录音进行归一化处理;
对归一化后的第一录音进行降噪处理,得到所述第二录音。
4.如权利要求1所述的方法,其特征在于,所述第二录音的序列长度小于各样本录音的序列长度,所述分别计算所述第二录音与预先存储的各样本录音的相关系数的步骤包括:
针对每一个样本录音,分别执行以下处理:
将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;
在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;
选择出多次移位后计算得到的相关值中的最大者,作为所述第二录音与该样本录音的相关系数。
5.如权利要求4所述的方法,其特征在于,所述若计算得到的相关系数的最大值在一预设门限以上时,则确定该第二录音对应的所述待筛选电话号码为空号或停机号码的步骤之前,所述方法还包括:
比较计算得到的各个相关系数,并从中选出最大的相关系数。
6.一种筛选电话号码的装置,其特征在于,包括:
第一获取模块,用于获取并存储待筛选电话号码被呼叫时的第一录音,且所述第一录音的时长为一预设时间段;
第二获取模块,用于获取并存储对所述第一录音进行预处理后的第二录音,所述预处理包括采样、归一化以及降噪;
计算模块,用于分别计算所述第二录音与预先存储的各样本录音的相关系数,所述样本录音包括空号被呼叫时的录音和停机号码被呼叫时的录音;
确定模块,用于若计算得到的相关系数的最大值在一预设门限以上时,确定该第二录音对应的所述待筛选电话号码为空号或停机号码。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
检测模块,用于检测所述第二录音的能量值是否大于预设值,并在所述第二录音的能量值大于预设值时,触发所述计算模块执行分别计算所述第二录音与预先存储的各样本录音的相关系数的操作。
8.如权利要求6所述的装置,其特征在于,所述第二获取模块包括:
第一单元,用于对所述第一录音进行采样;
第二单元,用于对采样后的第一录音进行归一化处理;
第三单元,用于对归一化后的第一录音进行降噪处理,得到所述第二录音。
9.如权利要求6所述的装置,其特征在于,所述第二录音的序列长度小于各样本录音的序列长度,所述计算模块包括:
第四单元,用于针对每一个样本录音,分别执行以下处理:
将第二录音按照预定步长移位,将第二录音从与该样本录音序列的首位相平齐位置,移动至与该样本录音末位相平齐位置;
在每次移位后,分别将移位后的第二录音的序列,与该样本录音中相同长度的对应序列进行相关性计算,得到一相关值;
选择出多次移位后计算得到的相关值中的最大者,作为所述第二录音与该样本录音的相关系数。
10.如权利要求9所述的装置,其特征在于,所述装置还包括:
比较模块,用于比较计算得到的各个相关系数,并从中选出最大的相关系数。
CN201410804405.0A 2014-12-19 2014-12-19 一种筛选电话号码的方法及装置 Pending CN105760403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410804405.0A CN105760403A (zh) 2014-12-19 2014-12-19 一种筛选电话号码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410804405.0A CN105760403A (zh) 2014-12-19 2014-12-19 一种筛选电话号码的方法及装置

Publications (1)

Publication Number Publication Date
CN105760403A true CN105760403A (zh) 2016-07-13

Family

ID=56341375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410804405.0A Pending CN105760403A (zh) 2014-12-19 2014-12-19 一种筛选电话号码的方法及装置

Country Status (1)

Country Link
CN (1) CN105760403A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166637A (zh) * 2018-02-12 2019-08-23 深圳市六度人和科技有限公司 一种空号识别方法及装置
CN110312046A (zh) * 2019-05-23 2019-10-08 中国平安人寿保险股份有限公司 外呼数据优化方法、装置、计算机设备及存储介质
CN112929503A (zh) * 2021-01-25 2021-06-08 浙江百应科技有限公司 一种基于多通话状态的外呼拦截方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897109A (zh) * 2006-06-01 2007-01-17 电子科技大学 一种基于mfcc的单一音频信号识别方法
CN101431731A (zh) * 2008-10-28 2009-05-13 中国移动通信集团福建有限公司 基于用户手机对非法语音电话及短信号码自动捕捉装置
CN201919067U (zh) * 2010-12-01 2011-08-03 广东石油化工学院 电话空号检测装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897109A (zh) * 2006-06-01 2007-01-17 电子科技大学 一种基于mfcc的单一音频信号识别方法
CN101431731A (zh) * 2008-10-28 2009-05-13 中国移动通信集团福建有限公司 基于用户手机对非法语音电话及短信号码自动捕捉装置
CN201919067U (zh) * 2010-12-01 2011-08-03 广东石油化工学院 电话空号检测装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166637A (zh) * 2018-02-12 2019-08-23 深圳市六度人和科技有限公司 一种空号识别方法及装置
CN110312046A (zh) * 2019-05-23 2019-10-08 中国平安人寿保险股份有限公司 外呼数据优化方法、装置、计算机设备及存储介质
CN110312046B (zh) * 2019-05-23 2022-10-21 中国平安人寿保险股份有限公司 外呼数据优化方法、装置、计算机设备及存储介质
CN112929503A (zh) * 2021-01-25 2021-06-08 浙江百应科技有限公司 一种基于多通话状态的外呼拦截方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN103886871B (zh) 语音端点的检测方法和装置
WO2013066409A8 (en) System, method and program for customized voice communication
CN103578468A (zh) 一种语音识别中置信度阈值的调整方法及电子设备
CA2546087A1 (en) Apparatus and method for speech recognition data retrieval
US9997168B2 (en) Method and apparatus for signal extraction of audio signal
CN101315772A (zh) 基于维纳滤波的语音混响消减方法
CN109545242A (zh) 一种音频数据处理方法、系统、装置及可读存储介质
CN102214464B (zh) 音频信号的瞬态检测方法以及基于该方法的时长调整方法
US9424743B2 (en) Real-time traffic detection
CN105760403A (zh) 一种筛选电话号码的方法及装置
WO2022105693A1 (zh) 样本生成方法及装置
CN106210371A (zh) 一种回声时延的确定方法、装置及智能会议设备
CN105118522A (zh) 噪声检测方法及装置
CN102956238A (zh) 用于在音频帧序列中检测重复模式的方法及设备
CN105848052A (zh) 一种麦克切换方法及终端
JP2017027076A (ja) ピッチ周期の正確性を検出するための方法および装置
CN105895102A (zh) 录音编辑方法及录音装置
CN108021635A (zh) 一种音频相似度的确定方法、装置和存储介质
CN104486470B (zh) 终端设备中声学器件的自检方法及系统
CN103632681A (zh) 一种谱包络静音检测方法
CN104780555A (zh) 基于信号强度的位置信息提示方法及装置
CN112782762A (zh) 一种基于深度学习的地震震级判定方法
CN105188008B (zh) 一种测试音频输出单元的方法及装置
CN102759572B (zh) 一种产品的质量检测方法和检测装置
CN103957531A (zh) 采用智能通信终端进行信号测试的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713