CN109785858A - 一种联系人添加方法、装置、可读存储介质及终端设备 - Google Patents
一种联系人添加方法、装置、可读存储介质及终端设备 Download PDFInfo
- Publication number
- CN109785858A CN109785858A CN201811530429.6A CN201811530429A CN109785858A CN 109785858 A CN109785858 A CN 109785858A CN 201811530429 A CN201811530429 A CN 201811530429A CN 109785858 A CN109785858 A CN 109785858A
- Authority
- CN
- China
- Prior art keywords
- contact
- voice
- feature vector
- equal
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 107
- 238000001228 spectrum Methods 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000001629 suppression Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明属于计算机技术领域,尤其涉及一种联系人添加方法、装置、计算机可读存储介质及终端设备。所述方法在接收到语音采集指令后,采集用户输入的语音信号;对采集的所述语音信号进行特征分析,得到其特征向量;提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中,用户仅通过语音输入的方式即可完成联系人的添加过程。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种联系人添加方法、装置、计算机可读存储介质及终端设备。
背景技术
在进行贷款申请等各种在线电子申请中,一般都需要用户在电子申请表格中添加联系人,目前往往是通过用户点击界面,调取出通讯录,并从中选择添加联系人,这种方式操作非常繁琐,耗时耗力,用户体验较差。
发明内容
有鉴于此,本发明实施例提供了一种联系人添加方法、装置、计算机可读存储介质及终端设备,以解决现有的在电子申请表格中添加联系人的方式操作非常繁琐,耗时耗力,用户体验较差的问题。
本发明实施例的第一方面提供了一种联系人添加方法,可以包括:
在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
本发明实施例的第二方面提供了一种联系人添加装置,可以包括:
语音信号采集模块,用于在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
特征分析模块,用于对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
标准特征向量查找模块,用于提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
候选联系人选取模块,用于分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
优选联系人确定模块,用于根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
本发明实施例的第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例通过语音输入的方式来进行联系人的添加,在接收到语音采集指令后,采集用户输入的语音信号,并对采集的语音信号进行特征分析,得到该语音信号的特征向量,然后自动提取该用户的终端设备中的联系人列表,并查找其中的各个联系人的标准特征向量,再通过匹配度的计算从联系人列表中选取出若干个候选联系人,这些候选联系人都是姓名发音与用户输入的语音信号较为接近的联系人。考虑到用户添加的联系人一般是与该用户联系较频繁的人,因此可以进一步根据该用户的通话记录分别计算该用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。通过本发明实施例,用户仅通过语音输入的方式即可完成联系人的添加过程,大大简化了操作流程,省时省力,用户体验得到了极大提升。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种联系人添加方法的一个实施例流程图;
图2为对采集的语音信号进行特征分析的示意流程图;
图3为本发明实施例中一种联系人添加装置的一个实施例结构图;
图4为本发明实施例中一种终端设备的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种联系人添加方法的一个实施例可以包括:
步骤S101、在接收到语音采集指令后,采集用户输入的语音信号。
在本实施例中,可以通过应用程序(APP)的形式为用户提供了进行贷款申请或者其它各种在线电子申请的平台。当用户在手机、平板电脑等终端设备中安装的应用程序里填写电子申请时,若进行到联系人添加的页面,在该页面的指定位置中会显示预先设置的语音输入按钮,当用户长按该语音输入按钮时,即相当于向应用程序下发了语音采集指令,应用程序开始调用终端设备内置的麦克风采集用户输入的语音信号,此时用户可以说出要添加的联系人的姓名,则终端设备便可采集到包括联系人的姓名在内的语音信号,当用户松开该语音输入按钮时,即相当于向应用程序下发了语音采集终止指令,应用程序结束对语音信号的采集。
优选地,为了提高语音识别的准确率,在进行语音识别之前,可以先对采集的语音信号进行去噪处理。具体地,首先可以将环境噪音信号传送至终端设备极低延迟的数字噪音消除(Digital Noise Cancelling,DNC)电路,进行实时运算,计算出该环境噪音信号的频率和相位,然后再通过终端设备内置的数字模拟转换器(Digital to AnalogConverter,DAC)生成与环境噪音信号频率相同、相位相反的抑制信号。再将该抑制信号与采集的语音信号进行叠加,由于抑制信号与环境噪音信号频率相同、相位相反,两者叠加之后会相互抵消,大大降低周边噪音的干扰。
步骤S102、对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量。
如图2所示,步骤S102具体可以包括以下步骤:
步骤S1021、分别计算所述语音信号中各个采样点的信号能量,并根据各个采样点的信号能量的分布状态确定所述联系人的姓名在所述语音信号中被重复的次数。
在本实施例中,将各个采样点的信号幅度的平方作为其信号能量。在计算得到各个采样点的信号能量后,按照预设的帧长将所述语音信号划分为各个语音帧,所述帧长可以根据实际情况进行设置,例如,可以将其设置为20ms、40ms、80ms、160ms或者其它取值。
然后根据各个语音帧中所包含的采样点的信号能量分别计算各个语音帧的能量均值,即:
其中,s为语音帧中采样点的序号,1≤s≤SN,SN为每个语音帧中的采样点个数,SampleAms为语音帧中第s个采样点的信号幅度,SamplePws为语音帧中第s个采样点的信号能量,FrmAvPw为语音帧的能量均值。
此时,可以将能量均值小于预设的能量阈值的语音帧确定为空闲帧,并将连续的空闲帧组成空闲帧组。
所述能量阈值可以根据实际情况进行设置,例如,可以将其设置为整个语音信号能量均值的20%、30%、50%或者其它取值。若某一语音帧的能量均值小于该能量阈值,则说明该语音帧中主要是背景噪音,并不包含语音信号,即可将其确定为空闲帧,FN个以上的连续的空闲帧则可组成空闲帧组,FN为正整数,其具体取值可以根据实际情况进行设置,例如,可以将其设置为10、20、50或者其它取值。
最后,根据所述空闲帧组的数目确定所述联系人的姓名在所述语音信号中被重复的次数。
一般地,两个空闲帧组之间的语音帧即为所述联系人的姓名在所述语音信号中的一次重复,因此,将所述空闲帧组的数目减去1,即为所述联系人的姓名在所述语音信号中被重复的次数。
步骤S1022、将所述语音信号划分为M个语音子段。
其中,M为所述联系人的姓名在所述语音信号中被重复的次数,每个语音子段中均包含一次所述联系人的姓名。
步骤S1023、分别计算各个语音子段的梅尔频谱倒频系数向量。
在本实施例中,具体可以根据下式分别计算各个语音子段的梅尔频谱倒频系数向量:
MelVecm=MFCCFuc(SubVoicem)
其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数,1≤n≤N,N为所述梅尔频谱倒频系数向量的元素个数。
步骤S1024、分别计算各个语音子段的权重系数。
在本实施例中,具体可以根据下式分别计算各个语音子段的权重系数:
其中,Weightm为第m个语音子段的权重系数。
步骤S1025、构造所述语音信号的特征向量。
在本实施例中,具体可以根据下式构造所述语音信号的特征向量:
VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)
其中,VoPrintVec为所述语音信号的特征向量。
步骤S103、提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量。
首先,提取终端设备中的联系人列表。例如,在安卓系统中,可以通过getContentResolver()函数和“content://icc/adn”参数或者“content://sim/adn”参数来获取SIM卡中通讯录信息,读取其中的各个联系人。
然后,在所述数据库中分别查找各个联系人的姓名发音的标准特征向量。特别需要注意地是,由于多音字的存在,使得某些联系人可能对应多个标准特征向量,例如,某联系人为“张重”,其发音既可能为“zhangchong”,也可能为“zhangzhong”,则该联系人在数据库中共对应两个标准特征向量,一个为“zhangchong”发音的梅尔频谱倒频系数向量,一个为“zhangzhong”发音的梅尔频谱倒频系数向量。
步骤S104、分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人。
在本实施例中,可以根据下式计算所述语音信号的特征向量与各个标准特征向量之间的匹配度:
其中,c为所述联系人列表中的联系人的序号,1≤c≤ContactNum,ContactNum为所述联系人列表中的联系人的总数,p为标准特征向量的序号,1≤p≤VecNumc,VecNumc为第c个联系人的标准特征向量的总数,且w为联系人姓名的字符序号,1≤w≤WNc,WNc为第c个联系人的姓名的总字符数,MultiProNumc,w为第c个联系人的姓名的第w个字符的不同发音的总数,StVpElemc,p,n为第c个联系人的第p个标准特征向量的第n个元素,MatDegc,p为所述语音信号的特征向量与第c个联系人的第p个标准特征向量之间的匹配度。
然后,可以根据下式构造各个联系人的匹配度序列:
其中,MatDegSqc为第c个联系人的匹配度序列。
再根据下式选取各个联系人的最大匹配度:
其中,MaxMatDegc为第c个联系人的最大匹配度。
最后,将满足下式的联系人确定为候选联系人:
MaxMatDegc>MDThreshold
其中,MDThreshold为预设的匹配度阈值,其具体取值可以根据实际情况进行设置,例如,可以将其设置为70%、80%、90%或者其它取值。
步骤S105、根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
首先,将所述通话记录划分为T个通话记录子段,T为正整数,其具体取值可以根据具体情况进行设置,例如,可以将其设置为3、5、10或者其它取值。需要注意地是,T取值越大,则计算量也越大,但计算精度越高,反之,T取值越小,则计算量也越大,但计算精度越低,需要根据具体场景对这两种情况进行均衡考虑。
然后,分别统计在各个通话记录子段中所述用户与各个候选联系人之间的通话次数,并根据下式分别计算所述用户与各个候选联系人之间的关联度:
其中,f为候选联系人的序号,1≤f≤FN,FN为候选联系人的总数,t为各个通话记录子段按照时间先后顺序排列的序号,1≤t≤T,ContNumf,t为在第t个通话记录子段中所述用户与第f个候选联系人之间的通话次数,exp为自然指数函数,FdWtf为所述用户与第f个候选联系人之间的关联度。从该式中可以看出,距离当前越远的通话记录子段,其权重越小,对最终结果的影响也越大,反之,距离当前越近的通话记录子段,其权重越大,对最终结果的影响也越大。
在完成了关联度的计算后,可以构造出所述用户与各个候选联系人之间的关联度序列:
FdWtSq=(FdWt1,FdWt2,...,FdWtf,...,FdWtFN)
根据下式从中选取出关联度最高的候选联系人作为优选联系人:
BestContact=Argmax(FdWtSq)
=Argmax(FdWt1,FdWt2,...,FdWtf,...,FdWtFN)
其中,Argmax为最大自变量函数,FdWtSq为所述关联度序列,BestContact为所述优选联系人的序号,该优选联系人即为最终确定的需添加入电子申请中的联系人,将其添加入指定的填写区域中。
以上为只添加一个联系人的情况,进一步地,用户还可以连续说出多个联系人,每个联系人相隔时长为Interval,且T1<Interval<T2,T1为预设的第一阈值,其取值可以根据实际情况进行设置,例如,可以将其设置为1.5秒、1.8秒、2秒或者其它取值,T2为预设的第二阈值,其取值可以根据实际情况进行设置,例如,可以将其设置为2.5秒、2.8秒、3秒或者其它取值。采集到用户的语音信号后,可以分别对其中的每个联系人采用上述方法进行匹配识别。
进一步地,还可以将方言发音纳入考虑,即标准特征向量中不仅包括普通话的特征向量,还可以包括多种方言的特征向量,各种方言的优先级按照历史统计中匹配成功的频率进行排序,从而进一步加大了匹配的成功率。
综上所述,本发明实施例通过语音输入的方式来进行联系人的添加,在接收到语音采集指令后,采集用户输入的语音信号,并对采集的语音信号进行特征分析,得到该语音信号的特征向量,然后自动提取该用户的终端设备中的联系人列表,并查找其中的各个联系人的标准特征向量,再通过匹配度的计算从联系人列表中选取出若干个候选联系人,这些候选联系人都是姓名发音与用户输入的语音信号较为接近的联系人。考虑到用户添加的联系人一般是与该用户联系较频繁的人,因此可以进一步根据该用户的通话记录分别计算该用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。通过本发明实施例,用户仅通过语音输入的方式即可完成联系人的添加过程,大大简化了操作流程,省时省力,用户体验得到了极大提升。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种联系人添加方法,图3示出了本发明实施例提供的一种联系人添加装置的一个实施例结构图。
本实施例中,一种联系人添加装置可以包括:
语音信号采集模块301,用于在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
特征分析模块302,用于对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
标准特征向量查找模块303,用于提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
候选联系人选取模块304,用于分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
优选联系人确定模块305,用于根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
进一步地,所述特征分析模块可以包括:
重复次数确定单元,用于分别计算所述语音信号中各个采样点的信号能量,并根据各个采样点的信号能量的分布状态确定所述联系人的姓名在所述语音信号中被重复的次数;
语音子段划分单元,用于将所述语音信号划分为M个语音子段,其中,M为所述联系人的姓名在所述语音信号中被重复的次数;
梅尔频谱倒频系数向量计算单元,用于根据下式分别计算各个语音子段的梅尔频谱倒频系数向量:
MelVecm=MFCCFuc(SubVoicem)
其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数,1≤n≤N,N为所述梅尔频谱倒频系数向量的元素个数;
权重系数计算单元,用于根据下式分别计算各个语音子段的权重系数:
其中,Weightm为第m个语音子段的权重系数;
特征向量构造单元,用于根据下式构造所述语音信号的特征向量:
VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)
其中,VoPrintVec为所述语音信号的特征向量。
进一步地,所述重复次数确定单元可以包括:
语音帧划分子单元,用于按照预设的帧长将所述语音信号划分为各个语音帧;
能量均值计算子单元,用于根据各个语音帧中所包含的采样点的信号能量分别计算各个语音帧的能量均值;
空闲帧组确定子单元,用于将能量均值小于预设的能量阈值的语音帧确定为空闲帧,并将连续的空闲帧组成空闲帧组;
重复次数确定子单元,用于根据所述空闲帧组的数目确定所述联系人的姓名在所述语音信号中被重复的次数。
进一步地,所述候选联系人选取模块可以包括:
匹配度计算单元,用于根据下式计算所述语音信号的特征向量与各个标准特征向量之间的匹配度:
其中,c为所述联系人列表中的联系人的序号,1≤c≤ContactNum,ContactNum为所述联系人列表中的联系人的总数,p为标准特征向量的序号,1≤p≤VecNumc,VecNumc为第c个联系人的标准特征向量的总数,且w为联系人姓名的字符序号,1≤w≤WNc,WNc为第c个联系人的姓名的总字符数,MultiProNumc,w为第c个联系人的姓名的第w个字符的不同发音的总数,StVpElemc,p,n为第c个联系人的第p个标准特征向量的第n个元素,MatDegc,p为所述语音信号的特征向量与第c个联系人的第p个标准特征向量之间的匹配度;
匹配度序列构造单元,用于根据下式构造各个联系人的匹配度序列:
其中,MatDegSqc为第c个联系人的匹配度序列;
最大匹配度选取单元,用于根据下式选取各个联系人的最大匹配度:
其中,MaxMatDegc为第c个联系人的最大匹配度;
候选联系人确定子单元,用于将满足下式的联系人确定为候选联系人:
MaxMatDegc>MDThreshold
其中,MDThreshold为预设的匹配度阈值。
进一步地,所述优选联系人确定模块可以包括:
通话记录子段划分单元,用于将所述通话记录划分为T个通话记录子段,T为正整数;
通话次数统计单元,用于分别统计在各个通话记录子段中所述用户与各个候选联系人之间的通话次数;
关联度计算单元,用于根据下式分别计算所述用户与各个候选联系人之间的关联度:
其中,f为候选联系人的序号,1≤f≤FN,FN为候选联系人的总数,t为各个通话记录子段按照时间先后顺序排列的序号,1≤t≤T,ContNumf,t为在第t个通话记录子段中所述用户与第f个候选联系人之间的通话次数,exp为自然指数函数,FdWtf为所述用户与第f个候选联系人之间的关联度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图4示出了本发明实施例提供的一种终端设备的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述终端设备4可以是手机、平板电脑、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备4可包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42,例如执行上述的联系人添加方法的计算机可读指令。所述处理器40执行所述计算机可读指令42时实现上述各个联系人添加方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至305的功能。
示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述终端设备4中的执行过程。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述终端设备4所需的其它指令和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种联系人添加方法,其特征在于,包括:
在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
2.根据权利要求1所述的联系人添加方法,其特征在于,所述对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量包括:
分别计算所述语音信号中各个采样点的信号能量,并根据各个采样点的信号能量的分布状态确定所述联系人的姓名在所述语音信号中被重复的次数;
将所述语音信号划分为M个语音子段,其中,M为所述联系人的姓名在所述语音信号中被重复的次数;
根据下式分别计算各个语音子段的梅尔频谱倒频系数向量:
MelVecm=MFCCFuc(SubVoicem)
其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数,1≤n≤N,N为所述梅尔频谱倒频系数向量的元素个数;
根据下式分别计算各个语音子段的权重系数:
其中,Weightm为第m个语音子段的权重系数;
根据下式构造所述语音信号的特征向量:
VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)
其中,VoPrintVec为所述语音信号的特征向量。
3.根据权利要求2所述的联系人添加方法,其特征在于,所述根据各个采样点的信号能量的分布状态确定所述联系人的姓名在所述语音信号中被重复的次数包括:
按照预设的帧长将所述语音信号划分为各个语音帧;
根据各个语音帧中所包含的采样点的信号能量分别计算各个语音帧的能量均值;
将能量均值小于预设的能量阈值的语音帧确定为空闲帧,并将连续的空闲帧组成空闲帧组;
根据所述空闲帧组的数目确定所述联系人的姓名在所述语音信号中被重复的次数。
4.根据权利要求1所述的联系人添加方法,其特征在于,所述分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人包括:
根据下式计算所述语音信号的特征向量与各个标准特征向量之间的匹配度:
其中,c为所述联系人列表中的联系人的序号,1≤c≤ContactNum,ContactNum为所述联系人列表中的联系人的总数,p为标准特征向量的序号,1≤p≤VecNumc,VecNumc为第c个联系人的标准特征向量的总数,且w为联系人姓名的字符序号,1≤w≤WNc,WNc为第c个联系人的姓名的总字符数,MultiProNumc,w为第c个联系人的姓名的第w个字符的不同发音的总数,StVpElemc,p,n为第c个联系人的第p个标准特征向量的第n个元素,MatDegc,p为所述语音信号的特征向量与第c个联系人的第p个标准特征向量之间的匹配度;
根据下式构造各个联系人的匹配度序列:
其中,MatDegSqc为第c个联系人的匹配度序列;
根据下式选取各个联系人的最大匹配度:
其中,MaxMatDegc为第c个联系人的最大匹配度;
将满足下式的联系人确定为候选联系人:
MaxMatDegc>MDThreshold
其中,MDThreshold为预设的匹配度阈值。
5.根据权利要求1至4中任一项所述的联系人添加方法,其特征在于,所述根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度包括:
将所述通话记录划分为T个通话记录子段,T为正整数;
分别统计在各个通话记录子段中所述用户与各个候选联系人之间的通话次数;
根据下式分别计算所述用户与各个候选联系人之间的关联度:
其中,f为候选联系人的序号,1≤f≤FN,FN为候选联系人的总数,t为各个通话记录子段按照时间先后顺序排列的序号,1≤t≤T,ContNumf,t为在第t个通话记录子段中所述用户与第f个候选联系人之间的通话次数,exp为自然指数函数,FdWtf为所述用户与第f个候选联系人之间的关联度。
6.一种联系人添加装置,其特征在于,包括:
语音信号采集模块,用于在接收到语音采集指令后,采集用户输入的语音信号,所述语音信号中包括联系人的姓名;
特征分析模块,用于对采集的所述语音信号进行特征分析,得到所述语音信号的特征向量;
标准特征向量查找模块,用于提取所述用户的终端设备中的联系人列表,并在预设的数据库中分别查找所述联系人列表中的各个联系人的标准特征向量;
候选联系人选取模块,用于分别计算所述语音信号的特征向量与各个标准特征向量之间的匹配度,并根据所述匹配度从所述联系人列表中选取预设数目的候选联系人;
优选联系人确定模块,用于根据所述用户的通话记录分别计算所述用户与各个候选联系人之间的关联度,并将关联度最高的候选联系人添加入指定的填写区域中。
7.根据权利要求6所述的联系人添加装置,其特征在于,所述特征分析模块包括:
重复次数确定单元,用于分别计算所述语音信号中各个采样点的信号能量,并根据各个采样点的信号能量的分布状态确定所述联系人的姓名在所述语音信号中被重复的次数;
语音子段划分单元,用于将所述语音信号划分为M个语音子段,其中,M为所述联系人的姓名在所述语音信号中被重复的次数;
梅尔频谱倒频系数向量计算单元,用于根据下式分别计算各个语音子段的梅尔频谱倒频系数向量:
MelVecm=MFCCFuc(SubVoicem)
其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数,1≤n≤N,N为所述梅尔频谱倒频系数向量的元素个数;
权重系数计算单元,用于根据下式分别计算各个语音子段的权重系数:
其中,Weightm为第m个语音子段的权重系数;
特征向量构造单元,用于根据下式构造所述语音信号的特征向量:
VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)
其中,VoPrintVec为所述语音信号的特征向量。
8.根据权利要求6所述的联系人添加装置,其特征在于,所述候选联系人选取模块包括:
匹配度计算单元,用于根据下式计算所述语音信号的特征向量与各个标准特征向量之间的匹配度:
其中,c为所述联系人列表中的联系人的序号,1≤c≤ContactNum,ContactNum为所述联系人列表中的联系人的总数,p为标准特征向量的序号,1≤p≤VecNumc,VecNumc为第c个联系人的标准特征向量的总数,且w为联系人姓名的字符序号,1≤w≤WNc,WNc为第c个联系人的姓名的总字符数,MultiProNumc,w为第c个联系人的姓名的第w个字符的不同发音的总数,StVpElemc,p,n为第c个联系人的第p个标准特征向量的第n个元素,MatDegc,p为所述语音信号的特征向量与第c个联系人的第p个标准特征向量之间的匹配度;
匹配度序列构造单元,用于根据下式构造各个联系人的匹配度序列:
其中,MatDegSqc为第c个联系人的匹配度序列;
最大匹配度选取单元,用于根据下式选取各个联系人的最大匹配度:
其中,MaxMatDegc为第c个联系人的最大匹配度;
候选联系人确定子单元,用于将满足下式的联系人确定为候选联系人:
MaxMatDegc>MDThreshold
其中,MDThreshold为预设的匹配度阈值。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的联系人添加方法的步骤。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的联系人添加方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530429.6A CN109785858B (zh) | 2018-12-14 | 2018-12-14 | 一种联系人添加方法、装置、可读存储介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530429.6A CN109785858B (zh) | 2018-12-14 | 2018-12-14 | 一种联系人添加方法、装置、可读存储介质及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109785858A true CN109785858A (zh) | 2019-05-21 |
CN109785858B CN109785858B (zh) | 2024-02-23 |
Family
ID=66496947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811530429.6A Active CN109785858B (zh) | 2018-12-14 | 2018-12-14 | 一种联系人添加方法、装置、可读存储介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109785858B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050049860A1 (en) * | 2003-08-29 | 2005-03-03 | Junqua Jean-Claude | Method and apparatus for improved speech recognition with supplementary information |
CN104601438A (zh) * | 2014-04-28 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 一种好友推荐方法和装置 |
CN105897995A (zh) * | 2016-05-31 | 2016-08-24 | 努比亚技术有限公司 | 一种添加联系人信息的方法和装置 |
CN107360297A (zh) * | 2017-06-27 | 2017-11-17 | 努比亚技术有限公司 | 一种联系人查找方法、终端及计算机可读存储介质 |
CN108009200A (zh) * | 2017-10-30 | 2018-05-08 | 努比亚技术有限公司 | 联系人图像的设置方法及移动终端、计算机可读存储介质 |
CN108390987A (zh) * | 2018-03-09 | 2018-08-10 | 广东欧珀移动通信有限公司 | 联系人创建方法及相关设备 |
CN108604449A (zh) * | 2015-09-30 | 2018-09-28 | 苹果公司 | 说话者识别 |
CN108831439A (zh) * | 2018-06-27 | 2018-11-16 | 广州视源电子科技股份有限公司 | 语音识别方法、装置、设备和系统 |
-
2018
- 2018-12-14 CN CN201811530429.6A patent/CN109785858B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050049860A1 (en) * | 2003-08-29 | 2005-03-03 | Junqua Jean-Claude | Method and apparatus for improved speech recognition with supplementary information |
CN104601438A (zh) * | 2014-04-28 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 一种好友推荐方法和装置 |
CN108604449A (zh) * | 2015-09-30 | 2018-09-28 | 苹果公司 | 说话者识别 |
CN105897995A (zh) * | 2016-05-31 | 2016-08-24 | 努比亚技术有限公司 | 一种添加联系人信息的方法和装置 |
CN107360297A (zh) * | 2017-06-27 | 2017-11-17 | 努比亚技术有限公司 | 一种联系人查找方法、终端及计算机可读存储介质 |
CN108009200A (zh) * | 2017-10-30 | 2018-05-08 | 努比亚技术有限公司 | 联系人图像的设置方法及移动终端、计算机可读存储介质 |
CN108390987A (zh) * | 2018-03-09 | 2018-08-10 | 广东欧珀移动通信有限公司 | 联系人创建方法及相关设备 |
CN108831439A (zh) * | 2018-06-27 | 2018-11-16 | 广州视源电子科技股份有限公司 | 语音识别方法、装置、设备和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109785858B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105976812B (zh) | 一种语音识别方法及其设备 | |
US10621971B2 (en) | Method and device for extracting speech feature based on artificial intelligence | |
CN110457432B (zh) | 面试评分方法、装置、设备及存储介质 | |
US20200051551A1 (en) | Convolutional neural networks | |
CN111694940B (zh) | 一种用户报告的生成方法及终端设备 | |
CN110020009B (zh) | 在线问答方法、装置及系统 | |
CN111785288B (zh) | 语音增强方法、装置、设备及存储介质 | |
CN112233698B (zh) | 人物情绪识别方法、装置、终端设备及存储介质 | |
CN111243590A (zh) | 一种会议记录的生成方法及设备 | |
CN109460461A (zh) | 基于文本相似度模型的文本匹配方法及系统 | |
CN113314119B (zh) | 语音识别智能家居控制方法及装置 | |
CN109584865A (zh) | 一种应用程序控制方法、装置、可读存储介质及终端设备 | |
CN111357051A (zh) | 语音情感识别方法、智能装置和计算机可读存储介质 | |
CN109670073B (zh) | 一种信息转换方法及装置、交互辅助系统 | |
CN107731232A (zh) | 语音翻译方法和装置 | |
CN113505272A (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN109688271A (zh) | 联系人信息输入的方法、装置及终端设备 | |
CN113948090B (zh) | 语音检测方法、会话记录产品及计算机存储介质 | |
CN110610697B (zh) | 一种语音识别方法及装置 | |
CN109785858A (zh) | 一种联系人添加方法、装置、可读存储介质及终端设备 | |
CN113570404B (zh) | 一种目标用户定位的方法、装置及相关设备 | |
CN112735394B (zh) | 一种语音的语义解析方法及装置 | |
CN111813989B (zh) | 信息处理方法、设备及存储介质 | |
CN116486789A (zh) | 语音识别模型的生成方法、语音识别方法、装置及设备 | |
CN112712792A (zh) | 一种方言识别模型的训练方法、可读存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240118 Address after: 518000 World Trade Plaza 101-1, Funan Community, Futian Street, Futian District, Shenzhen, Guangdong Province Applicant after: SHENZHEN XINGHAI IOT TECHNOLOGY Co.,Ltd. Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.) Applicant before: PING AN PUHUI ENTERPRISE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |