CN117292712A - 用户反馈信息的异常识别方法、装置和计算机设备 - Google Patents
用户反馈信息的异常识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN117292712A CN117292712A CN202311238133.8A CN202311238133A CN117292712A CN 117292712 A CN117292712 A CN 117292712A CN 202311238133 A CN202311238133 A CN 202311238133A CN 117292712 A CN117292712 A CN 117292712A
- Authority
- CN
- China
- Prior art keywords
- audio
- call
- abnormal
- call audio
- feedback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000005856 abnormality Effects 0.000 title claims description 31
- 230000002159 abnormal effect Effects 0.000 claims abstract description 244
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims description 16
- 230000000694 effects Effects 0.000 abstract description 8
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种用户反馈信息的异常识别方法、装置、计算机设备、存储介质和计算机程序产品,可用于自然语言处理技术领域或金融领域,以增强异常识别的准确性,从而提高用户反馈信息的异常识别效果。所述方法包括:获取来自用于用户反馈信息的通话渠道的通话音频;确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果;根据音频特征匹配结果,得到通话音频的异常识别结果。
Description
技术领域
本申请涉及自然语言处理技术领域,特别是涉及一种用户反馈信息的异常识别方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
用户可以通过电话、邮件等通话渠道向银行等金融机构反馈一些服务的体验或者建议。目前,存在利用用户反馈信息的渠道进行非正常的反馈,以谋取利益。比如一些中介机构或代理商代理客户对发卡银行进行非正常的投诉,有效核查出用户反馈信息中的异常情况成为了银行亟待解决的问题。
为辨别出用户反馈信息的异常,银行工作人员需要在拿到通话录音后,通过人耳感知辨别该通话是否是代理投诉。这种通过人工辨别用户反馈信息的异常的方式,主要是依靠工作人员的辨别经验,缺乏客观性也容易辨别错误,存在辨别准确率较低的缺陷。
发明内容
基于此,有必要针对上述技术问题,提供一种用户反馈信息的异常识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种用户反馈信息的异常识别方法。所述方法包括:
获取来自用于用户反馈信息的通话渠道的通话音频;
确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
在其中一个实施例中,根据所述音频特征匹配结果,得到所述通话音频的异常识别结果,包括:
当所述音频特征匹配结果为匹配成功时,将所述通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到所述通话音频的来电标识匹配结果;
根据所述来电标识匹配结果,得到所述通话音频的异常识别结果。
在其中一个实施例中,根据所述来电标识匹配结果,得到所述通话音频的异常识别结果,包括:
当所述来电标识匹配结果为匹配成功时,从所述异常反馈标识库中,获取与所述通话音频的来电标识匹配的目标异常反馈标识关联的身份信息;
若关联的身份信息的数量超过预设数量阈值,则确认所述通话音频的异常识别结果为异常;
若关联的身份信息的数量不超过所述预设数量阈值,则确认所述通话音频的异常识别结果为非异常。
在其中一个实施例中,所述方法还包括:
获取所述通话音频的来电标识对应的反馈次数;
当所述相似度小于所述预设相似度阈值,且所述反馈次数超过预设反馈次数阈值时,确定所述通话音频的异常识别结果为异常。
在其中一个实施例中,在确认所述通话音频的异常识别结果为异常之后,还包括:
将所述通话音频的音频特征存储至所述异常反馈语音库;
将所述通话音频的来电标识和身份信息存储至所述异常反馈标识库。
在其中一个实施例中,在确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度之前,还包括:
根据所述通话音频的来电标识,获取所述通话音频的历史通话音频;
对所述通话音频和所述历史通话音频分别进行声纹提取,得到所述通话音频的用户声纹和所述历史通话音频的声纹。
第二方面,本申请还提供了一种用户反馈信息的异常识别装置。所述装置包括:
音频获取模块,用于获取来自用于用户反馈信息的通话渠道的通话音频;
声纹对比模块,用于确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
特征匹配模块,用于若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
异常识别模块,用于根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取来自用于用户反馈信息的通话渠道的通话音频;
确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取来自用于用户反馈信息的通话渠道的通话音频;
确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取来自用于用户反馈信息的通话渠道的通话音频;
确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
上述用户反馈信息的异常识别方法、装置、计算机设备、存储介质和计算机程序产品,获取来自用于用户反馈信息的通话渠道的通话音频;确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果;根据音频特征匹配结果,得到通话音频的异常识别结果。
本申请有益效果:无需人工对比通话音频,能够基于通话音频的声纹、异常反馈语音库中的异常反馈语音,自动实现用户反馈信息的异常识别,通过多因素多层面的对比分析,增强了异常识别的准确性,提高了用户反馈信息的异常识别效果。
附图说明
图1为一个实施例中用户反馈信息的异常识别方法的流程示意图;
图2为一个实施例中根据来电标识匹配结果,得到通话音频的异常识别结果步骤的流程示意图;
图3为另一个实施例中用户反馈信息的异常识别方法的流程示意图;
图4为又一个实施例中用户反馈信息的异常识别方法的流程示意图;
图5为一个实施例中用户反馈信息的异常识别装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
在一个实施例中,如图1所示,提供了一种用户反馈信息的异常识别方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤S101,获取来自用于用户反馈信息的通话渠道的通话音频。
其中,用户反馈信息是指用户基于银行等金融机构的业务或者业务服务反馈的内容。例如,用户反馈信息可以是服务评价、投诉等信息,而通话渠道可以是银行的投诉电话热线。
具体地,用户想要反馈银行某项金融业务的意见时,可以通过指定的通话渠道提供用户反馈信息,银行系统可以对该通话渠道的通话过程进行录音并上传服务器,进而服务器得到关于用户反馈信息的通话音频。
步骤S102,确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;历史通话音频为通话音频的来电标识对应的历史通话音频。
其中,来电标识是指能够表征来电方身份的标识信息。例如,来电标识可以是电话号码。
具体地,服务器通过通话音频的来电标识,获取该来电标识对应的用户的多个历史通话音频,然后分别对每个历史通话音频和通话音频进行声纹提取处理,得到通话音频的用户声纹与历史通话音频的声纹。服务器将用户声纹特征分别与每个历史通话音频的声纹特征进行对比,确定用户声纹特征与每个历史通话音频的声纹特征之间的相似度。
步骤S103,若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果。
其中,异常反馈音频是指被识别为异常的用户反馈信息的通话音频。以投诉业务为例,异常反馈音频可以是中介代理客户进行投诉的通话音频。异常反馈语音库中存储有多个异常反馈音频。
具体地,判断用户声纹特征与各个历史通话音频的声纹特征之间的相似度是否大于预设相似度阈值。若相似度小于预设相似度阈值,则认为该通话音频的异常识别结果为异常。若相似度大于或者等于预设相似度阈值,则可继续通过其他方面的判断增强异常识别的准确性,比如说先对通话音频进行特征提取处理,得到通话音频的音频特征,然后将通话音频的音频特征分别与异常反馈语音库中存储的各个异常反馈音频的音频特征进行特征匹配处理,则服务器得到通话音频的音频特征匹配结果。
步骤S104,根据音频特征匹配结果,得到通话音频的异常识别结果。
具体地,服务器根据音频特征匹配结果,可以进一步选择是否将通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,从而根据匹配结果确定通话音频的异常识别结果。其中,异常识别结果用于指示该通话音频对应的用户反馈信息是否存在异常。
进一步地,在确认该通话音频的异常识别结果为异常之后,还可以将该通话音频和该通话音频的来电标识分别注册到异常反馈语音库和异常反馈标识库中,以实现异常反馈语音库和异常反馈标识库的更新,为后续的用户反馈信息的异常识别提供更丰富的音频和来电标识案例,从而不断增强识别的准确性。
上述用户反馈信息的异常识别方法中,获取来自用于用户反馈信息的通话渠道的通话音频;确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果;根据音频特征匹配结果,得到通话音频的异常识别结果。采用本方法,无需人工对比通话音频,能够基于通话音频的声纹、异常反馈语音库中的异常反馈语音,自动实现用户反馈信息的异常识别,通过多因素多层面的对比分析,增强了异常识别的准确性,提高了用户反馈信息的异常识别效果。
在一个实施例中,上述步骤S104,根据音频特征匹配结果,得到通话音频的异常识别结果,具体包括如下内容:当音频特征匹配结果为匹配成功时,将通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到通话音频的来电标识匹配结果;根据来电标识匹配结果,得到通话音频的异常识别结果。
其中,异常反馈标识是指被识别为异常的通话音频的来电标识。以投诉业务为例,异常反馈音频可以是中介代理客户进行投诉的通话音频的来电号码。异常反馈标识库中存储有多个异常反馈标识。
具体地,若在异常反馈语音库中未检索到与该通信音频的音频特征相匹配的异常反馈音频的音频特征,比如说在异常反馈语音库中没检索到与通信音频的音频特征一致的音频特征,则认为音频特征匹配结果为匹配失败,服务器可确认该通信音频的异常识别结果为非异常。若在异常反馈语音库中检索到与该通信音频的音频特征相匹配的异常反馈音频的音频特征,比如说在异常反馈语音库中检索到了与通信音频的音频特征一致的音频特征,则认为音频特征匹配结果为匹配成功,则可以继续将该通话音频的来电标识分别与异常反馈标识库中每个异常反馈标识进行匹配,得到通话音频的来电标识匹配结果。进而根据来电标识匹配结果,确定该通话音频的异常识别结果为异常还是非异常。
在本实施例中,当音频特征匹配结果为匹配成功时,通过继续将通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到通话音频的来电标识匹配结果;进而根据来电标识匹配结果,得到通话音频的异常识别结果,使得服务器能够借助异常反馈标识库进一步加深对通话音频的识别,有利于提高异常识别的准确性。
在一个实施例中,如图2所示,上述根据来电标识匹配结果,得到通话音频的异常识别结果,具体包括如下内容:
步骤S201,当来电标识匹配结果为匹配成功时,从异常反馈标识库中,获取与通话音频的来电标识匹配的目标异常反馈标识关联的身份信息。
具体地,若在异常反馈标识库中未检索到与该通信音频的来电标识相匹配的异常反馈标识,比如说在异常反馈标识库中没检索到与通信音频的来电号码一致的异常反馈的来电号码,则认为该来电标识匹配结果为匹配失败,服务器可确认该通信音频的异常识别结果为非异常。若在异常反馈标识库中检索到与该通信音频的来电标识相匹配的异常反馈标识,比如说在异常反馈标识库中检索到了与通信音频的来电号码一致的异常反馈的来电号码,则认为该来电标识匹配结果为匹配成功,服务器可将与通话音频的来电标识匹配的异常反馈标识设为目标异常反馈标识,然后从异常反馈标识库中,提取出目标异常反馈标识关联的所有身份信息。
步骤S202,若关联的身份信息的数量超过预设数量阈值,则确认通话音频的异常识别结果为异常。
其中,身份信息用于表示反馈信息的用户的身份。
步骤S203,若关联的身份信息的数量不超过预设数量阈值,则确认通话音频的异常识别结果为非异常。
具体地,在异常反馈标识库中,每个来电标识的身份信息还关联有来电时间,该来电时间表示对应的通话音频的反馈时间。服务器根据身份信息的来电时间,从目标异常反馈标识关联的所有身份信息中,筛选出来电时间位于预设时间范围的目标身份信息。服务器判断目标异常反馈标识所关联的目标身份信息的数量是否超过预设数量阈值,若关联的目标身份信息的数量超过预设数量阈值,则确认通话音频的异常识别结果为异常。而若关联的目标身份信息的数量不超过预设数量阈值,则确认通话音频的异常识别结果为非异常。
举例说明,假设预设数量阈值设置为3个,预设时间范围设置为近一年内,那么如果该来电号码最近一年内有超过3个不同的用户身份,则认为该通话音频的异常识别结果为异常。
本实施例中,通过判断是否在异常反馈标识库中检索到与该通信音频的来电标识相匹配的异常反馈标识,以及结合在预设时间范围内关联的身份信息的数量是否超过预设数量阈值,来全面分析判断通话音频关联的用户反馈信息是否为异常,实现了异常识别的多角度判断分析,增强了异常识别的准确性,从而提高了用户反馈信息的异常识别效果。
在一个实施例中,上述用户反馈信息的异常识别方法,还包括:获取通话音频的来电标识对应的反馈次数;当相似度小于预设相似度阈值,且反馈次数超过预设反馈次数阈值时,确定通话音频的异常识别结果为异常。
其中,反馈次数是指用户反馈信息的次数。以投诉业务为例,反馈次数可以是该用户投诉的总次数。
在实际应用中,仅依据用户本人的历史通话音频与当前通话音频之间的声纹对比相似度,就决定异常识别结果是否为异常,难以排除用户是否有委托亲朋好友代为反馈的正常情况。为进一步提高异常识别的准确性,还可以结合该用户的反馈次数进行全面分析。
具体地,服务器基于通话音频的来电标识,获取该来电标识对应的用户的反馈次数,进而判断其反馈次数是否超过预设反馈次数阈值,以及判断通话音频的用户声纹与历史通话音频的声纹之间的相似度是否超过预设相似度阈值。若相似度小于预设相似度阈值,并且反馈次数超过预设反馈次数阈值,则可确定通话音频的异常识别结果为异常。若相似度大于或等于预设相似度阈值,或者反馈次数未超过预设反馈次数阈值,则可继续执行上述步骤S103。
在本实施例中,在判断相似度是否小于预设相似度阈值的基础上,同时还判断用户的反馈次数是否超过预设反馈次数阈值,结合声纹相似度和反馈次数这两方面来综合确定该通话音频的异常识别结果是否为异常,提高了异常识别的准确性和可靠性。
在一个实施例中,在确认通话音频的异常识别结果为异常之后,还包括:将通话音频的音频特征存储至异常反馈语音库;将通话音频的来电标识和身份信息存储至异常反馈标识库。
在确认了该通话音频的异常识别结果为异常之后,服务器可以将该通话音频和该通话音频的来电标识分别注册到异常反馈语音库和异常反馈标识库中。具体地,服务器获取当前通话音频的音频特征,当前通话音频对应的用户的身份信息,当前通话音频的来电时间,然后将这些信息存储在异常反馈语音库中。此外,服务器获取当前通话音频的来电标识,以及当前通话音频对应的用户的身份信息和来电时间,然后将这些信息存储在异常反馈标识库中,其中,来电标识和身份信息相同的可以存储为一条记录。
举例说明,假设异常反馈标识库中来电号码A、身份信息B和来电时间C已经存储有一条记录了,若现又获得来电号码A、身份信息B和来电时间D,则可以将这两条信息存储为一条记录,即来电号码A、身份信息B、来电时间C和来电时间D。若是上述步骤S201至S203需要获取来电时间以筛选身份信息时,可以将最新的来电时间作为该身份信息的来电时间。比如说,来电时间C是昨天上午8点,来电时间D是今天上午9点,则该身份信息的来电时间取来电时间D。
在本实施例中,在确认了该通话音频的异常识别结果为异常之后,还将被识别为异常的通话音频和来电标识分别注册到异常反馈语音库和异常反馈标识库中,实现了异常反馈语音库和异常反馈标识库的数据更新,以便为后续的用户反馈信息的异常识别提供更丰富的音频和来电标识案例,从而不断地增强识别的准确性,大大提高了用户反馈信息的异常识别效果。
在一个实施例中,在确定通话音频的用户声纹与历史通话音频的声纹之间的相似度之前,还包括:根据通话音频的来电标识,获取通话音频的历史通话音频;对通话音频和历史通话音频分别进行声纹提取,得到通话音频的用户声纹和历史通话音频的声纹。
具体地,服务器对通话音频进行人声识别,得到通话音频中的人声音频;对人声音频进行声纹提取,得到用户声纹。进一步地,服务器还可以对用户声纹进行声纹特征提取,得到用户声纹特征。此外,服务器读取通话音频的来电标识,然后根据来电标识去历史通话音频库中查询该用户对应的历史通话音频。其中,历史通话音频是指能够确认是该来电标识对应的用户本人历史的真实通话音频;该历史通话音频可以是从其他业务的通话渠道。获取到的历史通话音频的数量可以是多个,则服务器分别对每个历史通话音频进行声纹提取和声纹特征提取处理,得到每个历史通话音频的声纹特征。将所有的历史通话音频的声纹特征构建为声纹特征集合,进而服务器可以将用户声纹特征分别与声纹特征集合中每个历史通话音频的声纹特征进行对比,以确定用户声纹特征与声纹特征集合中每个历史通话音频的声纹特征之间的相似度。
在本实施例中,先根据通话音频的来电标识,获取通话音频的历史通话音频,然后对通话音频和历史通话音频分别进行声纹提取,得到通话音频的用户声纹和历史通话音频的声纹,实现了当前来电的通话音频的用户人声声纹的提取,以及该用户在历史通话音频中的人声声纹的提取,为后续利用声纹进行相似度计算和异常识别判断奠定基础。
在一个实施例中,如图3所示,提供了另一种用户反馈信息的异常识别方法,以该方法应用于服务器为例进行说明,包括以下步骤:
步骤S301,获取来自用于用户反馈信息的通话渠道的通话音频。
步骤S302,根据通话音频的来电标识,获取通话音频的历史通话音频。
步骤S303,对通话音频和历史通话音频分别进行声纹提取,得到通话音频的用户声纹和历史通话音频的声纹。
步骤S304,确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;历史通话音频为通话音频的来电标识对应的历史通话音频。
步骤S305,若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果。
步骤S306,当音频特征匹配结果为匹配成功时,将通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到通话音频的来电标识匹配结果。
步骤S307,当来电标识匹配结果为匹配成功时,从异常反馈标识库中,获取与通话音频的来电标识匹配的目标异常反馈标识关联的身份信息。
步骤S308,若关联的身份信息的数量超过预设数量阈值,则确认通话音频的异常识别结果为异常。
步骤S309,若关联的身份信息的数量不超过预设数量阈值,则确认通话音频的异常识别结果为非异常。
上述用户反馈信息的异常识别方法,能够实现以下有益效果:无需人工对比通话音频,能够基于通话音频的声纹、异常反馈语音库中的异常反馈语音,自动实现用户反馈信息的异常识别,通过多因素多层面的对比分析,增强了异常识别的准确性,从而提高了用户反馈信息的异常识别效果。
为了更清晰阐明本公开实施例提供的用户反馈信息的异常识别方法,以下以一个具体的实施例对上述用户反馈信息的异常识别方法进行具体说明。如图4所示,提供了又一种用户反馈信息的异常识别方法,可以应用于服务器,具体包括如下内容:
以识别用户反馈信息中异常的代理投诉为例,收到用户的投诉后,获取用户的投诉通话录音。获取确认是用户本人的多个历史通话录音,从多个历史通话录音中提取出多个声纹并构建声纹集合。将投诉通话录音的用户声纹与声纹集合中的各个声纹做相似度比对,得到相似度;将相似度与预设相似度阈值比较。
当相似度小于预设相似度阈值时,认为该投诉通话录音是代理投诉。进一步地,将投诉通话录音的音频特征、用户的身份信息、最新的来电时间记录在异常反馈语音库中。同时,将当前投诉通话录音的来电号码、用户的身份信息、最新的来电时间记录在异常反馈标识库中,来电号码+客户身份相同的信息可存储为一条记录。
当相似度大于或者等于预设相似度阈值时,根据投诉通话录音的音频特征检索异常反馈语音库。若在异常反馈语音库中没检索到与该投诉通话录音的音频特征一致的音频特征,则认为该投诉通话录音不是代理投诉。若在异常反馈语音库中检索到与该投诉通话录音的音频特征相匹配的异常反馈音频的音频特征,则继续根据投诉通话录音的来电号码检索异常反馈标识库。若在异常反馈标识库中没检索到与通信音频的来电号码一致的异常反馈的来电号码,则认为该投诉通话录音不是代理投诉。若在异常反馈标识库中检索到了与通信音频的来电号码一致的异常反馈的来电号码,则判断该来电号码近一年内是否在异常反馈标识库中有记录超过3个不同的身份信息,若有,则认为该投诉通话录音是代理投诉,若没有,则认为该投诉通话录音不是代理投诉。
在本实施例中,能够实现以下有益效果:一方面,无需人工对比通话音频,能够基于通话音频的声纹、异常反馈语音库中的异常反馈语音,自动实现用户反馈信息的异常识别,通过多角度的对比分析,增强了异常识别的准确性。另一方面,实现了异常反馈语音库和异常反馈标识库的数据更新,以便为后续的用户反馈信息的异常识别提供更丰富的音频和来电标识案例,从而不断地增强识别的准确性,进一步提高了用户反馈信息的异常识别效果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的用户反馈信息的异常识别方法的用户反馈信息的异常识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个用户反馈信息的异常识别装置实施例中的具体限定可以参见上文中对于用户反馈信息的异常识别方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种用户反馈信息的异常识别装置500,包括:
音频获取模块501,用于获取来自用于用户反馈信息的通话渠道的通话音频。
声纹对比模块502,用于确定通话音频的用户声纹与历史通话音频的声纹之间的相似度;历史通话音频为通话音频的来电标识对应的历史通话音频。
特征匹配模块503,用于若相似度大于或者等于预设相似度阈值,则将通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到通话音频的音频特征匹配结果。
异常识别模块504,用于根据音频特征匹配结果,得到通话音频的异常识别结果。
在一个实施例中,异常识别模块504,还用于当音频特征匹配结果为匹配成功时,将通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到通话音频的来电标识匹配结果;根据来电标识匹配结果,得到通话音频的异常识别结果。
在一个实施例中,用户反馈信息的异常识别装置500还包括标识匹配模块,用于当来电标识匹配结果为匹配成功时,则从异常反馈标识库中,获取与通话音频的来电标识匹配的目标异常反馈标识关联的身份信息;若关联的身份信息的数量超过预设数量阈值,则确认通话音频的异常识别结果为异常;若关联的身份信息的数量不超过预设数量阈值,则确认通话音频的异常识别结果为非异常。
在一个实施例中,用户反馈信息的异常识别装置500还包括通话识别模块,用于获取通话音频的来电标识对应的反馈次数;当相似度小于预设相似度阈值,且反馈次数超过预设反馈次数阈值时,确定通话音频的异常识别结果为异常。
在一个实施例中,用户反馈信息的异常识别装置500还包括异常注册模块,用于将通话音频的音频特征存储至异常反馈语音库;将通话音频的来电标识和身份信息存储至异常反馈标识库。
在一个实施例中,用户反馈信息的异常识别装置500还包括声纹提取模块,用于根据通话音频的来电标识,获取通话音频的历史通话音频;对通话音频和历史通话音频分别进行声纹提取,得到通话音频的用户声纹和历史通话音频的声纹。
上述用户反馈信息的异常识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异常反馈音频和异常反馈标识等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户反馈信息的异常识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (15)
1.一种用户反馈信息的异常识别方法,其特征在于,所述方法包括:
获取来自用于用户反馈信息的通话渠道的通话音频;
确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音频特征匹配结果,得到所述通话音频的异常识别结果,包括:
当所述音频特征匹配结果为匹配成功时,将所述通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到所述通话音频的来电标识匹配结果;
根据所述来电标识匹配结果,得到所述通话音频的异常识别结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述来电标识匹配结果,得到所述通话音频的异常识别结果,包括:
当所述来电标识匹配结果为匹配成功时,从所述异常反馈标识库中,获取与所述通话音频的来电标识匹配的目标异常反馈标识关联的身份信息;
若关联的身份信息的数量超过预设数量阈值,则确认所述通话音频的异常识别结果为异常;
若关联的身份信息的数量不超过所述预设数量阈值,则确认所述通话音频的异常识别结果为非异常。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述通话音频的来电标识对应的反馈次数;
当所述相似度小于所述预设相似度阈值,且所述反馈次数超过预设反馈次数阈值时,确定所述通话音频的异常识别结果为异常。
5.根据权利要求3或4所述的方法,其特征在于,在确认所述通话音频的异常识别结果为异常之后,还包括:
将所述通话音频的音频特征存储至所述异常反馈语音库;
将所述通话音频的来电标识和身份信息存储至所述异常反馈标识库。
6.根据权利要求1所述的方法,其特征在于,在确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度之前,还包括:
根据所述通话音频的来电标识,获取所述通话音频的历史通话音频;
对所述通话音频和所述历史通话音频分别进行声纹提取,得到所述通话音频的用户声纹和所述历史通话音频的声纹。
7.一种用户反馈信息的异常识别装置,其特征在于,所述装置包括:
音频获取模块,用于获取来自用于用户反馈信息的通话渠道的通话音频;
声纹对比模块,用于确定所述通话音频的用户声纹与历史通话音频的声纹之间的相似度;所述历史通话音频为所述通话音频的来电标识对应的历史通话音频;
特征匹配模块,用于若所述相似度大于或者等于预设相似度阈值,则将所述通话音频的音频特征与异常反馈语音库中异常反馈音频的音频特征进行匹配,得到所述通话音频的音频特征匹配结果;
异常识别模块,用于根据所述音频特征匹配结果,得到所述通话音频的异常识别结果。
8.根据权利要求7所述的装置,其特征在于,所述异常识别模块,还用于当所述音频特征匹配结果为匹配成功时,将所述通话音频的来电标识与异常反馈标识库中的异常反馈标识进行匹配,得到所述通话音频的来电标识匹配结果;根据所述来电标识匹配结果,得到所述通话音频的异常识别结果。
9.根据权利要求8所述的装置,其特征在于,所述用户反馈信息的异常识别装置还包括标识匹配模块,用于当所述来电标识匹配结果为匹配成功时,则从所述异常反馈标识库中,获取与所述通话音频的来电标识匹配的目标异常反馈标识关联的身份信息;若关联的身份信息的数量超过预设数量阈值,则确认所述通话音频的异常识别结果为异常;若关联的身份信息的数量不超过所述预设数量阈值,则确认所述通话音频的异常识别结果为非异常。
10.根据权利要求7所述的装置,其特征在于,所述用户反馈信息的异常识别装置还包括通话识别模块,用于获取所述通话音频的来电标识对应的反馈次数;当所述相似度小于所述预设相似度阈值,且所述反馈次数超过预设反馈次数阈值时,确定所述通话音频的异常识别结果为异常。
11.根据权利要求9或10所述的装置,其特征在于,所述用户反馈信息的异常识别装置还包括异常注册模块,用于将所述通话音频的音频特征存储至所述异常反馈语音库;将所述通话音频的来电标识和身份信息存储至所述异常反馈标识库。
12.根据权利要求7所述的装置,其特征在于,所述用户反馈信息的异常识别装置还包括声纹提取模块,用于根据所述通话音频的来电标识,获取所述通话音频的历史通话音频;对所述通话音频和所述历史通话音频分别进行声纹提取,得到所述通话音频的用户声纹和所述历史通话音频的声纹。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311238133.8A CN117292712A (zh) | 2023-09-22 | 2023-09-22 | 用户反馈信息的异常识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311238133.8A CN117292712A (zh) | 2023-09-22 | 2023-09-22 | 用户反馈信息的异常识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117292712A true CN117292712A (zh) | 2023-12-26 |
Family
ID=89238382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311238133.8A Pending CN117292712A (zh) | 2023-09-22 | 2023-09-22 | 用户反馈信息的异常识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117292712A (zh) |
-
2023
- 2023-09-22 CN CN202311238133.8A patent/CN117292712A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10685657B2 (en) | Biometrics platform | |
US9361891B1 (en) | Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form | |
CN102985965B (zh) | 声纹标识 | |
US20160142534A1 (en) | Systems, methods, and media for determining fraud patterns and creating fraud behavioral models | |
CN105187674B (zh) | 服务录音的合规检查方法及装置 | |
CN107180029A (zh) | 一种基于咨询业务的信息处理方法及装置 | |
CN114579523A (zh) | 双录文件质检方法、装置、计算机设备和存储介质 | |
CN110310127B (zh) | 录音获取方法、装置、计算机设备及存储介质 | |
CN117292712A (zh) | 用户反馈信息的异常识别方法、装置和计算机设备 | |
CN110298543B (zh) | 业务跟踪方法、装置、计算机设备及存储介质 | |
US20240161131A1 (en) | Systems and methods for handling incoming calls | |
CN117435963B (zh) | 数字资产欺诈群体确定方法、装置、电子设备和存储介质 | |
CN117313058A (zh) | 信息的识别方法、装置、计算机设备和存储介质 | |
US20210358504A1 (en) | System and method for obtaining voiceprints for large populations | |
CN114662007B (zh) | 数据推荐方法、装置、计算机设备和存储介质 | |
CN113127673B (zh) | 一种声纹数据库的构建方法及其数据调用方法 | |
CN116957826A (zh) | 基于元宇宙的报销数据处理方法、装置和计算机设备 | |
CN116562878A (zh) | 身份验证方法、装置、计算机设备和存储介质 | |
CN117354422A (zh) | 服务辅助处理方法、装置、计算机设备和存储介质 | |
CN116484071A (zh) | 一种基于信息处理构建人机间信息系统交互的方法及系统 | |
CN117436057A (zh) | 安全验证方法、装置、计算机设备和存储介质 | |
CN117575607A (zh) | 交易风险识别方法、装置、计算机设备和存储介质 | |
CN116416066A (zh) | 交易系统中数据报送方法、装置和计算机设备 | |
CN117473433A (zh) | 对象数据的分析处理方法、装置、电子设备、介质及产品 | |
CN116860767A (zh) | 数据表更新存储方法、装置、电子装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |