CN103714817B - 基于声纹识别技术的满意度调查作弊排查方法 - Google Patents

基于声纹识别技术的满意度调查作弊排查方法 Download PDF

Info

Publication number
CN103714817B
CN103714817B CN201310754586.6A CN201310754586A CN103714817B CN 103714817 B CN103714817 B CN 103714817B CN 201310754586 A CN201310754586 A CN 201310754586A CN 103714817 B CN103714817 B CN 103714817B
Authority
CN
China
Prior art keywords
voice
reference speech
threshold value
cheating
dealer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310754586.6A
Other languages
English (en)
Other versions
CN103714817A (zh
Inventor
洪青阳
王胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XIAMEN TALENTEDSOFT CO Ltd
Original Assignee
XIAMEN TALENTEDSOFT CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XIAMEN TALENTEDSOFT CO Ltd filed Critical XIAMEN TALENTEDSOFT CO Ltd
Priority to CN201310754586.6A priority Critical patent/CN103714817B/zh
Publication of CN103714817A publication Critical patent/CN103714817A/zh
Application granted granted Critical
Publication of CN103714817B publication Critical patent/CN103714817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

基于声纹识别技术的满意度调查作弊排查方法,涉及声纹识别。语音文件预处理;建立模型,将基准语音对应模型与声纹库里的所有模型进行匹配,记录匹配得分最高的前N个语音文件和分数,再进行性别判断;根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录,再与基准语音提取出来采用另一种不同声纹识别方法进行确认,核查匹配得分是否大于阈值,若大于则保留;若小于则剔除,经确认核查后的相似组作为最终相似组提交,作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名、所属经销商、与基准语音相似的语音和所属经销商、相似程度得分等,若不存在相似组则说明不存在作弊的情况。

Description

基于声纹识别技术的满意度调查作弊排查方法
技术领域
本发明涉及声纹识别,尤其涉及一种基于声纹识别技术的满意度调查作弊排查方法。
背景技术
要了解产品的好坏以及经销商的服务质量,需要统计用户对产品和服务质量的满意度。厂商在渠道管理方面的工作之一便是针对经销商的服务,对用户进行满意度调查。考核结果将直接与经销商的利益相关,因为厂商会参考考核分数来决定经销商的返利。而某些发生冲突或不满意用户的调查,会直接影响经销商在用户满意度调查方面的最终得分,所以经销商在给厂商的客户档案里会有意的回避或造假,如提报不及时,提报数量不全,字段内容不完整或填写不规范、联系电话错误或直接被替换等。
目前,核查被替换联系电话的方法多数为数据库核查,核查电话取证等,但随着经销商反核查能力的提升,传统的核查方法面临严峻的挑战,特别是靠人工辨听录音,非常耗时,而且很有可能误判。而声纹识别可以很好解决人工核查成本高、核查周期长、经销商反核查能力提升的问题,真正有效地将经销商找人冒充受访者的实际情况排查出来,巩固客户资料的真实性,以达到“去伪存真”,赏罚分明的目标。
发明内容
本发明要解决的技术问题是提供一种基于声纹识别技术的满意度调查作弊排查方法,以解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度。
本发明包括以下步骤:
1)语音预处理
将用户满意度调查的语音文件进行建模前的预处理,其中包括录音文件去铃声、静音去除、格式转化、根据经销商提供的语音数据清单将录音文件分配到各自经销商文件夹下等过程;
2)声纹识别粗选
(1)将经过预处理的语音文件作为基准语音提取特征,建立模型;
(2)建立模型完成后,将基准语音对应模型与声纹库里的所有模型进行一一匹配,并记录下匹配得分最高的前N个语音文件和分数;
(3)对基准语音中的用户进行性别判断,并记录下该基准语音的性别;
(4)根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录;
3)识别结果确认核查
将声纹识别粗选得到的语音记录对应的语音文件和基准语音提取出来采用另一种不同的声纹识别方法进行确认,核查此次过程中该条语音模型与基准语音的匹配得分是否大于阈值,若大于阈值,则该条语音记录保留;若得分小于阈值,则该条语音记录将会被剔除,最终经过确认核查后的相似组作为最终的相似组提交;
4)核查认证报告
经过识别结果确认核查后的相似组作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名,所属经销商,与基准语音相似的语音和所属经销商,相似程度得分等详细情况,若不存在相似组,则说明不存在作弊的情况。
在步骤2第(2)部分中,所述N可为100。
本发明解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度。
附图说明
图1为基于声纹识别系统的满意度调查作弊排查系统的结构示意图;
图2为系统语音预处理的流程示意图;
图3为系统声纹识别粗选的流程示意图;
图4为系统识别结果确认核查的流程示意图;
图5为系统核查认证报告的流程示意图。
具体实施方式
为使本发明上述的目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步的详细说明。
本发明的核心思想在于,提供了一种基于声纹识别技术的满意度调查作弊排查方法,包括:语音预处理,用于将满意度调查时的录音文件进行处理,得到便于系统进行识别的语音文件;声纹识别粗选,这是本系统的核心,利用特征提取、建模、模式匹配、性别判断、得分阈值等条件筛选出出声纹模型库中是否存在与基准语音的相似语音;识别结果确认核查,为提高核查的准确性,将相似语音与和基准语音采取另一种不同的声纹识别方法进行确认,此过程中的得分如果大于经验阈值,则该记录保留,如果小于经验阈值,则该记录被剔除;核查认证报告,用于将核查出的作弊情况生成认证报告的过程。本发明能够解决人工核查成本高、核查周期长、经销商反核查能力提升的问题,真正有效的将经销商找人冒充受访者的现实情况排查出来,巩固客户资料的真实性,以达到赏罚分明的目标。
图1表示本发明基于声纹识别系统的满意度调查作弊排查系统的结构示意图,具体包括:
语音预处理S10,用于将满意度调查时的录音文件进行处理,得到便于系统进行识别的语音文件;
声纹识别粗选S20,这是本系统的核心,利用特征提取、建模、模式匹配、性别判断、得分阈值等条件筛选出出声纹模型库中是否存在与基准语音的相似语音;
识别结果确认核查S30,为提高核查的准确性,将相似语音与和基准语音采取另一种不同的声纹识别方法进行确认,此过程中的得分如果大于经验阈值,则该记录保留,如果小于经验阈值,则该记录被剔除;
核查认证报告S40,用于将核查出的作弊情况生成认证报告的过程。
系统在语音处理步骤如图2所示:
步骤S101中,系统对满意度调查语音进行去除铃声处理,排除语音文件中夹杂铃声,电话系统播报声对后续识别效果的影响。
步骤S102中,将S101中去除铃声后的语音文件,转换为系统处理的标准语音文件格式。
步骤S103中,将语音进行去除静音处理,减少无关因素对识别速度的影响。
步骤S104中,将上述处理过的语音文件按照经销商提供的语音清单进行分类,分别将语音文件分配到经销商对应的文件夹中。
系统在声纹识别粗选步骤如图3:
步骤S201中,对基准语音进行特征提取,根据特征建立基准语音的模型。
模型建立后,在步骤S202中,将基准语音模型与声纹库中的模型进行一一匹配,分别得到匹配得分,为处理更加高效,系统保存所有得分从高到低的前N个(例如N为100)。
步骤S203中,根据语音特征,对基准语音进行性别判断,得到基准语音的性别。
步骤S204中,根据步骤S202中的得分和步骤S203中的性别,对得分文件进行剔除,删除点文件中性别与基准语音不一致,匹配得分小于阈值的相似语音记录。
系统在识别结果确认核查步骤如图4:
步骤S301中,提取相似语音和基准语音文件。
步骤S302中,采取不同于声纹识别粗选S20的声纹识别方法对相似语音和基准语音进行相似性确认,得到确认分数。
步骤S303中,判断得到的确认分数是否大于相似性阈值,如果得分大于阈值,则确认与基准语音的相似性,如果得分小于阈值,则认为两者相似程度不高。
步骤S304中,根据步骤S303的判断结果,对步骤S204得到的相似组进行剔除,得到最终的相似组记录。
系统在核查认证报告步骤如图5:
步骤S401中,系统根据经销商提供的语音清单文件,查找基准语音对应的经销商标号,确定该条作弊语音所属的经销商。
步骤S402中,系统根据经销商提供的语音清单文件,查找与基准语音的相似语音所属的经销商编号和得分,确定与基准语音存在作弊情况的经销商。
步骤S403中,生成认证报告,在报告中给出存在满意度调查作弊的经销商标号,作弊语音编号与名称,与该条语音相似的语音编号与名称以及所属经销商标号。
总之,本发明提供了一种基于声纹识别技术的满意度调查和服务质量作弊行为排查系统,以解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度,通过系统的语音预处理,声纹识别粗选,识别结果确认核查,核查认证报告,有效地解决了排查人力成本高、周期长、安全可靠性差的问题,系统不仅具有很强的高效和实用性,同时具有很高的准确性。
本发明不局限与上述实施方式,对于本领域的普通技术人员而言,对上述实施方式所做出的任何显而易见的改进或变更,都应包含在本发明的保护范围内。

Claims (2)

1.基于声纹识别技术的满意度调查作弊排查方法,其特征在于包括以下步骤:
1)语音预处理
将用户满意度调查的语音文件进行建模前的预处理,其中包括录音文件去铃声、静音去除、格式转化、根据经销商提供的语音数据清单将录音文件分配到各自经销商文件夹下过程;
2)声纹识别粗选
(1)将经过预处理的语音文件作为基准语音提取特征,建立模型;
(2)建立模型完成后,将基准语音对应模型与声纹库里的所有模型进行一一匹配,并记录下匹配得分最高的前N个语音文件和分数;
(3)对基准语音中的用户进行性别判断,并记录下该基准语音的性别;
(4)根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录;
3)识别结果确认核查
将声纹识别粗选得到的语音记录对应的语音文件和基准语音提取出来核查该条语音与基准语音的匹配得分是否大于阈值,若大于阈值,则该条语音记录保留;若得分小于阈值,则该条语音记录将会被剔除,最终经过确认核查后的相似组作为最终的相似组提交;
4)核查认证报告
经过识别结果确认核查后的相似组作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名,所属经销商,与基准语音相似的语音和所属经销商,相似程度得分情况,若不存在相似组,则说明不存在作弊的情况。
2.如权利要求1所述基于声纹识别技术的满意度调查作弊排查方法,其特征在于在步骤2)第(2)部分中,所述N为100。
CN201310754586.6A 2013-12-31 2013-12-31 基于声纹识别技术的满意度调查作弊排查方法 Active CN103714817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310754586.6A CN103714817B (zh) 2013-12-31 2013-12-31 基于声纹识别技术的满意度调查作弊排查方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310754586.6A CN103714817B (zh) 2013-12-31 2013-12-31 基于声纹识别技术的满意度调查作弊排查方法

Publications (2)

Publication Number Publication Date
CN103714817A CN103714817A (zh) 2014-04-09
CN103714817B true CN103714817B (zh) 2016-03-23

Family

ID=50407723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310754586.6A Active CN103714817B (zh) 2013-12-31 2013-12-31 基于声纹识别技术的满意度调查作弊排查方法

Country Status (1)

Country Link
CN (1) CN103714817B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105656887A (zh) * 2015-12-30 2016-06-08 百度在线网络技术(北京)有限公司 基于人工智能的声纹认证方法以及装置
CN108281144B (zh) * 2018-01-23 2020-12-08 浙江国视科技有限公司 一种语音识别方法和系统
CN109243465A (zh) * 2018-12-06 2019-01-18 平安科技(深圳)有限公司 声纹认证方法、装置、计算机设备以及存储介质
CN111063359B (zh) * 2019-12-24 2022-03-18 太平金融科技服务(上海)有限公司 电话回访有效性判别方法、装置、计算机设备和介质
CN114066378A (zh) * 2020-08-05 2022-02-18 中国联合网络通信集团有限公司 满意度调查的方法和装置
CN112102854A (zh) * 2020-09-22 2020-12-18 福建鸿兴福食品有限公司 一种录音过滤方法、装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808567A (zh) * 2006-01-26 2006-07-26 覃文华 验证真人在场状态的声纹认证设备和其认证方法
JP2006208483A (ja) * 2005-01-25 2006-08-10 Sony Corp 聴取者の関心事項の調査を支援する装置,方法,プログラム及び記録媒体
CN102142254A (zh) * 2011-03-25 2011-08-03 北京得意音通技术有限责任公司 基于声纹识别和语音识别的防录音假冒的身份确认方法
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7940897B2 (en) * 2005-06-24 2011-05-10 American Express Travel Related Services Company, Inc. Word recognition system and method for customer and employee assessment
US8086461B2 (en) * 2007-06-13 2011-12-27 At&T Intellectual Property Ii, L.P. System and method for tracking persons of interest via voiceprint

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006208483A (ja) * 2005-01-25 2006-08-10 Sony Corp 聴取者の関心事項の調査を支援する装置,方法,プログラム及び記録媒体
CN1808567A (zh) * 2006-01-26 2006-07-26 覃文华 验证真人在场状态的声纹认证设备和其认证方法
CN102142254A (zh) * 2011-03-25 2011-08-03 北京得意音通技术有限责任公司 基于声纹识别和语音识别的防录音假冒的身份确认方法
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统

Also Published As

Publication number Publication date
CN103714817A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103714817B (zh) 基于声纹识别技术的满意度调查作弊排查方法
US10446150B2 (en) In-vehicle voice command recognition method and apparatus, and storage medium
KR101908711B1 (ko) 인공 지능을 기반으로 하는 성문 로그인 방법 및 장치
CN105374356B (zh) 语音识别方法、语音评分方法、语音识别系统及语音评分系统
JP6344696B2 (ja) 声紋認証方法および装置
CN105933323B (zh) 声纹注册、认证方法及装置
CN104903954B (zh) 使用基于人工神经网络的亚语音单位区分的说话人验证及识别
CN108735200B (zh) 一种说话人自动标注方法
CN109902957B (zh) 一种数据处理方法和装置
CN105656887A (zh) 基于人工智能的声纹认证方法以及装置
CN104143326A (zh) 一种语音命令识别方法和装置
CN107305541A (zh) 语音识别文本分段方法及装置
CN108447471A (zh) 语音识别方法及语音识别装置
CN102402985A (zh) 提高声纹识别安全性的声纹认证系统及其实现方法
CN102708867A (zh) 一种基于声纹和语音的防录音假冒身份识别方法及系统
CN103426428A (zh) 语音识别方法及系统
CN104427109B (zh) 使用语音创建联系人项的方法及电子设备
US8589162B2 (en) Method, system and computer program for enhanced speech recognition of digits input strings
CN104183238A (zh) 一种基于提问应答的老年人声纹识别方法
CN103778917B (zh) 一种在电话满意度调查中检测身份冒充的系统与方法
CN111081260A (zh) 一种唤醒词声纹的识别方法及系统
CN109062944A (zh) 一种基于语音搜索的生字词巩固方法及电子设备
CN113535925A (zh) 语音播报方法、装置、设备及存储介质
CN106782567A (zh) 建立声纹模型的方法和装置
CN113158958A (zh) 通行方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant