CN112511696A - 呼叫中心ai引擎不良内容鉴别系统及方法 - Google Patents
呼叫中心ai引擎不良内容鉴别系统及方法 Download PDFInfo
- Publication number
- CN112511696A CN112511696A CN202011252654.5A CN202011252654A CN112511696A CN 112511696 A CN112511696 A CN 112511696A CN 202011252654 A CN202011252654 A CN 202011252654A CN 112511696 A CN112511696 A CN 112511696A
- Authority
- CN
- China
- Prior art keywords
- call
- call center
- quality inspection
- recording
- platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000007689 inspection Methods 0.000 claims abstract description 99
- 238000005070 sampling Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 210000001503 joint Anatomy 0.000 claims abstract description 7
- 238000005516 engineering process Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 13
- 230000011664 signaling Effects 0.000 claims description 12
- 238000011217 control strategy Methods 0.000 claims description 10
- 238000012372 quality testing Methods 0.000 claims description 7
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 35
- 238000012545 processing Methods 0.000 description 24
- 238000003908 quality control method Methods 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 12
- 238000003058 natural language processing Methods 0.000 description 10
- 238000012552 review Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2218—Call detail recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
- H04L67/025—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种呼叫中心AI引擎不良内容鉴别系统及方法,该系统包括呼叫中心运营管理系统、呼叫接入和管控平台、语音质检平台,呼叫中心运营管理系统用于对呼叫中心进行全生命周期管理,呼叫接入和管控平台用于与呼叫中心对接,对呼叫做拦截或放通处理,对呼叫全量或抽检录音,将呼叫记录、录音文件传给语音质检平台;语音质检平台检测录音并将检测结果传给呼叫中心运营管理系统。本发明的呼叫中心AI引擎不良内容鉴别系统及方法能够规范呼叫中心的营销外呼业务,强化呼叫业务管控,同时根据呼叫中心企业的信誉度对通话按设定的抽样比例录音,利用AI语音识别、大数据分析等技术手段,对呼叫中心外呼话务进行自动质检,提升质检工作效率。
Description
技术领域
本发明涉及电信技术领域,具体来说,涉及一种呼叫中心AI引擎不良内容鉴别系统及方法。
背景技术
近年来,未经用户同意或请求,拨打电话进行商业营销、恶意骚扰甚至进行诈骗等不法行为的问题日益突出,严重影响了广大人民群众的正常生活,甚至存在安全隐患。
为推进骚扰电话治理工作,净化通信服务环境,保障用户合法权益,工业和信息化部等13部委联合制定《综合整治骚扰电话专项行动方案》,要求全面规范营销外呼业务,要对企业经营资质、自营和外包业务进行全面规范,开展商业营销外呼的,应当征得用户同意,用户明确拒绝的不得再次拨打,应规范营销外呼行为的外呼时段、行为等,不得对用户正常生活造成影响。
目前针对呼叫中心不良内容鉴别方法主要集中在如下几种:
(1)人工质检识别:呼叫中心运营者成立专门的质检小组,安排人员去听呼叫中心客服坐席通话录音,通过人工去辨别通话中是否存在回答模糊不清、情绪不当、回答错误、含有敏感词等情况,以这种人工的形式来进行质检,效率非常低,也会占用很高的人力成本。
(2)基于音频指纹技术识别:先将音频转为频谱图,然后通过滤波器的方式提取出频谱图中每一帧的所有局部最大点,也就是所有的峰值点,这些峰值点被称为指纹,将所有指纹点转为HASH值,每一帧中会含有多个指纹点,这些指纹点所属的帧数以及所属的音频ID将会被记录。提取模板音频的音频指纹,得到模板音频的所有指纹点HASH值,以及每个指纹点对应所属的帧数和对应所属的音频ID,将三个值以键值对的方式保存到数据库当中,键为当前指纹点的HASH值,值为当前指纹点所属的音频ID和所属的帧数。提取当前待搜索音频的音频指纹,将该音频的每一帧中的所有指纹点HASH值与每个模板音频每一帧的所有指纹点HASH值进行比对,统计相同的指纹点的数量,该数量即为当前待搜音频的该帧与当前模板音频的当前帧的相似度,统计当前待搜音频的所有连续帧与当前模板音频的所有连续的相似度之后,如果某一段连续帧的相似度大于设定的阈值,那么系统就判断当前待搜音频出现在模板音频的连续帧片段中。
以上方法均有一些缺陷,具体如下:
面对传统专线语音线路使用量大,使用频次高,客户众多,传统的人工质检工作面对这种只能采用少量抽检的方式来进行,无法做到大规模覆盖。很难及时有效的发现使用过程中违法违规行为,给话路的管理带来了极大的隐患。
基于音频指纹技术识别需要提供大量的模板音频,由于人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官:舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。这样极有可能出现不同的人说的都是模板中的语言,但由于声纹图谱的差异,不一定都能比对成功。
发明内容
为了解决人工质检带来的人力不足和音频指纹技术比对成功率低问题,本发明提出一种呼叫中心AI引擎不良内容鉴别系统及方法,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种呼叫中心AI引擎不良内容鉴别系统,包括:呼叫中心运营管理系统、呼叫接入和管控平台、语音质检平台,其中,
所述呼叫中心运营管理系统,用于对呼叫中心进行全生命周期管理,其中,所述全生命周期管理包括:建立企业信息数据库,制定呼叫管控策略、录音策略,对敏感词或违禁词进行增、删、改、查,企业话术模板管理,质检记录查询,质检管理,统计报表,以及编辑管控指令并将管控指令传给所述呼叫接入和管控平台;
所述呼叫接入和管控平台,用于与呼叫中心对接,接入呼叫中心的所有话务,按呼叫管控策略对呼叫做拦截或放通处理,根据录音策略对呼叫全量或抽检录音,以及将呼叫记录和录音文件传给所述语音质检平台;
所述语音质检平台,采用ASR技术对录音文件进行处理,将语音转换为文本,基于转换后的文本检测录音与报备话术是否相一致,是否包含违禁词或敏感词,并将检测结果传给所述呼叫中心运营管理系统。
进一步地,所述企业信息数据库包含企业名称、行业、外呼号码、企业信誉度。
进一步地,所述呼叫管控策略包括设置主叫黑白名单、被叫黑白名单。
进一步地,所述录音策略包括设置随机抽样录音的比例、设置各个企业信誉度的录音比例、设置录音号码、录音次数及录音时长。
进一步地,所述检测结果包括检测时间、呼叫时间、主被叫号码、话术模板匹配结果、检出的违禁词及出现次数。
根据本发明的另一方面,提供了一种呼叫中心AI引擎不良内容鉴别方法,包括如下步骤:
S1运营商接入网和核心网将呼叫中心的话务路由指向所述呼叫中心AI引擎不良内容鉴别系统;
S2所述呼叫接入和管控平台对SIP信令进行解析,提取主被叫号码,将主被叫号码和系统设置的主被叫黑白名单进行比对,如果主被叫号码在主被叫黑名单中则拦截呼叫,如果主被叫号码在主叫白名单中则放通呼叫,其余呼叫均放通并根据采样录音策略进行录音;
S3所述呼叫接入和管控平台将话单文件和录音文件定时推送至语音质检平台;
S4所述语音质检平台对录音文件进行离线语音识别、关键字匹配和话术模板匹配,生成语音质检结果;
S5所述语音质检平台将质检结果推送给所述呼叫中心运营管理系统,通过所述呼叫中心运营管理系统进行质检记录查询、质检任务指派、质检绩效管理。
进一步地,所述方法还包括:
S6通过所述呼叫中心运营管理系统进行录音回放,人工复检,将违规主叫加入黑名单。
进一步地,所述语音识别是采用ASR技术对录音文件进行处理,将语音转换为文本,原始语音输入后,首先要对输入的语音进行预处理,然后提取语音特征,在此基础上建立语音识别所需的模板,在识别过程中要根据语音识别的模型,将系统中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板,然后根据此模板的定义,通过查表就可以给出识别结果。
进一步地,所述话术模板匹配是通过NLP技术比较实际通话获取的文本与事先报备的话术文本之间的相似性,如果相似度较高,则可以认为实际通话内容与报备内容符合。
其中:
呼叫中心:是在一个相对集中的场所,由一批服务人员组成的服务机构.通常利用计算机通信技术,处理来自企业、顾客的电话垂询,尤其具备同时处理大量来话的能力,可将来电自动分配给具备相应技能的人员处理,并能记录和储存所有来话信息。
主叫:电话的发起方。
被叫:电话的接收方。
AI:Artificial Intelligence,人工智能,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
ASR:Automatic Speech Recognition,自动语音识别技术,是一种将人的语音转换为文本的技术。
NLP:Natural Language Processing,自然语言处理,是研究计算机处理人类语言的一门技术,是AI的一个子领域。
本发明的有益效果:本发明的呼叫中心AI引擎不良内容鉴别系统及方法利用AI语音识别技术和大数据分析技术进行智能质检,节省大量的人力成本和运营成本;支持云上虚拟化部署,符合网络演进方向,在电信运营商部署之后,实现实时呼叫控制功能,实时拦截违规呼叫,处理效率高;
使用ASR和NLP等先进的AI处理技术,实现语音转文本、句法分析、自动分词、信息检索、信息抽取、话术匹配,通过AI智能质检实现对呼叫中心话务进行大规模抽检覆盖,对通话中包含的关键字及出现次数自动统计生成质检结果,大大节省了质检人力和质检员的工作量;经过AI质检系统完成违规预判后,为质检员人工质检提供重要的数据参考,从而提升质检工作效率;
灵活方便,管理员随时可以登录WEB界面修改黑白名单设置、上传话术模板,设定后实时生效;同时还能结合每个客户主叫报备的话术,对不符合话术规则的通话自动检出,实现个性化的质检服务,统计功能和报表功能便于质检管理和绩效管理,从而提升管理水平;
质检员能够基于AI引擎预判的结果进行录音回放,完成人工复检,从而扩大了质检覆盖范围、解放了大量质检人力,提升了质检工作效率,为呼叫中心和企业提供了一个智能高效的呼叫管控手段。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的呼叫中心AI引擎不良内容鉴别系统的结构框图;
图2是根据本发明实施例所述的语音质检平台系统架构图;
图3是根据本发明实施例所述的利用呼叫中心AI引擎不良内容鉴别系统的鉴别方法流程图;
图4是根据本发明实施例所述的呼叫中心AI引擎不良内容鉴别系统的软件模块架构图;
图5是根据本发明实施例所述的语音识别的流程图;
图6是根据本发明实施例所述的语音识别的原理图;
图7是根据本发明实施例所述的自然语言处理的原理图;
图8是根据本发明实施例所述的系统接口的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的呼叫中心AI引擎不良内容鉴别系统,包括:呼叫中心运营管理系统、呼叫接入和管控平台、语音质检平台,其中,呼叫中心运营管理系统也就是提供给系统管理员的管理WEB,负责对呼叫中心进行全生命周期管理,包括:建立企业信息数据库和数据库的增、删、改、查等操作,制定呼叫管控策略、录音策略,对敏感词或违禁词进行增、删、改、查,企业话术模板管理(包含企业话术模板的上传、下载),质检记录查询,质检管理,统计报表,以及编辑管控指令并将管控指令传给所述呼叫接入和管控平台;
所述呼叫接入和管控平台,用于与呼叫中心对接,接入呼叫中心的所有话务,按呼叫管控策略对呼叫做拦截或放通处理,根据录音策略对呼叫全量或抽检录音,以及将呼叫记录和录音文件传给所述语音质检平台;
所述语音质检平台系统架构如图2所示,采用ASR技术对录音文件进行处理,将语音转换为文本,基于转换后的文本检测录音与报备话术是否相一致,是否包含违禁词或敏感词,并将检测结果传给所述呼叫中心运营管理系统。
所述企业信息数据库包含企业名称、行业、外呼号码、企业信誉度等。所述呼叫管控策略包括设置主叫黑白名单、被叫黑白名单等。所述录音策略包括设置随机抽样录音的比例、设置各个企业信誉度的录音比例、设置录音号码、录音最大次数及录音时长等。
所述质检管理包括语音质检结果查询统计、质检任务指派、质检员复核、质检绩效管理。所述统计报表包括话务统计报表、质检报表。
所述检测结果包括检测时间、呼叫时间、主被叫号码、话术模板匹配结果、检出的违禁词及出现次数。
在具体使用时:呼叫中心管理员建立接入本呼叫中心的所有企业信息数据库,通过WEB界面设置呼叫控制策略、录音抽样策略,通过WEB界面管理系统敏感词和违禁词和企业对应的话术模板。系统的呼叫接入和管控平台基于管控策略对呼叫进行实时的拦截/放通处理,基于录音策略,对呼叫进行录音采样,将录音文件传至系统后端,由AI语音识别引擎将语音文件转写成文本。语音质检平台对转换后的文本进行违禁词/敏感词匹配和话术匹配,输出质检结果。质检组长将语音质检平台生成质检记录分配给质检组员进行录音回放、人工复检,通过WEB界面查看质检员任务完成情况,查看已审核和未审核的任务详情及复检结果,对质检员进行绩效管理。
如图3所示,采用上述呼叫中心AI引擎不良内容鉴别系统的鉴别方法,包括如下步骤:
S1运营商接入网和核心网将呼叫中心的话务路由指向所述呼叫中心AI引擎不良内容鉴别系统;
S2所述呼叫接入和管控平台对SIP信令进行解析,提取主被叫号码,将主被叫号码和系统设置的主被叫黑白名单进行比对,如果主被叫号码在主被叫黑名单中则拦截呼叫,如果主被叫号码在主叫白名单中则放通呼叫,其余呼叫均放通并根据采样录音策略进行录音;
S3所述呼叫接入和管控平台将话单文件和录音文件定时推送至语音质检平台;
S4所述语音质检平台对录音文件进行离线语音识别、关键字匹配和话术模板匹配,生成语音质检结果;
S5所述语音质检平台将质检结果推送给所述呼叫中心运营管理系统,通过所述呼叫中心运营管理系统进行质检记录查询、质检任务指派、质检绩效管理。
S6通过所述呼叫中心运营管理系统进行录音回放,人工复检,将违规主叫加入黑名单。
所述语音识别是采用ASR技术对录音文件进行处理,将语音转换为文本,原始语音输入后,首先要对输入的语音进行预处理,然后提取语音特征,在此基础上建立语音识别所需的模板,在识别过程中要根据语音识别的模型,将系统中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板,然后根据此模板的定义,通过查表就可以给出识别结果。
所述话术模板匹配是通过NLP技术比较实际通话获取的文本与事先报备的话术文本之间的相似性,如果相似度较高,则可以认为实际通话内容与报备内容符合。
所述呼叫中心AI引擎不良内容鉴别系统的软件模块架构如图4所示,所述呼叫中心AI引擎不良内容鉴别系统的主要功能包括:
1)SIP信令接入功能
呼叫中心AI引擎不良内容鉴别系统与IMS网络采用标准ISC接口对接,获取SIP信令。平台支持SIP协议规程的多个版本,可按照网络发送过来的应用上下文确定协议使用的版本,并进行相应的处理。
系统对ISC口接收到数据包进行解析,包含:
(1)INVITE消息解析处理:对SIP协议INVITE消息包进行解析,提取主叫、被叫、时间等关键信息。
(2)Trying消息解析处理:对SIP协议Trying消息解析处理,提取相关所需信息。
(3)Ringing消息解析处理:对SIP协议Ringing消息解析处理,提取相关所需信息。
(4)PRACK消息解析处理:对SIP协议PRACK消息解析处理,提取相关所需信息。
(5)ACK消息解析处理:对SIP协议ACK消息解析处理,提取相关所需信息。
(6)SIP 主叫挂机解析处理:对SIP协议SIP 主叫挂机消息解析处理,提取相关所需信息。
(7)SIP 被叫挂机解析处理:对SIP协议SIP 被叫挂机消息解析处理,提取相关所需信息。
2)媒体流接入和录音功能
当通话需要录音时,SCP修改SDP消息体,控制MGW发起媒体重协商,将主被叫媒体桥接至媒体服务器MS进行录音。每一次通话将会产生一个录音文件,录音文件按照统一的规则命名并自动保存在录音文件服务器中,供语音质检平台的AI分析模块离线分析。整个录音过程不影响通话的正常进行,客户无感知。
3)呼叫控制功能
呼叫中心AI引擎不良内容鉴别系统支持的呼叫控制功能主要包含:主叫白名单放通免质检功能、主叫黑名单拦截功能、被叫黑名单拦截功能、录音控制功能。
系统具备的开放性和可扩展性,后续可根据客户需要扩展更多的新功能。
(1)主叫白名单放通免质检功能
系统管理员可以将呼叫中心接入内部号码(如10000、10086等)、可信度高的企业号码(如国有银行、航空等)、政府公众服务号(如12345、110等)加入到主叫白名单。当系统接收到话务信令后,呼叫接入模块对信令进行解析,提取主叫号码。呼叫控制模块查询主叫白名单库,如果主叫在主叫白名单库中,本次通话不做质检,直接放通。
(2)主叫黑名单拦截功能
系统管理员可以将违规号码加入主叫黑名单,质检员在完成复检后,也可以将号码加入到主叫黑名单。号码加入主叫黑名单后,其发起的呼叫将会被拦截。主叫黑名单可以根据需要设置有效期,即限呼时长。
当系统接收到话务信令后,呼叫接入模块对信令进行解析,提取主叫号码。呼叫控制模块查询主叫黑名单库,如果主叫号码在主叫黑名单库中,直接拦截该话务。
(3)被叫黑名单拦截功能
系统管理员可将不允许呼叫中心呼叫的号码加入被叫黑名单,如110、119、120等。当系统接收到话务信令后,呼叫接入模块对信令进行解析,提取被叫号码。呼叫控制模块查询被叫黑名单库,如果被叫号码在被叫黑名单号码库中直接拦截该话务。
(4)录音控制功能
在业务执行过程中,呼叫控制模块根据策略通知媒体服务器MS录音。系统支持的录音策略包含:
a.随机抽样录音,随机抽样录音没有具体的录音号码,系统管理员只需要设定抽样比例,呼叫控制模块对接入系统的话务按比例随机录音。
b.指定号码录音,系统将可疑号码加入录音号码表中,指定录音次数、录音时长等。在业务执行过程中,呼叫控制模块查询录音号码表,对录音号码发起的呼叫根据策略要求媒体服务器MS录音。
c.按信誉度抽样录音,系统不指定录音号码,只需设置企业信誉度和录音比例的对应关系。一般情况下,企业信誉度高的录音比例低,企业信誉度低的录音比例高。在业务执行过程中,呼叫控制模块查询主叫号码所属企业的信誉度,根据不同的企业信誉度抽样录音。
4)语音质检功能
(1)语音识别
该系统采用ASR(Automatic Speech Recognition 自动语音识别)技术实现对录音文件进行处理,将语音转换为文本。
如图5-6所示,原始语音输入后,首先要对输入的语音进行预处理,然后提取语音特征,在此基础上建立语音识别所需的模板。AI识别引擎在识别过程中要根据语音识别的模型,将系统中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出识别结果。
(2)违禁词/敏感词匹配功能
系统支持在词库中配置敏感词和违禁词,如果在文本中发现了敏感词和违禁词,则给出告警提示和次数标记。
AI 语音识别引擎将语音转换为文本后,分析模块将识别出的文本和系统配置的敏感词进行匹配,匹配成功后给出告警提示,并列出匹配的敏感词和出现次数。
(3)话术模板匹配功能
话术作为签约用户和运营商交互载体,同时也是我们系统质检的评判依据,其作用非常重要。因此,签约企业对外呼话务的话术进行规范化设计,并报备给运营商,作为话术理解凭据。企业可以为自身的外呼话务配置一种或多种类型的话术模板,用于规范外呼行为。当企业号码通过呼叫中心发生外呼时,系统将外呼号码和话术模板进行话术匹配,匹配失败则给出告警。
如图7所示,该系统通过NLP(Natural Language Processing自然语言处理)技术解决实际通话获取的文本与事先报备的话术文本之间相似性比较问题,如果相似度较高,则可以认为实际通话内容与报备内容符合。
5)质检任务管理功能
AI语音质检引擎通过专业的质检体系来实现语音转文本,还可以智能识别违禁词、敏感词汇,进行录音筛查,帮助质检员快速精准锁定问题录音。大量的语音文件经由语音识别以及句法语义分析,生成质检结果,此结果可能存在一定的误差,系统预判后的结果可以作为质检的重要依据,但对违规号码进行限呼或对企业进行违规考核需通过质检员人工复核才能后才能确定。因此,人工复核的工作量也很大,不可能独立完成,需要多名质检员协同工作。语音质检任务管理模块用来实现质检任务指派、质检员复核、质检员绩效管理等功能。
(1)任务指派
质检组长可以查看所有的AI质检结果,系统支持按呼叫中心、按时间段、按企业、按企业类型、按关键字类型等将语音复核任务分配给某一质检员,同时记录质检任务指派的时间和指派的质检员。
(2)质检复核
质检员登录系统后,可以查看质检组长指派给本人的质检任务。质检任务实质上是AI语音质检引擎产生的质检记录,每条质检记录对应一次通话,包含主被叫号码、呼叫时间、结束时间、所属企业名、企业类型、检出的敏感词及出现次数、话术模板是否匹配等。每条记录均支持录音回放,质检员可以在线听语音文件,进行人工复核。
(3)质检绩效管理
质检组长将质检任务指派给质检员后,可以对质检员进行绩效管理。质检组长可通过WEB界面实时查看质检员任务完成情况,便于质检组长全局掌控质检工作进度和对质检员绩效考核。任务完成情况是以列表形式展现已审核和未审核的任务详情。包括主被叫号码、所属企业名称、企业类型、呼叫时间、任务指派时间、质检员信息、复核完成时间、复核结果等。
系统自动产生任务完成分析结果,以图表的形式展现某个时间段内所有质检员已审核和未审核条数的分析情况。
6)业务管理功能
系统通过WEB服务器为系统维护人员、呼叫中心管理员、质检组长、质检组员等角色提供业务管理功能,支持分权分域权限配置,支持各地市远程登录。主要的业务管理功能包含:
(1)创建企业信息数据库,包含企业名称、所属行业、外呼号码、企业信誉度等。支持企业信息的增、删、改、查功能
(2)呼叫管控策略配置功能,如主叫黑白名单、被叫黑名单的增加和删除
(3)录音策略配置功能,如设置随机抽样录音的比例、设置企业信誉度和录音比例的对应关系、设置录音号码和录音策略(包含最大次数、录音时长等)
(4)敏感词/违禁词的增、删、改、查功能
(5)企业话术模板管理功能,包含企业话术模板的上传、下载
(6)按关键字、时间段、主被叫号码等维度查询质检记录,支持对已经录音的通话进行录音回放。
(7)质检管理功能,系统支持质检任务指派、质检员复核、质检绩效管理等质检管理功能。
(8)统计报表功能,系统支持按企业、主被叫号码、时间段、关键字等维度进行话务统计和质检结果统计,统计报表支持EXCEL导出。
上述呼叫中心AI引擎不良内容鉴别系统严格遵循现有的国家标准和技术规范,支持与各厂家各种类型的呼叫中心对接,支持与中国电信、中国移动、中国联通的不同类型的接入网和核心网对接;该系统采用在线实时信令采集和呼叫处理,当该系统接收到INVITE消息时,即可通过分析消息结构获取相关主被叫信息,并按照事先定义的策略进行实时拦截/放通处理;该系统使用ASR和NLP等先进的AI处理技术,实现语音转文本、句法分析、自动分词、信息检索、信息抽取、话术匹配,随着AI技术的不断发展,提供版本升级和新功能扩展服务,提升质检准确率和质检效率,满足未来业务发展需求,其中个性化的话术模板匹配功能能够为企业客户提供个性化、精细化的语音质检方案;该系统采用模块化设计,采用“框架+组件”的设计方式,具有高度的灵活性和可扩展性,可根据呼叫中心话务管理的需要,定制开发新的话务控制策略,利用一套平台可以同时提供多个业务,方便未来业务拓展;该系统具备方便的统计功能和自动化报表功能,数据直观呈现,全面提升质检管理能力;该系统还具备电信级系统的安全性、可靠性、稳定性,支持双节点异地容灾、双机热备、负荷分担、bypass机制保证系统安全性。
如图8所示,所述呼叫中心AI引擎不良内容鉴别系统包含8个接口:
(1)IF1:呼叫记录推送接口
呼叫管控平台定时抽取录音话单,向语音质检平台推送,推送间隔可根据话务量的大小自定,一般为5分钟到1小时一次。呼叫记录包含但不限于以下字段:
呼叫中心id|主叫号码|被叫号码|开始时间|结束时间|通话时长|录音文件名|呼叫类型|拦截类型
(2)IF2:录音文件接口
建议SFTP接口。呼叫管控平台定时抽取录音文件,向语音质检平台推送,一般推送间隔为1小时,即每小时抽检一次。
(3)IF3:管控指令接口
如果运管平台由呼叫接入管控平台同步提供,则此接口为内部接口。如果由第三方承建运管平台,则建议采用REST接口。
(4)IF4:质检记录上报接口
建议SFTP接口。语音质检平台定时抽取质检结果文件,向运管平台推送,推送间隔可为1小时。
质检记录包含但不限于以下字段:
检查时间|呼叫中心id|主叫号码|话术模板id|录音文件名称|录音文件存放路径|录音文本|相似度|违禁关键词列表(关键词如多个,以,号分割)
(5)IF5:话术模板下发接口
建议SFTP接口。运管平台在收到呼叫中心管理员上传的话术模板后,向运管平台推送。
(6)IF6:话单记录上报接口
如果运管平台由呼叫接入管控平台同步提供,则此接口为内部接口。如果由第三方承建运管平台,则建议采用SFTP接口。呼叫管控平台定时抽取全量话单,向运管平台推送,推送间隔可为1小时。话单记录包含但不限于以下字段:
呼叫中心id|主叫号码|被叫号码|开始时间|结束时间|通话时长|录音文件名|呼叫类型|拦截类型
(7)IF7:录音文件上报接口
如果运管平台由呼叫接入管控平台同步提供,则此接口为内部接口。如果由第三方承建运管平台,则建议采用SFTP接口。呼叫管控平台定时抽取全量话单,向运管平台推送,推送间隔可为1小时
(8)IF8:开户数据同步接口
如果运管平台由呼叫接入管控平台同步提供,则此接口为内部接口。如果由第三方承建运管平台,则建议采用REST接口。
综上所述,借助于本发明的上述技术方案,本发明的呼叫中心AI引擎不良内容鉴别系统及方法能够规范呼叫中心的营销外呼业务,强化呼叫业务管控,同时根据呼叫中心企业的信誉度对通话按设定的抽样比例录音,利用AI语音识别、大数据分析等技术手段,对呼叫中心外呼话务进行自动质检,提升质检工作效率。这种AI和大数据结合的呼叫中心管控方法,在规范呼叫中心外呼业务的同时,提升了用户的通信体验,给公众营造一个安全可信的通话环境。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种呼叫中心AI引擎不良内容鉴别系统,其特征在于,包括:呼叫中心运营管理系统、呼叫接入和管控平台、语音质检平台,其中,
所述呼叫中心运营管理系统,用于对呼叫中心进行全生命周期管理,其中,所述全生命周期管理包括:建立企业信息数据库,制定呼叫管控策略、录音策略,对敏感词或违禁词进行增、删、改、查,企业话术模板管理,质检记录查询,质检管理,统计报表,以及编辑管控指令并将管控指令传给所述呼叫接入和管控平台;
所述呼叫接入和管控平台,用于与呼叫中心对接,接入呼叫中心的所有话务,按呼叫管控策略对呼叫做拦截或放通处理,根据录音策略对呼叫全量或抽检录音,以及将呼叫记录和录音文件传给所述语音质检平台;
所述语音质检平台,采用ASR技术对录音文件进行处理,将语音转换为文本,基于转换后的文本检测录音与报备话术是否相一致,是否包含违禁词或敏感词,并将检测结果传给所述呼叫中心运营管理系统。
2.根据权利要求1所述的呼叫中心AI引擎不良内容鉴别系统,其特征在于,所述企业信息数据库包含企业名称、行业、外呼号码、企业信誉度。
3.根据权利要求1所述的呼叫中心AI引擎不良内容鉴别系统,其特征在于,所述呼叫管控策略包括设置主叫黑白名单、被叫黑白名单。
4.根据权利要求1所述的呼叫中心AI引擎不良内容鉴别系统,其特征在于,所述录音策略包括设置随机抽样录音的比例、设置各个企业信誉度的录音比例、设置录音号码、录音次数及录音时长。
5.根据权利要求1所述的呼叫中心AI引擎不良内容鉴别系统,其特征在于,所述检测结果包括检测时间、呼叫时间、主被叫号码、话术模板匹配结果、检出的违禁词及出现次数。
6.一种采用如权利要求1所述的呼叫中心AI引擎不良内容鉴别系统的鉴别方法,其特征在于,包括如下步骤:
S1运营商接入网和核心网将呼叫中心的话务路由指向所述呼叫中心AI引擎不良内容鉴别系统;
S2所述呼叫接入和管控平台对SIP信令进行解析,提取主被叫号码,将主被叫号码和系统设置的主被叫黑白名单进行比对,如果主被叫号码在主被叫黑名单中则拦截呼叫,如果主被叫号码在主叫白名单中则放通呼叫,其余呼叫均放通并根据采样录音策略进行录音;
S3所述呼叫接入和管控平台将话单文件和录音文件定时推送至语音质检平台;
S4所述语音质检平台对录音文件进行离线语音识别、关键字匹配和话术模板匹配,生成语音质检结果;
S5所述语音质检平台将质检结果推送给所述呼叫中心运营管理系统,通过所述呼叫中心运营管理系统进行质检记录查询、质检任务指派、质检绩效管理。
7.根据权利要求6所述的方法,其特征在于,进一步包括:
S6通过所述呼叫中心运营管理系统进行录音回放,人工复检,将违规主叫加入黑名单。
8.根据权利要求7所述的方法,其特征在于,所述语音识别是采用ASR技术对录音文件进行处理,将语音转换为文本,原始语音输入后,首先要对输入的语音进行预处理,然后提取语音特征,在此基础上建立语音识别所需的模板,在识别过程中要根据语音识别的模型,将系统中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列与输入语音匹配的模板,然后根据此模板的定义,通过查表就可以给出识别结果。
9.根据权利要求7所述的方法,其特征在于,所述话术模板匹配是通过NLP技术比较实际通话获取的文本与事先报备的话术文本之间的相似性,如果相似度较高,则可以认为实际通话内容与报备内容符合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011252654.5A CN112511696A (zh) | 2020-11-11 | 2020-11-11 | 呼叫中心ai引擎不良内容鉴别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011252654.5A CN112511696A (zh) | 2020-11-11 | 2020-11-11 | 呼叫中心ai引擎不良内容鉴别系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112511696A true CN112511696A (zh) | 2021-03-16 |
Family
ID=74957813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011252654.5A Pending CN112511696A (zh) | 2020-11-11 | 2020-11-11 | 呼叫中心ai引擎不良内容鉴别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112511696A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743983A (zh) * | 2021-08-09 | 2021-12-03 | 太逗科技集团有限公司 | 一种基于安卓应用的电销管理方法、装置、设备、介质 |
CN114338617A (zh) * | 2021-12-23 | 2022-04-12 | 上海欣方智能系统有限公司 | 基于视频呼叫的音视频审核方法、非法号码识别方法 |
CN114554015A (zh) * | 2022-02-25 | 2022-05-27 | 马上消费金融股份有限公司 | 呼叫中心系统和通讯建立方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975514A (zh) * | 2016-04-28 | 2016-09-28 | 朱宇光 | 一种自动质检方法及系统 |
CN106162619A (zh) * | 2015-04-24 | 2016-11-23 | 中国移动通信集团公司 | 一种呼叫中心外呼的监控预警方法及装置 |
CN106550155A (zh) * | 2016-11-25 | 2017-03-29 | 上海欣方智能系统有限公司 | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 |
US10091349B1 (en) * | 2017-07-11 | 2018-10-02 | Vail Systems, Inc. | Fraud detection system and method |
CN110445944A (zh) * | 2019-08-19 | 2019-11-12 | 携程旅游信息技术(上海)有限公司 | 呼叫中心防止电话骚扰的方法及系统 |
CN111885272A (zh) * | 2020-07-24 | 2020-11-03 | 南京易米云通网络科技有限公司 | 呼叫中心座席支持电话智能外呼方法及智能呼叫中心系统 |
-
2020
- 2020-11-11 CN CN202011252654.5A patent/CN112511696A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162619A (zh) * | 2015-04-24 | 2016-11-23 | 中国移动通信集团公司 | 一种呼叫中心外呼的监控预警方法及装置 |
CN105975514A (zh) * | 2016-04-28 | 2016-09-28 | 朱宇光 | 一种自动质检方法及系统 |
CN106550155A (zh) * | 2016-11-25 | 2017-03-29 | 上海欣方智能系统有限公司 | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 |
US10091349B1 (en) * | 2017-07-11 | 2018-10-02 | Vail Systems, Inc. | Fraud detection system and method |
CN110445944A (zh) * | 2019-08-19 | 2019-11-12 | 携程旅游信息技术(上海)有限公司 | 呼叫中心防止电话骚扰的方法及系统 |
CN111885272A (zh) * | 2020-07-24 | 2020-11-03 | 南京易米云通网络科技有限公司 | 呼叫中心座席支持电话智能外呼方法及智能呼叫中心系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743983A (zh) * | 2021-08-09 | 2021-12-03 | 太逗科技集团有限公司 | 一种基于安卓应用的电销管理方法、装置、设备、介质 |
CN114338617A (zh) * | 2021-12-23 | 2022-04-12 | 上海欣方智能系统有限公司 | 基于视频呼叫的音视频审核方法、非法号码识别方法 |
CN114554015A (zh) * | 2022-02-25 | 2022-05-27 | 马上消费金融股份有限公司 | 呼叫中心系统和通讯建立方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10410636B2 (en) | Methods and system for reducing false positive voice print matching | |
CN106550155B (zh) | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 | |
US10182148B2 (en) | Method and system for filtering undesirable incoming telephone calls | |
CN112511696A (zh) | 呼叫中心ai引擎不良内容鉴别系统及方法 | |
CN109600752B (zh) | 一种深度聚类诈骗检测的方法和装置 | |
CN109819127B (zh) | 骚扰电话的管理方法和系统 | |
US8219404B2 (en) | Method and apparatus for recognizing a speaker in lawful interception systems | |
CN108965620A (zh) | 一种人工智能呼叫中心系统 | |
US9571652B1 (en) | Enhanced diarization systems, media and methods of use | |
CN109451182B (zh) | 一种诈骗电话的检测方法和装置 | |
US7330536B2 (en) | Message indexing and archiving | |
US8731919B2 (en) | Methods and system for capturing voice files and rendering them searchable by keyword or phrase | |
US8391445B2 (en) | Caller identification using voice recognition | |
US20120215535A1 (en) | Method and apparatus for automatic correlation of multi-channel interactions | |
CN106936997B (zh) | 一种基于社交关系图谱的垃圾语音识别方法和系统 | |
US20050053212A1 (en) | Automated call management | |
CN110337059A (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN109873907A (zh) | 呼叫处理方法、装置、计算机设备及存储介质 | |
CN113794805A (zh) | 一种goip诈骗电话的检测方法、检测系统 | |
CN110677540A (zh) | 一种医疗机构的咨询电话智能语音识别管理系统 | |
CN110705926A (zh) | 一种物流对象配送信息的获取方法、装置和系统 | |
CN111246008A (zh) | 一种电话助理的实现方法、系统及装置 | |
CN101072174A (zh) | 基于净荷深度检测和会话关联技术的腾讯语音识别方法 | |
CN109151229A (zh) | 异常呼叫自动识别预警系统及其工作方法、呼叫中心系统 | |
CN111881272A (zh) | 一种电话服务实时预警系统和预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210316 |
|
RJ01 | Rejection of invention patent application after publication |