CN109697243A - 回铃音聚类分析方法、装置、介质和计算设备 - Google Patents

回铃音聚类分析方法、装置、介质和计算设备 Download PDF

Info

Publication number
CN109697243A
CN109697243A CN201910105483.4A CN201910105483A CN109697243A CN 109697243 A CN109697243 A CN 109697243A CN 201910105483 A CN201910105483 A CN 201910105483A CN 109697243 A CN109697243 A CN 109697243A
Authority
CN
China
Prior art keywords
ring
back tone
key message
information labels
calling terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910105483.4A
Other languages
English (en)
Inventor
储著西
刘莹莹
杨先军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Zhiqi Technology Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201910105483.4A priority Critical patent/CN109697243A/zh
Publication of CN109697243A publication Critical patent/CN109697243A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Abstract

本发明的实施方式提供了一种回铃音聚类分析方法、装置、介质和计算设备。该方法包括:根据呼叫端的呼叫,获取呼叫端所接收的回铃音;对所述回铃音执行语音识别获得识别结果;提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签;以及基于回铃音的信息标签进行聚类分析。通过对回铃音进行语音识别,本发明的方法对通话未接通的原因能进行有效分析,从而显著地降低了由于运营商或设备信令码的不同造成的分析误差,提高了对通话未接通的原因进行分析的效率和准确性。

Description

回铃音聚类分析方法、装置、介质和计算设备
技术领域
本发明的实施方式涉及通信技术领域,更具体地,本发明的实施方式涉及回铃音聚类分析方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在呼叫方拨打电话时,如果被叫方没接到或正忙,此时呼叫方会在电话中听到“对不起,用户正忙,请稍后再拨…”或“对不起,通话暂时无法接通,请稍后再拨…”这种类似的回铃音从而使呼叫方知道通话未接通的原因,而呼叫方的通话设备却无从知晓未接通的原因。
目前,已经出现一些的处理方式是:对呼出失败的通话,运营商会针对未接通的呼叫方,返回通话失败的信令码,而基于不同的设备或运营商,返回的信令码各不相同,无法对呼出失败的原因进行有效的分析。
发明内容
为此,非常需要一种改进的回铃音聚类分析方法、装置、介质和计算设备,以使通话未接通的原因能进行有效分析。
在本上下文中,本发明的实施方式期望提供一种回铃音聚类分析方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种回铃音聚类分析方法,包括:
根据呼叫端的呼叫,获取呼叫端所接收的回铃音;
对所述回铃音执行语音识别获得识别结果;
提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签;以及
基于回铃音的信息标签进行聚类分析。
在本发明的一个实施例中,所述根据呼叫端的呼叫,获取呼叫端所接收的回铃音,包括记录所述回铃音,生成音频文件。
在本发明的另一实施例中,该方法包括:所述回铃音包括忙音以及语音提示。
在本发明的又一个实施例中,所述对所述回铃音执行语音识别获得识别结果,包括通过语音识别获得与所述回铃音对应的文本信息。
在本发明的再一个实施例中,所述提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签,包括:
提取所述文本信息的关键信息,将所述关键信息与预设的回铃音文案库中的回铃音文案关键词相匹配,进而确定所述回铃音的信息标签,所述回铃音文案库中保存有回铃音文案关键词与所述信息标签的对应关系。
在本发明的一个实施例中,该方法还包括:在所述文本信息之间进行模糊匹配,对具有相同含义的文本信息提取相同的关键信息。
在本发明的一个实施例中,所述基于回铃音的信息标签进行聚类分析包括:
对与信息标签相对应的失败呼叫进行分类,统计各类失败呼叫的数量,获得各类失败呼叫在总呼叫数量中的占比。
在本发明实施方式的第二方面中,提供了一种回铃音聚类分析装置,包括:
接收模块,用于根据呼叫端的呼叫,获取呼叫端所接收的回铃音;
语音识别模块,用于对所述回铃音执行语音识别获得识别结果;
提取模块,用于提取所述识别结果中的关键信息;
确定模块,用于根据所述关键信息确定相对应的回铃音的信息标签;
聚类分析模块,用于基于回铃音的信息标签进行聚类分析。
在本发明的一个实施例中,该装置还包括:记录模块,用于记录所述回铃音,生成音频文件。
在本发明的一个实施例中,该装置还包括:文案匹配模块,用于将所述关键信息与预设的回铃音文案库中的回铃音文案关键词相匹配,进而确定所述回铃音的信息标签,所述回铃音文案库中保存有回铃音文案关键词与所述信息标签的对应关系。
在本发明的一个实施例中,该装置还包括:模糊匹配模块,用于在所述识别结果之间进行模糊匹配,对具有相同含义的识别结果提取相同的关键信息。
在本发明的一个实施例中,该装置还包括:聚类分析模块,用于对与信息标签相对应的失败呼叫进行分类,统计各类失败呼叫的数量,获得各类失败呼叫在总呼叫数量中的占比。
在本发明实施方式的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明提供的任一项所述的回铃音聚类分析方法。
在本发明实施方式的第四方面中,提供了一种计算设备,包括:处理器及存储有所述处理器的可执行指令的存储器,其中,所述处理器配置为经由执行所述可执行指令来实现本发明提供的任一项所述的回铃音聚类分析方法。
根据本发明实施方式的第一方面,本发明提供的回铃音聚类分析方法通过对回铃音进行语音识别,而无需采用传统分析信令码的形式,可以对通话未接通的原因能进行有效分析,从而显著地降低了由于运营商或设备信令码的不同造成的分析误差,提高了对通话未接通的原因进行分析的效率和准确性,为用户带来了更好的体验。
本发明实施方式第二方面提供的回铃音聚类分析装置、第三方面提供的计算机可读存储介质、第四方面提供的计算设备,与上述第一方面提供的回铃音聚类分析方法出于相同的发明构思,具有相同的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式回铃音聚类分析方法及装置的应用场景;
图2示意性地示出了根据本发明一实施例的回铃音聚类分析方法的流程图;
图3示意性地示出了根据本发明另一实施例的回铃音聚类分析方法的流程图;
图4示意性地示出了根据本发明另一实施例的回铃音聚类分析方法的流程图;
图5示意性地示出了根据本发明一实施例的回铃音聚类分析方法的技术框架示意图;
图6示意性地示出了根据本发明另一实施例的回铃音聚类分析方法的流程图;
图7示意性地示出了根据本发明另一实施例的回铃音聚类分析方法的流程图;
图8示意性地示出了根据本发明另一实施例的回铃音聚类分析方法的流程图;
图9示意性地示出了根据本发明一实施例的回铃音聚类分析方法的介质示意图;
图10示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图11示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图12示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图13示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图14示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图15示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图16示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图17示意性地示出了根据本发明一实施例的回铃音聚类分析装置的框图;
图18示意性地示出了根据本发明一实施例的计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种回铃音聚类分析的方法、装置、介质和计算设备。
在本文中,需要理解的是,所涉及的术语“回铃音”是指拨打电话时,呼叫方在按完电话号码后,至对方接听前,也就是对方电话响铃期间,呼叫方在自己听筒所听到的声音。根据一种实施方式,被叫用户处于被振铃状态,采用频率为450±25Hz的交流电源,发送电平为-10±3dBm,它是5s断续的信号音,即1s送,4s断,与振铃音一致。
术语“语音识别(ASR:Automatic Speech Recognition)”也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,让计算机能够“听写”出不同人所说出的连续语音,也就是俗称的“语音听写机”,是实现“声音”到“文字”转换的技术,例如二进制编码或者字符序列。
术语“信令码(SIPcode:Session Initiation Protocol Cause Code)”表示通信双方传输信息时根据约定的协议标准,以消息(或语言)的方式传递原因代码。
术语“模糊匹配”就是通过人工或自主学习把表述不同或相似却具有相同含义的文本配对起来。
术语“聚类”是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,由于现有的通话失败原因分析方案,均是通过分析信令码进行的,但基于不同的设备或运营商,返回的信令码有所不同,根据信令码分析会存在很大的误差,对于呼出失败的原因无法进行有效的分析。
因此,本发明的实施方式提供了一种回铃音聚类分析方法、装置、介质和计算设备,可以对不同设备、不同运营商针对同一种呼叫失败的原因进行有效分析,分析结果精确。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1,图1示意性地示出了根据本发明实施例的应用场景。
如图1所示,以通讯呼叫的场景为例,呼叫用户通过呼叫终端100向被叫用户发起通信呼叫请求,被叫用户可以通过被叫终端200与呼叫用户进行通信。在呼叫终端100和被叫终端200之间,存在核心业务服务器300以支持终端100和被叫终端200的通讯。呼叫终端100和被叫终端200可以是比如智能手机、平板电脑、智能穿戴设备等具有语音通讯功能的终端设备。
需要说明的是,本领域技术人员完全可以理解,本发明实施方式的适用场景不受到上述任何方面的限制。
示例性方法
下面结合图1的应用场景,参考图2来描述根据本发明示例性实施方式的用于回铃音聚类分析的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图2示意性示出了根据本发明的第一个实施例的回铃音聚类分析方法的流程图。该方法的执行主体可以是具有处理功能的服务器。
参照图2所示,根据本发明的第一个实施例的回铃音聚类分析方法,包括如下步骤S11至步骤S14,详细介绍如下:
S11根据呼叫端的呼叫,获取呼叫端所接收的回铃音。
根据本发明的实施例,基于呼叫用户通过呼叫终端发出的呼叫请求,呼叫终端呼叫后,若被呼叫方无应答,则呼叫终端会接收回铃音,服务端获取呼叫终端接收到的回铃音,回铃音包括忙音以及语音提示。呼叫接通就表示呼叫成功,则不会有回铃音。
一些实施例中,参见图3,步骤S11之后还可以包括:
S111:记录所述回铃音,生成音频文件。
服务端获取回铃音之后,记录回铃音,生成wav格式的音频文件,具体编码格式:16位、8KHZ采样频率、PCM格式。
S12对所述回铃音执行语音识别获得识别结果。
根据本发明的实施例,服务端获取呼叫终端接收的回铃音之后,对所获取的回铃音或记录在音频文件中的回铃音进行语音识别,获取语音识别的识别结果。
一些实施例中,参见图4,步骤S12具体包括:
S121:通过语音识别获得与所述回铃音对应的文本信息。
具体的技术框架参见图5,呼叫终端采用WebRTC的底层框架,先从服务端的核心业务服务器(CC-CORE)获取可供临时SIP终端登录的SIP帐号/密码。核心业务服务器(CC-CORE)会向基础帐号能力服务器(ACCOUNT)获取原始数据,相应聚合后返回给呼叫终端。初始化时根据企业选择合适的集群(CC-TACTICS),以备后续呼叫时可以落到指定的媒体交换服务器(SWITCH)进行媒体交换。呼叫终端发起到媒体交换服务器(SWITCH)的SIP注册请求及相关协商完成呼叫终端的初始化过程。呼叫终端指定被叫向媒体交换服务器(SWITCH)发起被叫SIP信令请求。媒体交换服务器(SWITCH)选择正确的落地网关并进行媒体协商。代理网关(PROXY)进行SIP信令翻译(PSIN),将SIP信令翻译成E1线的PRI信令并真正和运营商进行协商。当协商成功后,早期媒体开始介入传输,运营商端局会回送SIP:180/183早期媒体回铃音。
此时,媒体交换服务器(SWITCH)将接收到的实时回铃音音频传送至语音识别模块进行语音识别,根据一种实施方式,语音识别模块包括ASR核心服务器(AI-ASR/NLP),ASR核心服务器(AI-ASR/NLP)将回铃音音频实时转换成文本再以流的方式回送给媒体交换服务器(SWITCH),媒体交换服务器(SWITCH)再通过事件将文本送至服务端的核心业务服务器,即获得了识别结果。
S13提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签。可以预先建立关键信息和对应的回铃音的信息标签的表或数据库,从而使用该数据库,根据所述关键信息确定相对应的回铃音的信息标签。
一些实施例中,参见图6,步骤S13包括:
S132:将识别结果与定义的关键信息匹配,匹配一致则提取关键信息作为识别结果的关键信息,根据所述关键信息确定相对应的回铃音的信息标签。
在一种实施方式中,预先获取各种通话失败的原因,并定义对应的关键信息。例如:
对于“您拨打的用户已停机,……”,则定义其关键信息为停机。
对于“您拨打的用户已关机,……”,则定义其关键信息为关机。
对于“您拨打的号码是空号,……”,则定义其关键信息为空号。
对于“您拨打的用户暂时无法接通,请稍后再拨,……”,则定义其关键信息为无法接通。
对于“您拨打的用户正忙,请稍后再拨,……”,则定义其关键信息为正忙。
对于“嘟…嘟…嘟…”,则定义其关键信息为嘟。
根据本发明的实施例,例如识别结果是“对不起,您拨打的用户正忙……”,则提取关键信息“正忙”。
S133:提取所述文本信息的关键信息,将所述关键信息与预设的回铃音文案库中的回铃音文案关键词相匹配,进而确定所述回铃音的信息标签,所述回铃音文案库中保存有回铃音文案关键词与所述信息标签的对应关系。
例如,可以根据上述关键信息“正忙”,确定相对应的回铃音的信息标签为“占线”。
综上,根据本发明的实施例,服务端事先收集各通讯运营商的回铃音文案并建立回铃音文案库。例如,通讯运营商的回铃音文案是“您拨打的用户正忙,请稍后再拨……”,则提取“正忙”作为这一文案的关键词,并建立关键词“正忙”与信息标签“占线”的对应关系。之后提取语音识别结果中的关键信息“正忙”与回铃音文案库中的关键词“正忙”相匹配,即可确定该回铃音的信息标签为“占线”。
一些实施例中,参见图7,步骤S13还包括:
S131:在所述文本信息之间进行模糊匹配,对具有相同含义的文本信息提取相同的关键信息。
核心业务服务器(CC-CORE)拿到文本信息后去模糊匹配模块进行模糊匹配。根据本发明的实施例,各通讯运营商的回铃音文案表达方式可能存在差异,那么获得的文本信息也可能不同。例如:对于正忙,有的运营商的回铃音文案的文本信息是“您呼叫的用户忙,请稍后再拨……”,而另一家运营商的回铃音文案的文本信息是“您拨打的电话正忙,请稍后再拨……”,这两个文本信息虽然表达的方式不同,但是具有相同的含义,都表示用户正忙,那么在这两个文本信息之间进行模糊匹配,对这两个文本信息提取相同的关键信息“正忙”。
S14基于回铃音的信息标签进行聚类分析。
根据本发明的实施例,通过分析呼叫未接通的通讯的信息标签,从而对呼叫未接通的通讯按信息标签进行聚类,分析失败呼叫的原因,可以根据不同需求场景,对这部分被叫人群进行分层运营,从而为企业提升整体接通率。
在本发明的一个实施例中,参见图8,S14包括步骤S141,详细介绍如下:
S141对信息标签相对应的失败呼叫进行分类,统计各类失败呼叫的数量,获得各类失败呼叫在总呼叫数量中的占比。
例如,根据本发明的实施例,信息标签是“占线”,则可确定该通话的呼叫结果为未接通,对信息标签相对应的失败呼叫进行分类,将该失败呼叫归类于占线一类,该通话未接通的原因是被叫方处于通话状态或是被叫方电话未放好。在预定时间段内,拨打了100通电话,其中接通80次,信息标签“占线”出现的次数是20次,则“占线”类失败呼叫的数量为20次,有20次的呼叫因为被叫方处于通话状态或是被叫方电话未放好而呼叫失败,进而计算出占线类失败呼叫在总呼叫中的占比为20%。
本发明上述实施例的技术方案与现有的根据接收的信令码来分析通话未连接原因的方法不同,通过对回铃音进行语音识别,聚类分析通话未接通的原因,从而显著地降低了由于运营商或设备信令码的不同造成的分析误差,提高了对通话未接通的原因进行分析的效率和准确性,为用户带来了更好的体验。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的一种计算机可读存储介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种计算机可读存储介质,其上存储有计算机程序,当所述程序被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的回铃音聚类分析方法及其步骤。
具体地,所述设备的处理器执行所述程序时用于实现前述方法的步骤,例如实现如下的步骤:
根据呼叫端的呼叫,获取呼叫端所接收的回铃音;
对所述回铃音执行语音识别获得识别结果;
提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签;以及
基于回铃音的信息标签进行聚类分析。
需要说明的是:上述的计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图9所示,描述了根据本发明的实施方式的介质500,其可以采用便携式紧凑盘只读存储器(CD-ROM)的形式,并包括程序,并可以在设备上运行。然而,本发明不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算设备。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,附图对本发明示例性实施方式的回铃音聚类分析装置进行说明,可以基于上文对方法步骤的说明来理解本发明的装置。
参照图10所示,根据本发明的一个实施例的回铃音聚类分析装置600,包括:
接收模块610,基于呼叫用户通过呼叫终端发出的呼叫请求,呼叫终端呼叫后,若被呼叫方无应答,则呼叫终端会接收回铃音,服务端则通过接收模块610获取呼叫终端接收到的回铃音。
语音识别模块620,根据一种实施方式,语音识别模块620包括ASR核心服务器(AI-ASR/NLP),ASR核心服务器(AI-ASR/NLP)用于将接收到的实时回铃音音频实时转换成机器可识别或理解的文本。
提取模块630,用于提取语音识别模块620所转换的文本中的关键信息。根据一种实施方式,提取模块630具体包括信息匹配模块631,信息匹配模块631可以将识别结果与定义的关键信息匹配,匹配一致则提取关键信息作为识别结果的关键信息。
确定模块640,用于根据提取模块630所提取的关键信息,确定相对应的回铃音的信息标签。根据预先建立的关键信息和对应的回铃音的信息标签的表或数据库,从而使用该数据库,根据所述关键信息确定相对应的回铃音的信息标签。
聚类分析模块650,用于分析呼叫未接通的通讯的信息标签,从而对呼叫未接通的通讯按信息标签进行聚类,分析失败呼叫的原因。
根据一种实施方式,基于上述方案,回铃音聚类分析装置600还包括定义模块660,如图11所示,定义模块660集成在提取模块630中;也可以如图12所示,定义模块660不与提取模块630集成在一起·定义模块660可以根据获取的各种通话失败的原因,并定义对应的关键信息。提取模块630基于定义模块660的定义提取关键信息。
根据一种实施方式,基于上述方案,回铃音聚类分析装置600还包括记录模块670,如图13所示,记录模块670集成在接收模块610中;也可以如图14所示,记录模块670不与接收模块610集成在一起。记录模块670可以在接收模块610获取回铃音之后,将回铃音记录并生成wav格式的音频文件,音频文件具体编码格式:16位、8KHZ采样频率、PCM格式。
根据一种实施方式,参见图15,根据本发明的一个实施例的回铃音聚类分析装置600,确定模块640具体包括:
文案匹配模块641,基于服务端收集各通讯运营商的回铃音文案并建立回铃音文案库,基于确定了的回铃音文案库中的各个回铃音文案的关键词以及关键词与信息标签的对应关系,文案匹配模块641用于将回铃音识别结果中的关键信息与回铃音文案的关键词相匹配,根据匹配结果确定回铃音的信息标签。
根据一种实施方式,参见图16,根据本发明的一个实施例的回铃音聚类分析装置600,提取模块630还包括:
模糊匹配模块632,模糊匹配模块632包括智能机器人平台(AI-BOT),核心业务服务器(CC-CORE)拿到文本信息后传送至智能机器人平台(AI-BOT)的进行模糊匹配,对具有相同含义的文本信息提取相同的关键信息,对具有相同含义的识别结果提取相同的关键信息,并可以人工或自主学习出关键信息和相应失败原因的关联。
根据一种实施方式,参见图17,根据本发明的一个实施例的回铃音聚类分析装置600,包括:
统计模块651,用于通过对各信息标签进行统计,分析各类失败呼叫的数量,获得各类失败呼叫在总呼叫数量中的占比。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,对本发明示例性实施方式的计算设备进行介绍。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明的各种示例性实施方式的回铃音聚类分析方法及其步骤。
如图18所示,计算设备700以通用计算设备的形式表现。计算设备700的组件可以包括但不限于:上述至少一个处理单元701、上述至少一个存储单元702,连接不同系统组件(包括处理单元701和存储单元702)的总线703。
总线703包括数据总线、控制总线和地址总线。
存储单元702可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)7021和/或高速缓存存储器7022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)7023。
存储单元702还可以包括具有一组(至少一个)程序模块7024的程序/实用工具7025,这样的程序模块7024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备700也可以与一个或多个外部设备704(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口705进行。并且,计算设备700还可以通过网络适配器706与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器706通过总线703与计算设备700的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种回铃音聚类分析方法,包括:
根据呼叫端的呼叫,获取呼叫端所接收的回铃音;
对所述回铃音执行语音识别获得识别结果;
提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签;以及
基于回铃音的信息标签进行聚类分析。
2.根据权利要求1所述的方法,其特征在于,所述根据呼叫端的呼叫,获取呼叫端所接收的回铃音,包括记录所述回铃音,生成音频文件。
3.根据权利要求1所述的方法,其特征在于,所述回铃音包括忙音以及语音提示。
4.根据权利要求1所述的方法,其特征在于,所述对所述回铃音执行语音识别获得识别结果,包括通过语音识别获得与所述回铃音对应的文本信息。
5.根据权利要求4所述的方法,其特征在于,所述提取所述识别结果中的关键信息,根据所述关键信息确定相对应的回铃音的信息标签,包括:
提取所述文本信息的关键信息,将所述关键信息与预设的回铃音文案库中的回铃音文案关键词相匹配,进而确定所述回铃音的信息标签,所述回铃音文案库中保存有回铃音文案关键词与所述信息标签的对应关系。
6.根据权利要求5所述的方法,其特征在于,还包括在所述文本信息之间进行模糊匹配,对具有相同含义的文本信息提取相同的关键信息。
7.根据权利要求1所述的方法,其特征在于,所述基于回铃音的信息标签进行聚类分析包括:
对与信息标签相对应的失败呼叫进行分类,统计各类失败呼叫的数量,获得各类失败呼叫在总呼叫数量中的占比。
8.一种回铃音聚类分析装置,包括:
接收模块,用于根据呼叫端的呼叫,获取呼叫端所接收的回铃音;
语音识别模块,用于对所述回铃音执行语音识别获得识别结果;
提取模块,用于提取所述识别结果中的关键信息;
确定模块,用于根据所述关键信息确定相对应的回铃音的信息标签;
聚类分析模块,用于基于回铃音的信息标签进行聚类分析。
9.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
10.一种计算设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7中任一项所述的方法。
CN201910105483.4A 2019-02-01 2019-02-01 回铃音聚类分析方法、装置、介质和计算设备 Pending CN109697243A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910105483.4A CN109697243A (zh) 2019-02-01 2019-02-01 回铃音聚类分析方法、装置、介质和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910105483.4A CN109697243A (zh) 2019-02-01 2019-02-01 回铃音聚类分析方法、装置、介质和计算设备

Publications (1)

Publication Number Publication Date
CN109697243A true CN109697243A (zh) 2019-04-30

Family

ID=66234913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910105483.4A Pending CN109697243A (zh) 2019-02-01 2019-02-01 回铃音聚类分析方法、装置、介质和计算设备

Country Status (1)

Country Link
CN (1) CN109697243A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503980A (zh) * 2019-08-23 2019-11-26 百可录(北京)科技有限公司 一种基于机器学习对于振铃进行分类的方法
CN111916109A (zh) * 2020-08-12 2020-11-10 北京鸿联九五信息产业有限公司 一种基于特征的音频分类方法、装置及计算设备
CN112087726A (zh) * 2020-09-11 2020-12-15 携程旅游网络技术(上海)有限公司 彩铃识别的方法及系统、电子设备及存储介质
CN112530436A (zh) * 2020-11-05 2021-03-19 联通(广东)产业互联网有限公司 通信话务状态的识别方法、系统、装置及存储介质
CN112562654A (zh) * 2020-12-02 2021-03-26 天津车之家数据信息技术有限公司 一种音频分类方法及计算设备
CN112866487A (zh) * 2021-02-26 2021-05-28 上海米鹊科技有限公司 一种利用语音识别技术判断模拟电话机呼叫状态的方法
CN113808591A (zh) * 2021-08-13 2021-12-17 北京百度网讯科技有限公司 音频处理方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427479A (zh) * 2013-09-10 2015-03-18 中兴通讯股份有限公司 一种提示呼叫状态的方法及移动终端
CN105323744A (zh) * 2014-06-23 2016-02-10 中兴通讯股份有限公司 呼叫状态的反馈方法及装置、终端
CN107580149A (zh) * 2017-08-28 2018-01-12 携程旅游网络技术(上海)有限公司 外呼失败原因的识别方法、装置、电子设备、存储介质
CN108924370A (zh) * 2018-07-23 2018-11-30 携程旅游信息技术(上海)有限公司 呼叫中心外呼语音波形分析方法、系统、设备及存储介质
CN109151220A (zh) * 2018-09-11 2019-01-04 中国—东盟信息港股份有限公司 一种通信话路呼叫失败场景分析系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427479A (zh) * 2013-09-10 2015-03-18 中兴通讯股份有限公司 一种提示呼叫状态的方法及移动终端
CN105323744A (zh) * 2014-06-23 2016-02-10 中兴通讯股份有限公司 呼叫状态的反馈方法及装置、终端
CN107580149A (zh) * 2017-08-28 2018-01-12 携程旅游网络技术(上海)有限公司 外呼失败原因的识别方法、装置、电子设备、存储介质
CN108924370A (zh) * 2018-07-23 2018-11-30 携程旅游信息技术(上海)有限公司 呼叫中心外呼语音波形分析方法、系统、设备及存储介质
CN109151220A (zh) * 2018-09-11 2019-01-04 中国—东盟信息港股份有限公司 一种通信话路呼叫失败场景分析系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
万兆阳: ""语音识别技术在呼叫中心自动外呼应用的研究与实现"", 《中国优秀硕士学位论文,信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503980A (zh) * 2019-08-23 2019-11-26 百可录(北京)科技有限公司 一种基于机器学习对于振铃进行分类的方法
CN111916109A (zh) * 2020-08-12 2020-11-10 北京鸿联九五信息产业有限公司 一种基于特征的音频分类方法、装置及计算设备
CN111916109B (zh) * 2020-08-12 2024-03-15 北京鸿联九五信息产业有限公司 一种基于特征的音频分类方法、装置及计算设备
CN112087726A (zh) * 2020-09-11 2020-12-15 携程旅游网络技术(上海)有限公司 彩铃识别的方法及系统、电子设备及存储介质
CN112530436A (zh) * 2020-11-05 2021-03-19 联通(广东)产业互联网有限公司 通信话务状态的识别方法、系统、装置及存储介质
CN112562654A (zh) * 2020-12-02 2021-03-26 天津车之家数据信息技术有限公司 一种音频分类方法及计算设备
CN112866487A (zh) * 2021-02-26 2021-05-28 上海米鹊科技有限公司 一种利用语音识别技术判断模拟电话机呼叫状态的方法
CN113808591A (zh) * 2021-08-13 2021-12-17 北京百度网讯科技有限公司 音频处理方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN109697243A (zh) 回铃音聚类分析方法、装置、介质和计算设备
US7907705B1 (en) Speech to text for assisted form completion
CN109413286B (zh) 一种智能客服语音应答系统及方法
US10276153B2 (en) Online chat communication analysis via mono-recording system and methods
CN101923853B (zh) 说话人识别方法、设备和系统
US5666400A (en) Intelligent recognition
US7606714B2 (en) Natural language classification within an automated response system
US7487095B2 (en) Method and apparatus for managing user conversations
US20200382634A1 (en) Call processing method and apparatus, server, storage medium, and system
CN111683175B (zh) 一种自动应答来电的方法、装置、设备及存储介质
CN109922213A (zh) 语音咨询时的数据处理方法、装置、存储介质及终端设备
CN109873907A (zh) 呼叫处理方法、装置、计算机设备及存储介质
CN109271503A (zh) 智能问答方法、装置、设备及存储介质
US20210312143A1 (en) Real-time call translation system and method
EP2913822B1 (en) Speaker recognition
IE980941A1 (en) A transaction processings system
CN107357859A (zh) 一种通过语音采集实现知识库自动显示的智能终端
US11606461B2 (en) Method for training a spoofing detection model using biometric clustering
CN110166637A (zh) 一种空号识别方法及装置
CN110519470A (zh) 一种语音处理方法、服务器和语音接入装置
TWI722715B (zh) 智能語音助理之模組化系統及其運作方法
CN109036407A (zh) 基于语音识别技术实现智能机器人应答的系统和方法
US10542145B1 (en) Method and apparatus for navigating an automated telephone system
EP4027630A1 (en) Group calling system, group calling method, and program
CN115982657B (zh) 一种智能外呼客服系统的录音审核分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210926

Address after: 310052 Room 408, building 3, No. 399, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Netease Zhiqi Technology Co.,Ltd.

Address before: 310052 Building No. 599, Changhe Street Network Business Road, Binjiang District, Hangzhou City, Zhejiang Province, 4, 7 stories

Applicant before: NETEASE (HANGZHOU) NETWORK Co.,Ltd.