CN110503980A

CN110503980A - 一种基于机器学习对于振铃进行分类的方法

Info

Publication number: CN110503980A
Application number: CN201910782784.0A
Authority: CN
Inventors: 周继敏
Original assignee: Baikelu (beijing) Technology Co Ltd
Current assignee: Baikelu (beijing) Technology Co Ltd
Priority date: 2019-08-23
Filing date: 2019-08-23
Publication date: 2019-11-26

Abstract

本发明涉及一种基于机器学习对于振铃进行分类的方法。该方法包括：基于电话没有接通的原因，使用标签来对不同的振铃样本加上标记，并且将所述振铃样本切割成片段；其中，所使用的标签包括以下中的一个：号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通；其中，所使用的标签使用Session Initiation Protocol(SIP)响应码来进行验证；所标记的片段用于训练机器学习模型，所述机器学习模型可用于对未接通的电话进行自动分类。本发明解决了如何利用机器学习技术为企业自动分类未接通电话的问题，使得用户可以使用本发明的机器学习分类模型的结果数据来了解未接通调用的性质。

Description

一种基于机器学习对于振铃进行分类的方法

技术领域

本发明涉及机器学习领域。更具体地说，本发明涉及一种基于机器学习对于振铃进行分类的方法。

背景技术

目前，未通的电话对任何通过电话进行通信的企业都是重要的。为了确定与目标被呼方通信的下一步，确定未接通原因是至关重要的。对于使用自动化呼叫的企业，特别是大规模的企业，很难确定未接通的原因，而且现有的SIP响应代码常常不准确、不详细，或者通常不足以满足企业的需求。

由于在电话响时播放的音调和消息往往是相似的，因此使用经过训练的基于相似性分类的机器学习模型，可以使企业准确而有效地理解被呼方的行为。

发明内容

本发明所要解决的技术问题是提供一种基于机器学习对于振铃进行分类的方法，解决了如何利用机器学习技术为企业自动分类未接通电话的问题，使得用户可以使用本发明的机器学习分类模型的结果数据来了解未接通调用的性质。

通过本发明可以实现的技术目的不限于上文已经特别描述的内容，并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。

本发明解决上述技术问题的技术方案如下：

根据本公开的一方面，本发明提供一种基于机器学习对于振铃进行分类的方法，所述方法包括基于电话没有接通的原因，使用标签来对不同的振铃样本加上标记，并且将所述振铃样本切割成片段；其中，所使用的标签包括以下中的一个：号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通；其中，所使用的标签使用Session Initiation Protocol(SIP)响应码来进行验证；所标记的片段用于训练机器学习模型，所述机器学习模型可用于对未接通的电话进行自动分类。

可选地，在如上所述的方法中，所述方法还包括所标记的振铃样本被拼接成小段，以便进行更精确的分析。

可选地，在如上所述的方法中，所述方法还包括将所拼接的小段输入到Python音频分类程序，所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。

可选地，在如上所述的方法中，所述方法还包括数据被训练来创建精确的分类模型。

可选地，在如上所述的方法中，所述方法还包括所述分类模型被用于电话呼叫，以识别相似的音频片段，并根据所述标签进行分类。

上述技术方案仅为本发明实施例的一些部分，本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。

本领域技术人员将会理解，通过本发明可以实现的效果不限于上文已经具体描述的内容，并且从以下详细说明中将更清楚地理解本发明的其他优点。

附图说明

被包括以提供对本发明的进一步理解的附图示出本发明的实施例，并且与说明书一起用于解释本发明的原理。

图1为本发明实施例提供的基于机器学习对于振铃进行分类的方法的流程图。

具体实施方式

现在将详细参考本发明的示例性实施例，其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例，而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而，对于本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下实践本发明。

在一些情况下，已知的结构和设备被省略或以框图形式示出，集中于结构和设备的重要特征，以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

图1示出了本发明实施例提供的基于机器学习对于振铃进行分类的方法的流程图。如图1所示，本发明提供了一种基于机器学习对于振铃进行分类的方法，所述方法包括：基于电话没有接通的原因，使用标签来对不同的振铃样本加上标记，并且将所述振铃样本切割成片段；其中，所使用的标签包括以下中的一个：号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通；其中，所使用的标签使用SessionInitiation Protocol(SIP)响应码来进行验证；所标记的片段用于训练机器学习模型，所述机器学习模型可用于对未接通的电话进行自动分类。可选地，在如上所述的方法中，所述方法还包括所标记的振铃样本被拼接成小段，以便进行更精确的分析。可选地，在如上所述的方法中，所述方法还包括将所拼接的小段输入到Python音频分类程序，所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。可选地，在如上所述的方法中，所述方法还包括数据被训练来创建精确的分类模型。可选地，在如上所述的方法中，所述方法还包括所述分类模型被用于电话呼叫，以识别相似的音频片段，并根据所述标签进行分类。

根据本发明的实施例，本发明的方法主要是利用机器学习技术为企业自动分类未接通电话的被呼方行为。本发明的方法检索铃声和消息的样本，这些样本被标记有错过呼叫的正确原因并将标记有错过呼叫的原因的样本进行拼接。本发明的方法通过Python程序处理上述拼接的样本，该程序测试音频相似性，以训练机器学习模型。然后，该模型可应用于未来的电话呼叫，以识别与模型中现有音频片段的相似性，并对这些未接通的电话进行相应的分类。企业可以使用本发明的方法的机器学习分类模型的结果数据来了解未接通调用的性质。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本申请可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

如上所述，已经给出了本发明的优选实施例的详细描述，以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明，但是本领域技术人员将会理解，在不脱离所附权利要求书中描述的本发明的精神或范围的情况下，可以在本发明中进行各种修改和改变。因此，本发明不应限于在此描述的特定实施例，而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

Claims

1.一种基于机器学习对于振铃进行分类的方法，其特征在于，所述方法包括：

基于电话没有接通的原因，使用标签来对不同的振铃样本加上标记，并且将所述振铃样本切割成片段；

其中，所使用的标签包括以下中的一个：号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通；

其中，所使用的标签使用Session Initiation Protocol(SIP)响应码结合人工抽样来进行双重验证；

所标记的片段用于训练机器学习模型，所述机器学习模型可用于对未接通的电话进行自动分类。

2.根据权利要求1所述的方法，

其特征在于，所述方法还包括：所标记的振铃样本被拼接成小段，以便进行更精确的分析。

3.根据权利要求2所述的方法，

其特征在于，所述方法还包括：将所拼接的小段输入到Python音频分类程序，所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。

4.根据权利要求3所述的方法，

其特征在于，所述方法还包括：数据被训练来创建精确的分类模型。

5.根据权利要求4所述的方法，

其特征在于，所述方法还包括：所述分类模型被用于电话呼叫，以识别相似的音频片段，并且根据所述标签进行分类。