CN110503980A - 一种基于机器学习对于振铃进行分类的方法 - Google Patents

一种基于机器学习对于振铃进行分类的方法 Download PDF

Info

Publication number
CN110503980A
CN110503980A CN201910782784.0A CN201910782784A CN110503980A CN 110503980 A CN110503980 A CN 110503980A CN 201910782784 A CN201910782784 A CN 201910782784A CN 110503980 A CN110503980 A CN 110503980A
Authority
CN
China
Prior art keywords
machine learning
ring
label
phone
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910782784.0A
Other languages
English (en)
Inventor
周继敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baikelu (beijing) Technology Co Ltd
Original Assignee
Baikelu (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baikelu (beijing) Technology Co Ltd filed Critical Baikelu (beijing) Technology Co Ltd
Priority to CN201910782784.0A priority Critical patent/CN110503980A/zh
Publication of CN110503980A publication Critical patent/CN110503980A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Telephone Function (AREA)

Abstract

本发明涉及一种基于机器学习对于振铃进行分类的方法。该方法包括:基于电话没有接通的原因,使用标签来对不同的振铃样本加上标记,并且将所述振铃样本切割成片段;其中,所使用的标签包括以下中的一个:号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通;其中,所使用的标签使用Session Initiation Protocol(SIP)响应码来进行验证;所标记的片段用于训练机器学习模型,所述机器学习模型可用于对未接通的电话进行自动分类。本发明解决了如何利用机器学习技术为企业自动分类未接通电话的问题,使得用户可以使用本发明的机器学习分类模型的结果数据来了解未接通调用的性质。

Description

一种基于机器学习对于振铃进行分类的方法
技术领域
本发明涉及机器学习领域。更具体地说,本发明涉及一种基于机器学习对于振铃进行分类的方法。
背景技术
目前,未通的电话对任何通过电话进行通信的企业都是重要的。为了确定与目标被呼方通信的下一步,确定未接通原因是至关重要的。对于使用自动化呼叫的企业,特别是大规模的企业,很难确定未接通的原因,而且现有的SIP响应代码常常不准确、不详细,或者通常不足以满足企业的需求。
由于在电话响时播放的音调和消息往往是相似的,因此使用经过训练的基于相似性分类的机器学习模型,可以使企业准确而有效地理解被呼方的行为。
发明内容
本发明所要解决的技术问题是提供一种基于机器学习对于振铃进行分类的方法,解决了如何利用机器学习技术为企业自动分类未接通电话的问题,使得用户可以使用本发明的机器学习分类模型的结果数据来了解未接通调用的性质。
通过本发明可以实现的技术目的不限于上文已经特别描述的内容,并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。
本发明解决上述技术问题的技术方案如下:
根据本公开的一方面,本发明提供一种基于机器学习对于振铃进行分类的方法,所述方法包括基于电话没有接通的原因,使用标签来对不同的振铃样本加上标记,并且将所述振铃样本切割成片段;其中,所使用的标签包括以下中的一个:号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通;其中,所使用的标签使用Session Initiation Protocol(SIP)响应码来进行验证;所标记的片段用于训练机器学习模型,所述机器学习模型可用于对未接通的电话进行自动分类。
可选地,在如上所述的方法中,所述方法还包括所标记的振铃样本被拼接成小段,以便进行更精确的分析。
可选地,在如上所述的方法中,所述方法还包括将所拼接的小段输入到Python音频分类程序,所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。
可选地,在如上所述的方法中,所述方法还包括数据被训练来创建精确的分类模型。
可选地,在如上所述的方法中,所述方法还包括所述分类模型被用于电话呼叫,以识别相似的音频片段,并根据所述标签进行分类。
上述技术方案仅为本发明实施例的一些部分,本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。
本领域技术人员将会理解,通过本发明可以实现的效果不限于上文已经具体描述的内容,并且从以下详细说明中将更清楚地理解本发明的其他优点。
附图说明
被包括以提供对本发明的进一步理解的附图示出本发明的实施例,并且与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的基于机器学习对于振铃进行分类的方法的流程图。
具体实施方式
现在将详细参考本发明的示例性实施例,其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例,而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践本发明。
在一些情况下,已知的结构和设备被省略或以框图形式示出,集中于结构和设备的重要特征,以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1示出了本发明实施例提供的基于机器学习对于振铃进行分类的方法的流程图。如图1所示,本发明提供了一种基于机器学习对于振铃进行分类的方法,所述方法包括:基于电话没有接通的原因,使用标签来对不同的振铃样本加上标记,并且将所述振铃样本切割成片段;其中,所使用的标签包括以下中的一个:号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通;其中,所使用的标签使用SessionInitiation Protocol(SIP)响应码来进行验证;所标记的片段用于训练机器学习模型,所述机器学习模型可用于对未接通的电话进行自动分类。可选地,在如上所述的方法中,所述方法还包括所标记的振铃样本被拼接成小段,以便进行更精确的分析。可选地,在如上所述的方法中,所述方法还包括将所拼接的小段输入到Python音频分类程序,所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。可选地,在如上所述的方法中,所述方法还包括数据被训练来创建精确的分类模型。可选地,在如上所述的方法中,所述方法还包括所述分类模型被用于电话呼叫,以识别相似的音频片段,并根据所述标签进行分类。
根据本发明的实施例,本发明的方法主要是利用机器学习技术为企业自动分类未接通电话的被呼方行为。本发明的方法检索铃声和消息的样本,这些样本被标记有错过呼叫的正确原因并将标记有错过呼叫的原因的样本进行拼接。本发明的方法通过Python程序处理上述拼接的样本,该程序测试音频相似性,以训练机器学习模型。然后,该模型可应用于未来的电话呼叫,以识别与模型中现有音频片段的相似性,并对这些未接通的电话进行相应的分类。企业可以使用本发明的方法的机器学习分类模型的结果数据来了解未接通调用的性质。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
如上所述,已经给出了本发明的优选实施例的详细描述,以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明,但是本领域技术人员将会理解,在不脱离所附权利要求书中描述的本发明的精神或范围的情况下,可以在本发明中进行各种修改和改变。因此,本发明不应限于在此描述的特定实施例,而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

Claims (5)

1.一种基于机器学习对于振铃进行分类的方法,其特征在于,所述方法包括:
基于电话没有接通的原因,使用标签来对不同的振铃样本加上标记,并且将所述振铃样本切割成片段;
其中,所使用的标签包括以下中的一个:号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通;
其中,所使用的标签使用Session Initiation Protocol(SIP)响应码结合人工抽样来进行双重验证;
所标记的片段用于训练机器学习模型,所述机器学习模型可用于对未接通的电话进行自动分类。
2.根据权利要求1所述的方法,
其特征在于,所述方法还包括:所标记的振铃样本被拼接成小段,以便进行更精确的分析。
3.根据权利要求2所述的方法,
其特征在于,所述方法还包括:将所拼接的小段输入到Python音频分类程序,所述Python音频分类程序使用机器学习根据相似性对所述小段进行分类。
4.根据权利要求3所述的方法,
其特征在于,所述方法还包括:数据被训练来创建精确的分类模型。
5.根据权利要求4所述的方法,
其特征在于,所述方法还包括:所述分类模型被用于电话呼叫,以识别相似的音频片段,并且根据所述标签进行分类。
CN201910782784.0A 2019-08-23 2019-08-23 一种基于机器学习对于振铃进行分类的方法 Pending CN110503980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910782784.0A CN110503980A (zh) 2019-08-23 2019-08-23 一种基于机器学习对于振铃进行分类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910782784.0A CN110503980A (zh) 2019-08-23 2019-08-23 一种基于机器学习对于振铃进行分类的方法

Publications (1)

Publication Number Publication Date
CN110503980A true CN110503980A (zh) 2019-11-26

Family

ID=68589012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910782784.0A Pending CN110503980A (zh) 2019-08-23 2019-08-23 一种基于机器学习对于振铃进行分类的方法

Country Status (1)

Country Link
CN (1) CN110503980A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504768A (zh) * 2016-10-21 2017-03-15 百度在线网络技术(北京)有限公司 基于人工智能的电话拨测音频分类方法及装置
CN108986789A (zh) * 2018-09-12 2018-12-11 携程旅游信息技术(上海)有限公司 语音识别方法、装置、存储介质及电子设备
CN109697243A (zh) * 2019-02-01 2019-04-30 网易(杭州)网络有限公司 回铃音聚类分析方法、装置、介质和计算设备
US20190253558A1 (en) * 2018-02-13 2019-08-15 Risto Haukioja System and method to automatically monitor service level agreement compliance in call centers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504768A (zh) * 2016-10-21 2017-03-15 百度在线网络技术(北京)有限公司 基于人工智能的电话拨测音频分类方法及装置
US20190253558A1 (en) * 2018-02-13 2019-08-15 Risto Haukioja System and method to automatically monitor service level agreement compliance in call centers
CN108986789A (zh) * 2018-09-12 2018-12-11 携程旅游信息技术(上海)有限公司 语音识别方法、装置、存储介质及电子设备
CN109697243A (zh) * 2019-02-01 2019-04-30 网易(杭州)网络有限公司 回铃音聚类分析方法、装置、介质和计算设备

Similar Documents

Publication Publication Date Title
US11075862B2 (en) Evaluating retraining recommendations for an automated conversational service
CN104462600B (zh) 实现来电原因自动分类的方法及装置
CN106782615B (zh) 语音数据情感检测方法和装置及系统
US11289077B2 (en) Systems and methods for speech analytics and phrase spotting using phoneme sequences
US8798255B2 (en) Methods and apparatus for deep interaction analysis
CN110019149A (zh) 一种客服知识库的建立方法、装置及设备
CN107908631A (zh) 数据处理方法、装置、存储介质和计算机设备
US20210350385A1 (en) Assistance for customer service agents
AU2020374952B2 (en) Message rerouting from an e-mail environment to a messaging environment
CN108717853A (zh) 一种人机语音交互方法、装置及存储介质
EP3175411A2 (en) System and method for meaning driven process and information management to improve efficiency, quality of work and overall customer satisfaction
CN110362545A (zh) 日志监控方法、装置、终端与计算机可读存储介质
CN109545185A (zh) 交互系统评价方法、评价系统、服务器及计算机可读介质
CN114051740A (zh) 用于外部系统集成的系统和方法
US20220060580A1 (en) Intent-driven contact center
CN112885376A (zh) 一种提高语音通话质检效果的方法和装置
US11769520B2 (en) Communication issue detection using evaluation of multiple machine learning models
CN109982293A (zh) 流量产品推送方法、系统、电子设备及存储介质
US10956914B2 (en) System and method for mapping a customer journey to a category
CN110543898A (zh) 用于噪声标签的监督学习方法、数据分类处理方法以及装置
US11290593B2 (en) Systems and methods of gateway detection in a telephone network
CN110503980A (zh) 一种基于机器学习对于振铃进行分类的方法
CN108965613A (zh) 基于催收系统品质监控的方法、存储介质以及应用服务器
US11888792B2 (en) Bot supervision
CN114586323A (zh) 到不同终结点的动态通信路由

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191126

RJ01 Rejection of invention patent application after publication