CN111787167A

CN111787167A - 一种基于人工智能技术的语音识别打标分类方法

Info

Publication number: CN111787167A
Application number: CN202010601445.0A
Authority: CN
Inventors: 陈冬辉; 梁亚峰; 樊萍; 蒋晰明; 方雷; 方锦文; 吴义君
Original assignee: Shanghai Anluyu High Data Technology Co ltd
Current assignee: Shanghai Anluyu High Data Technology Co ltd
Priority date: 2020-06-28
Filing date: 2020-06-28
Publication date: 2020-10-16

Abstract

本发明提供一种基于人工智能技术的语音识别打标分类方法，包括以下步骤：步骤(1).部署录音服务程序在服务器端对通话进行录音，并且对来去话分离录制存储；步骤(2).录音服务器将来去话录音转发给语音分析引擎，步骤(3).部署智能质检程序在服务器端，在智能质检系统的参数配置模块进行字典配置，包括扩展词、停用词；步骤(4).分词；步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签，步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。本发明可以实现对全量录音进行打标、分类，根据打标分类，可快速高效的找出显性、潜在的服务质量问题和合规性风险，同时提升后续人工质检的有效产出。

Description

一种基于人工智能技术的语音识别打标分类方法

技术领域

本发明涉及语音识别处理技术领域，具体为一种基于人工智能技术的语音识别打标分类方法。

背景技术

随着智能化应用的高速发展以及客服中心减员增效和统一质检等新要求，联络中心传统质检产品功能和智能化程度上有待完善提升，传统的产品仅支持语音记录和人工质检，人工抽检、调听录音覆盖率低的问题，急需扩展支持对文字、视频(录屏)等形式的全媒体统一记录。

发明内容

本发明所解决的技术问题在于提供一种基于人工智能技术的语音识别打标分类方法，以解决上述背景技术中提出的问题。

本发明所解决的技术问题采用以下技术方案来实现：一种基于人工智能技术的语音识别打标分类方法，包括以下步骤：

步骤(1).部署录音服务程序在服务器端对通话进行录音，并且对来去话分离录制存储；

步骤(2).录音服务器将来去话录音转发给语音分析引擎，通过声学模型转换为对应的汉语音标符号、音标信息，再通过超大词汇网络的语言模型识别出最终对应的文本内容并存储在Elasticsearch中；

步骤(3).部署智能质检程序在服务器端，在智能质检系统的参数配置模块进行字典配置，包括扩展词、停用词；

步骤(4).录音服务器在收到引擎返回的文本并写入Elasticsearch的同时，Elasticsearch的分词器就会按照已有的扩展词、停用词进行分词；

步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签，根据标签去查询ES，获得匹配文本，将匹配到的文本对应的录音记录打标签，并将标签数据写入数据库；

步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。

所述步骤(1)中录音存储通过网络交换机的镜像功能，收取IP话机通话过程中产生的语音载波流和呼叫控制信令，利用服务器的CPU和内存资源，将线路的语音数据软解成用户定义的语音格式，录音系统将话音采集后，通过数字压缩处理将语音信息以数字信号方式先存储在本地硬盘上，再按设定的时间间隔自动备份到存储中心。

所述步骤(2)中录音转发及全文转换过程为在录音服务器上部署语音转发接口，通过转发接口将来去话分离的语音数据转发给语音引擎，语音引擎首先将分离后的语音通过声学模型转换为对应的汉语音标符号，音标信息再通过超大词汇网络的语言模型识别出最终对应的结构化文本内容，文本内容包括来去话分离的文字，时长，语速等信息，再返回给录音系统进行存储在Elasticsearch中。

所述步骤(5)中标签设置方法为基于Elasticsearch的智能质检自动标签技术是将Elasticsearch中海量的文本数据，通过用户预先设定好的条件、检索的方式自动将文本分类，从而实现将海量的录音文件分类，继而用于检索调听，分类归档，自动评分使用场景。

与现有技术相比，本发明的有益效果是：本发明可以实现对全量录音进行打标、分类，根据打标分类，可快速高效的找出显性、潜在的服务质量问题和合规性风险，同时提升后续人工质检的有效产出。

附图说明

图1为本发明的录音及转发分析过程示意图。

图2为本发明的语音引擎全文转写过程示意图。

图3为本发明的分词流程示意图。

图4为本发明的打标查询流程示意图。

具体实施方式

为了使本发明的实现技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明，在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以两个元件内部的连通。

实施例1

如图1～4所示，一种基于人工智能技术的语音识别打标分类方法，包括以下步骤：

本发明可以按标签规则设置质检策略，系统可以根据策略进行自动评分；系统在进行查询时可以根据打标内容进行查询；系统在进行任务分配时可以根据标签内容、自动评分分数进行任务分配，可以快速高效地找出显性、潜在的服务质量问题和合规性风险，提升质检工作的有效检出。可以根据系统对全量录音文件的标注的进行数据统计和分析，为后续的报表输出提供数据来源。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明的要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于人工智能技术的语音识别打标分类方法，其特征在于：包括以下步骤：

步骤(2).录音服务器将来去话录音转发给语音分析引擎，通过声学模型转换为对应的汉语音标符号、音标信息，再识别出最终对应的文本内容并存储在Elasticsearch中；

2.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法，其特征在于：所述步骤(1)中录音存储通过网络交换机的镜像功能，收取IP话机通话过程中产生的语音载波流和呼叫控制信令，利用服务器的CPU和内存资源，将线路的语音数据软解成用户定义的语音格式，录音系统将话音采集后，通过数字压缩处理将语音信息以数字信号方式先存储在本地硬盘上，再按设定的时间间隔自动备份到存储中心。

3.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法，其特征在于：所述步骤(2)中录音转发及全文转换过程为在录音服务器上部署语音转发接口，通过转发接口将来去话分离的语音数据转发给语音引擎，语音引擎首先将分离后的语音通过声学模型转换为对应的汉语音标符号，音标信息再通过超大词汇网络的语言模型识别出最终对应的结构化文本内容，文本内容包括来去话分离的文字，时长，语速等信息，再返回给录音系统进行存储在Elasticsearch中。

4.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法，其特征在于：所述步骤(5)中标签设置方法为基于Elasticsearch的智能质检自动标签技术是将Elasticsearch中海量的文本数据，通过用户预先设定好的条件、检索的方式自动将文本分类，从而实现将海量的录音文件分类，继而用于检索调听，分类归档，自动评分使用场景。