CN111787167A - 一种基于人工智能技术的语音识别打标分类方法 - Google Patents
一种基于人工智能技术的语音识别打标分类方法 Download PDFInfo
- Publication number
- CN111787167A CN111787167A CN202010601445.0A CN202010601445A CN111787167A CN 111787167 A CN111787167 A CN 111787167A CN 202010601445 A CN202010601445 A CN 202010601445A CN 111787167 A CN111787167 A CN 111787167A
- Authority
- CN
- China
- Prior art keywords
- recording
- voice
- tag
- call
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000005516 engineering process Methods 0.000 title claims abstract description 15
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 11
- 238000007689 inspection Methods 0.000 claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种基于人工智能技术的语音识别打标分类方法,包括以下步骤:步骤(1).部署录音服务程序在服务器端对通话进行录音,并且对来去话分离录制存储;步骤(2).录音服务器将来去话录音转发给语音分析引擎,步骤(3).部署智能质检程序在服务器端,在智能质检系统的参数配置模块进行字典配置,包括扩展词、停用词;步骤(4).分词;步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签,步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。本发明可以实现对全量录音进行打标、分类,根据打标分类,可快速高效的找出显性、潜在的服务质量问题和合规性风险,同时提升后续人工质检的有效产出。
Description
技术领域
本发明涉及语音识别处理技术领域,具体为一种基于人工智能技术的语音识别打标分类方法。
背景技术
随着智能化应用的高速发展以及客服中心减员增效和统一质检等新要求,联络中心传统质检产品功能和智能化程度上有待完善提升,传统的产品仅支持语音记录和人工质检,人工抽检、调听录音覆盖率低的问题,急需扩展支持对文字、视频(录屏)等形式的全媒体统一记录。
发明内容
本发明所解决的技术问题在于提供一种基于人工智能技术的语音识别打标分类方法,以解决上述背景技术中提出的问题。
本发明所解决的技术问题采用以下技术方案来实现:一种基于人工智能技术的语音识别打标分类方法,包括以下步骤:
步骤(1).部署录音服务程序在服务器端对通话进行录音,并且对来去话分离录制存储;
步骤(2).录音服务器将来去话录音转发给语音分析引擎,通过声学模型转换为对应的汉语音标符号、音标信息,再通过超大词汇网络的语言模型识别出最终对应的文本内容并存储在Elasticsearch中;
步骤(3).部署智能质检程序在服务器端,在智能质检系统的参数配置模块进行字典配置,包括扩展词、停用词;
步骤(4).录音服务器在收到引擎返回的文本并写入Elasticsearch的同时,Elasticsearch的分词器就会按照已有的扩展词、停用词进行分词;
步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签,根据标签去查询ES,获得匹配文本,将匹配到的文本对应的录音记录打标签,并将标签数据写入数据库;
步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。
所述步骤(1)中录音存储通过网络交换机的镜像功能,收取IP话机通话过程中产生的语音载波流和呼叫控制信令,利用服务器的CPU和内存资源,将线路的语音数据软解成用户定义的语音格式,录音系统将话音采集后,通过数字压缩处理将语音信息以数字信号方式先存储在本地硬盘上,再按设定的时间间隔自动备份到存储中心。
所述步骤(2)中录音转发及全文转换过程为在录音服务器上部署语音转发接口,通过转发接口将来去话分离的语音数据转发给语音引擎,语音引擎首先将分离后的语音通过声学模型转换为对应的汉语音标符号,音标信息再通过超大词汇网络的语言模型识别出最终对应的结构化文本内容,文本内容包括来去话分离的文字,时长,语速等信息,再返回给录音系统进行存储在Elasticsearch中。
所述步骤(5)中标签设置方法为基于Elasticsearch的智能质检自动标签技术是将Elasticsearch中海量的文本数据,通过用户预先设定好的条件、检索的方式自动将文本分类,从而实现将海量的录音文件分类,继而用于检索调听,分类归档,自动评分使用场景。
与现有技术相比,本发明的有益效果是:本发明可以实现对全量录音进行打标、分类,根据打标分类,可快速高效的找出显性、潜在的服务质量问题和合规性风险,同时提升后续人工质检的有效产出。
附图说明
图1为本发明的录音及转发分析过程示意图。
图2为本发明的语音引擎全文转写过程示意图。
图3为本发明的分词流程示意图。
图4为本发明的打标查询流程示意图。
具体实施方式
为了使本发明的实现技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明,在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以两个元件内部的连通。
实施例1
如图1~4所示,一种基于人工智能技术的语音识别打标分类方法,包括以下步骤:
步骤(1).部署录音服务程序在服务器端对通话进行录音,并且对来去话分离录制存储;
步骤(2).录音服务器将来去话录音转发给语音分析引擎,通过声学模型转换为对应的汉语音标符号、音标信息,再通过超大词汇网络的语言模型识别出最终对应的文本内容并存储在Elasticsearch中;
步骤(3).部署智能质检程序在服务器端,在智能质检系统的参数配置模块进行字典配置,包括扩展词、停用词;
步骤(4).录音服务器在收到引擎返回的文本并写入Elasticsearch的同时,Elasticsearch的分词器就会按照已有的扩展词、停用词进行分词;
步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签,根据标签去查询ES,获得匹配文本,将匹配到的文本对应的录音记录打标签,并将标签数据写入数据库;
步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。
所述步骤(1)中录音存储通过网络交换机的镜像功能,收取IP话机通话过程中产生的语音载波流和呼叫控制信令,利用服务器的CPU和内存资源,将线路的语音数据软解成用户定义的语音格式,录音系统将话音采集后,通过数字压缩处理将语音信息以数字信号方式先存储在本地硬盘上,再按设定的时间间隔自动备份到存储中心。
所述步骤(2)中录音转发及全文转换过程为在录音服务器上部署语音转发接口,通过转发接口将来去话分离的语音数据转发给语音引擎,语音引擎首先将分离后的语音通过声学模型转换为对应的汉语音标符号,音标信息再通过超大词汇网络的语言模型识别出最终对应的结构化文本内容,文本内容包括来去话分离的文字,时长,语速等信息,再返回给录音系统进行存储在Elasticsearch中。
所述步骤(5)中标签设置方法为基于Elasticsearch的智能质检自动标签技术是将Elasticsearch中海量的文本数据,通过用户预先设定好的条件、检索的方式自动将文本分类,从而实现将海量的录音文件分类,继而用于检索调听,分类归档,自动评分使用场景。
本发明可以按标签规则设置质检策略,系统可以根据策略进行自动评分;系统在进行查询时可以根据打标内容进行查询;系统在进行任务分配时可以根据标签内容、自动评分分数进行任务分配,可以快速高效地找出显性、潜在的服务质量问题和合规性风险,提升质检工作的有效检出。可以根据系统对全量录音文件的标注的进行数据统计和分析,为后续的报表输出提供数据来源。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明的要求保护范围由所附的权利要求书及其等效物界定。
Claims (4)
1.一种基于人工智能技术的语音识别打标分类方法,其特征在于:包括以下步骤:
步骤(1).部署录音服务程序在服务器端对通话进行录音,并且对来去话分离录制存储;
步骤(2).录音服务器将来去话录音转发给语音分析引擎,通过声学模型转换为对应的汉语音标符号、音标信息,再识别出最终对应的文本内容并存储在Elasticsearch中;
步骤(3).部署智能质检程序在服务器端,在智能质检系统的参数配置模块进行字典配置,包括扩展词、停用词;
步骤(4).录音服务器在收到引擎返回的文本并写入Elasticsearch的同时,Elasticsearch的分词器就会按照已有的扩展词、停用词进行分词;
步骤(5).系统按标签类型设置语速标签、静音标签、禁忌语标签,根据标签去查询ES,获得匹配文本,将匹配到的文本对应的录音记录打标签,并将标签数据写入数据库;
步骤(6).系统根据打标情况进行后续的查询、归类、评分操作。
2.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法,其特征在于:所述步骤(1)中录音存储通过网络交换机的镜像功能,收取IP话机通话过程中产生的语音载波流和呼叫控制信令,利用服务器的CPU和内存资源,将线路的语音数据软解成用户定义的语音格式,录音系统将话音采集后,通过数字压缩处理将语音信息以数字信号方式先存储在本地硬盘上,再按设定的时间间隔自动备份到存储中心。
3.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法,其特征在于:所述步骤(2)中录音转发及全文转换过程为在录音服务器上部署语音转发接口,通过转发接口将来去话分离的语音数据转发给语音引擎,语音引擎首先将分离后的语音通过声学模型转换为对应的汉语音标符号,音标信息再通过超大词汇网络的语言模型识别出最终对应的结构化文本内容,文本内容包括来去话分离的文字,时长,语速等信息,再返回给录音系统进行存储在Elasticsearch中。
4.根据权利要求1所述的一种基于人工智能技术的语音识别打标分类方法,其特征在于:所述步骤(5)中标签设置方法为基于Elasticsearch的智能质检自动标签技术是将Elasticsearch中海量的文本数据,通过用户预先设定好的条件、检索的方式自动将文本分类,从而实现将海量的录音文件分类,继而用于检索调听,分类归档,自动评分使用场景。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601445.0A CN111787167A (zh) | 2020-06-28 | 2020-06-28 | 一种基于人工智能技术的语音识别打标分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601445.0A CN111787167A (zh) | 2020-06-28 | 2020-06-28 | 一种基于人工智能技术的语音识别打标分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111787167A true CN111787167A (zh) | 2020-10-16 |
Family
ID=72760740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010601445.0A Withdrawn CN111787167A (zh) | 2020-06-28 | 2020-06-28 | 一种基于人工智能技术的语音识别打标分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111787167A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114441029A (zh) * | 2022-01-20 | 2022-05-06 | 深圳壹账通科技服务有限公司 | 语音标注系统的录音噪音检测方法、装置、设备及介质 |
CN114710592A (zh) * | 2022-04-11 | 2022-07-05 | 深圳市银服通企业管理咨询有限公司 | 一种基于人工智能的呼叫系统及方法 |
-
2020
- 2020-06-28 CN CN202010601445.0A patent/CN111787167A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114441029A (zh) * | 2022-01-20 | 2022-05-06 | 深圳壹账通科技服务有限公司 | 语音标注系统的录音噪音检测方法、装置、设备及介质 |
CN114710592A (zh) * | 2022-04-11 | 2022-07-05 | 深圳市银服通企业管理咨询有限公司 | 一种基于人工智能的呼叫系统及方法 |
CN114710592B (zh) * | 2022-04-11 | 2023-05-02 | 江西省信合客户服务有限公司 | 一种基于人工智能的呼叫系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658939B (zh) | 一种电话录音未接通原因识别方法 | |
CN110557589B (zh) | 用于整合记录的内容的系统和方法 | |
CN103700370B (zh) | 一种广播电视语音识别系统方法及系统 | |
US8447015B2 (en) | Method and system for processing messages within the framework of an integrated message system | |
JP4619623B2 (ja) | ボイスメッセージ処理システムおよび方法 | |
US20160179831A1 (en) | Systems and methods for textual content creation from sources of audio that contain speech | |
CN111312219B (zh) | 电话录音标注方法、系统、存储介质和电子设备 | |
CN111787167A (zh) | 一种基于人工智能技术的语音识别打标分类方法 | |
CN100508587C (zh) | 一种基于语音分类识别的新闻视频检索方法 | |
JP2001515634A (ja) | ストーリーセグメンテーション機能を有するマルチメディアコンピュータシステム及びその動作プログラム | |
JP2004229283A (ja) | ニュースビデオにおいてニュース司会者の遷移を識別する方法 | |
CN116318457B (zh) | 一种无线电信号监测方法及系统 | |
US10762375B2 (en) | Media management system for video data processing and adaptation data generation | |
JP6208794B2 (ja) | 会話分析装置、方法及びコンピュータプログラム | |
CN111625863A (zh) | 隐私保护方法、装置、电子设备及存储介质 | |
CN118248177B (zh) | 基于近似最近邻搜索算法的语音情感识别系统及方法 | |
CN101950564A (zh) | 一种远程数字化语音采集分析识别系统 | |
CN117316165B (zh) | 一种基于时序的会议音频分析处理方法及系统 | |
KR20010037652A (ko) | 오디오 색인화 장치 및 그 방법과 그를 이용한 오디오 검색 시스템 및 그 방법 | |
CN107357859A (zh) | 一种通过语音采集实现知识库自动显示的智能终端 | |
Wang et al. | Content-based audio classification using support vector machines and independent component analysis | |
CN116128546A (zh) | 一种电力行业对外服务窗口的ai舆情监测系统和方法 | |
CN112201225B (zh) | 一种语料获取的方法、装置、可读存储介质和电子设备 | |
CN111785273A (zh) | 一种基于人工智能技术的语音智能质检字典配置方法 | |
CN111666525B (zh) | 一种信息拦截系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201016 |