CN113037934A - 一种基于呼叫中心通话录音的热词分析系统 - Google Patents

一种基于呼叫中心通话录音的热词分析系统 Download PDF

Info

Publication number
CN113037934A
CN113037934A CN202110216370.9A CN202110216370A CN113037934A CN 113037934 A CN113037934 A CN 113037934A CN 202110216370 A CN202110216370 A CN 202110216370A CN 113037934 A CN113037934 A CN 113037934A
Authority
CN
China
Prior art keywords
word
analysis
call
recording
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110216370.9A
Other languages
English (en)
Inventor
韩召宁
沈孝北
刘川福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Jinxun Software Technology Co ltd
Original Assignee
Xi'an Jinxun Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Jinxun Software Technology Co ltd filed Critical Xi'an Jinxun Software Technology Co ltd
Priority to CN202110216370.9A priority Critical patent/CN113037934A/zh
Publication of CN113037934A publication Critical patent/CN113037934A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据;ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,本发明解决了传统的呼叫中心录音分析中对热词标签覆盖率不够高,没有固定标准,太过于依赖行业传统经验,难以在多维度对热词进行分析的问题;本发明实现了准确率更高的识别引擎,私有化部署,确保数据安全,定制语音识别引擎,识别一切想识别的专有词,对现有的热词进行标准化定义,使多维度分析统一化。

Description

一种基于呼叫中心通话录音的热词分析系统
技术领域
本发明属于NLP自然语言处理技术领域,具体涉及一种基于呼叫中心通话录音的热词分析系统。
背景技术
传统的呼叫中心录音热词分析,一般时把实时通话保存为语音文件,然后通过人工方法,使用传统经验进行人工听取、分析。传统方法对热词标签覆盖率不够高,没有固定标准,口口相传,太过依赖于行业传统经验,难以在多维度对热词进行分析。同时由于的不同的分析人员由于经验、认知的理解的不一致,分析结果也不好统一,导致无法形成精准、可靠的分析结果,客户也很难认可分析结果。
发明内容
本发明的目的在于提供一种基于呼叫中心通话录音的热词分析系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
与现有技术相比,本发明的有益效果是:本发明使用了NLP自然语言处理技术、语音识别技术、中文分词技术等,通过自研热词分析算法模型实现分析结果;解决了传统的呼叫中心录音分析中对热词标签覆盖率不够高,没有固定标准,太过于依赖行业传统经验,难以在多维度对热词进行分析的问题;本发明实现了准确率更高的识别引擎,私有化部署,确保数据安全,定制语音识别引擎,识别一切想识别的专有词,对现有的热词进行标准化定义,使多维度分析统一化。
附图说明
图1为本发明的热词分析算法模型原理示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1,本发明提供一种技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
本实施例中,优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
本实施例中,优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
本实施例中,优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种基于呼叫中心通话录音的热词分析系统,其特征在于:包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
2.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
3.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
4.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
CN202110216370.9A 2021-02-26 2021-02-26 一种基于呼叫中心通话录音的热词分析系统 Pending CN113037934A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110216370.9A CN113037934A (zh) 2021-02-26 2021-02-26 一种基于呼叫中心通话录音的热词分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110216370.9A CN113037934A (zh) 2021-02-26 2021-02-26 一种基于呼叫中心通话录音的热词分析系统

Publications (1)

Publication Number Publication Date
CN113037934A true CN113037934A (zh) 2021-06-25

Family

ID=76462098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110216370.9A Pending CN113037934A (zh) 2021-02-26 2021-02-26 一种基于呼叫中心通话录音的热词分析系统

Country Status (1)

Country Link
CN (1) CN113037934A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722508A (zh) * 2021-09-02 2021-11-30 中国农业银行股份有限公司 词云展示方法及装置、存储介质及电子设备
CN116614574A (zh) * 2023-07-18 2023-08-18 深圳市优利麦克科技开发有限公司 一种通话录音控制方法及移动通信终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506870A (zh) * 2017-09-06 2017-12-22 国家电网公司 一种基于热词的供电服务热点预测方法
US20180133900A1 (en) * 2016-11-15 2018-05-17 JIBO, Inc. Embodied dialog and embodied speech authoring tools for use with an expressive social robot
CN110035187A (zh) * 2019-04-16 2019-07-19 浙江百应科技有限公司 一种在电话中实现ai和人工坐席无缝切换的方法
CN111783438A (zh) * 2020-05-22 2020-10-16 贵州电网有限责任公司 实现工单分析的热词检测方法
CN112150694A (zh) * 2020-08-12 2020-12-29 国网浙江省电力有限公司营销服务中心 一种智能语音电费催缴系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180133900A1 (en) * 2016-11-15 2018-05-17 JIBO, Inc. Embodied dialog and embodied speech authoring tools for use with an expressive social robot
CN107506870A (zh) * 2017-09-06 2017-12-22 国家电网公司 一种基于热词的供电服务热点预测方法
CN110035187A (zh) * 2019-04-16 2019-07-19 浙江百应科技有限公司 一种在电话中实现ai和人工坐席无缝切换的方法
CN111783438A (zh) * 2020-05-22 2020-10-16 贵州电网有限责任公司 实现工单分析的热词检测方法
CN112150694A (zh) * 2020-08-12 2020-12-29 国网浙江省电力有限公司营销服务中心 一种智能语音电费催缴系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722508A (zh) * 2021-09-02 2021-11-30 中国农业银行股份有限公司 词云展示方法及装置、存储介质及电子设备
CN116614574A (zh) * 2023-07-18 2023-08-18 深圳市优利麦克科技开发有限公司 一种通话录音控制方法及移动通信终端
CN116614574B (zh) * 2023-07-18 2023-10-10 深圳市优利麦克科技开发有限公司 一种通话录音控制方法及移动通信终端

Similar Documents

Publication Publication Date Title
CN108962282B (zh) 语音检测分析方法、装置、计算机设备及存储介质
CN109255113B (zh) 智能校对系统
CN106021410A (zh) 一种基于机器学习的源代码注释质量评估方法
CN113037934A (zh) 一种基于呼叫中心通话录音的热词分析系统
CN110837742A (zh) 一种包含人工智能的人机结合译文批量处理翻译方法
CN110413998B (zh) 一种面向电力行业的自适应中文分词方法及其系统、介质
CN112530434A (zh) 电站自动化智能机器人值守调度系统
CN114969297A (zh) 一种电力客户诉求相关度分析方法
CN110196897A (zh) 一种基于问答模板的案例识别方法
CN111427996B (zh) 一种人机交互文本中抽取日期时间的方法和装置
CN109618067A (zh) 外呼对话处理方法和系统
CN111339757A (zh) 一种催收场景下语音识别结果的纠错方法
CN116828109A (zh) 一种电话客服服务质量智能评估方法及系统
CN111246026A (zh) 一种基于卷积神经网络和连接性时序分类的录音处理方法
CN116341525A (zh) 一种基于自然语言处理的文本审查纠错系统
CN107291952B (zh) 一种提取有意义串的方法及装置
JP2011123565A (ja) Faq候補抽出システムおよびfaq候補抽出プログラム
CN114707515A (zh) 话术判别方法、装置、电子设备及存储介质
CN114419645A (zh) 一种基于ai的合同智能解析方法
CN113936692A (zh) 基于机器学习的客服语音文本的大数据质检方法
CN114492436A (zh) 一种审计访谈信息的处理方法、装置和系统
CN111489744A (zh) 一种智慧银行管理系统
CN112488593A (zh) 一种用于招标的辅助评标系统及方法
CN112364212A (zh) 一种基于近似音识别的语音人名识别方法
CN111507751A (zh) 一种基于沟通数据的线索打分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination