CN113037934A - 一种基于呼叫中心通话录音的热词分析系统 - Google Patents
一种基于呼叫中心通话录音的热词分析系统 Download PDFInfo
- Publication number
- CN113037934A CN113037934A CN202110216370.9A CN202110216370A CN113037934A CN 113037934 A CN113037934 A CN 113037934A CN 202110216370 A CN202110216370 A CN 202110216370A CN 113037934 A CN113037934 A CN 113037934A
- Authority
- CN
- China
- Prior art keywords
- word
- analysis
- call
- recording
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 49
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000005516 engineering process Methods 0.000 claims description 22
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000003058 natural language processing Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 3
- 238000004141 dimensional analysis Methods 0.000 abstract description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/5307—Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据;ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,本发明解决了传统的呼叫中心录音分析中对热词标签覆盖率不够高,没有固定标准,太过于依赖行业传统经验,难以在多维度对热词进行分析的问题;本发明实现了准确率更高的识别引擎,私有化部署,确保数据安全,定制语音识别引擎,识别一切想识别的专有词,对现有的热词进行标准化定义,使多维度分析统一化。
Description
技术领域
本发明属于NLP自然语言处理技术领域,具体涉及一种基于呼叫中心通话录音的热词分析系统。
背景技术
传统的呼叫中心录音热词分析,一般时把实时通话保存为语音文件,然后通过人工方法,使用传统经验进行人工听取、分析。传统方法对热词标签覆盖率不够高,没有固定标准,口口相传,太过依赖于行业传统经验,难以在多维度对热词进行分析。同时由于的不同的分析人员由于经验、认知的理解的不一致,分析结果也不好统一,导致无法形成精准、可靠的分析结果,客户也很难认可分析结果。
发明内容
本发明的目的在于提供一种基于呼叫中心通话录音的热词分析系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
与现有技术相比,本发明的有益效果是:本发明使用了NLP自然语言处理技术、语音识别技术、中文分词技术等,通过自研热词分析算法模型实现分析结果;解决了传统的呼叫中心录音分析中对热词标签覆盖率不够高,没有固定标准,太过于依赖行业传统经验,难以在多维度对热词进行分析的问题;本发明实现了准确率更高的识别引擎,私有化部署,确保数据安全,定制语音识别引擎,识别一切想识别的专有词,对现有的热词进行标准化定义,使多维度分析统一化。
附图说明
图1为本发明的热词分析算法模型原理示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1,本发明提供一种技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
本实施例中,优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
本实施例中,优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
本实施例中,优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (4)
1.一种基于呼叫中心通话录音的热词分析系统,其特征在于:包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;
ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;
NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;
执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;
分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。
2.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。
3.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);
对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;
依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。
4.根据权利要求1所述的一种基于呼叫中心通话录音的热词分析系统,其特征在于:实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110216370.9A CN113037934A (zh) | 2021-02-26 | 2021-02-26 | 一种基于呼叫中心通话录音的热词分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110216370.9A CN113037934A (zh) | 2021-02-26 | 2021-02-26 | 一种基于呼叫中心通话录音的热词分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113037934A true CN113037934A (zh) | 2021-06-25 |
Family
ID=76462098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110216370.9A Pending CN113037934A (zh) | 2021-02-26 | 2021-02-26 | 一种基于呼叫中心通话录音的热词分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113037934A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722508A (zh) * | 2021-09-02 | 2021-11-30 | 中国农业银行股份有限公司 | 词云展示方法及装置、存储介质及电子设备 |
CN116614574A (zh) * | 2023-07-18 | 2023-08-18 | 深圳市优利麦克科技开发有限公司 | 一种通话录音控制方法及移动通信终端 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506870A (zh) * | 2017-09-06 | 2017-12-22 | 国家电网公司 | 一种基于热词的供电服务热点预测方法 |
US20180133900A1 (en) * | 2016-11-15 | 2018-05-17 | JIBO, Inc. | Embodied dialog and embodied speech authoring tools for use with an expressive social robot |
CN110035187A (zh) * | 2019-04-16 | 2019-07-19 | 浙江百应科技有限公司 | 一种在电话中实现ai和人工坐席无缝切换的方法 |
CN111783438A (zh) * | 2020-05-22 | 2020-10-16 | 贵州电网有限责任公司 | 实现工单分析的热词检测方法 |
CN112150694A (zh) * | 2020-08-12 | 2020-12-29 | 国网浙江省电力有限公司营销服务中心 | 一种智能语音电费催缴系统及方法 |
-
2021
- 2021-02-26 CN CN202110216370.9A patent/CN113037934A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180133900A1 (en) * | 2016-11-15 | 2018-05-17 | JIBO, Inc. | Embodied dialog and embodied speech authoring tools for use with an expressive social robot |
CN107506870A (zh) * | 2017-09-06 | 2017-12-22 | 国家电网公司 | 一种基于热词的供电服务热点预测方法 |
CN110035187A (zh) * | 2019-04-16 | 2019-07-19 | 浙江百应科技有限公司 | 一种在电话中实现ai和人工坐席无缝切换的方法 |
CN111783438A (zh) * | 2020-05-22 | 2020-10-16 | 贵州电网有限责任公司 | 实现工单分析的热词检测方法 |
CN112150694A (zh) * | 2020-08-12 | 2020-12-29 | 国网浙江省电力有限公司营销服务中心 | 一种智能语音电费催缴系统及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722508A (zh) * | 2021-09-02 | 2021-11-30 | 中国农业银行股份有限公司 | 词云展示方法及装置、存储介质及电子设备 |
CN116614574A (zh) * | 2023-07-18 | 2023-08-18 | 深圳市优利麦克科技开发有限公司 | 一种通话录音控制方法及移动通信终端 |
CN116614574B (zh) * | 2023-07-18 | 2023-10-10 | 深圳市优利麦克科技开发有限公司 | 一种通话录音控制方法及移动通信终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108962282B (zh) | 语音检测分析方法、装置、计算机设备及存储介质 | |
CN109255113B (zh) | 智能校对系统 | |
CN106021410A (zh) | 一种基于机器学习的源代码注释质量评估方法 | |
CN113037934A (zh) | 一种基于呼叫中心通话录音的热词分析系统 | |
CN110837742A (zh) | 一种包含人工智能的人机结合译文批量处理翻译方法 | |
CN110413998B (zh) | 一种面向电力行业的自适应中文分词方法及其系统、介质 | |
CN112530434A (zh) | 电站自动化智能机器人值守调度系统 | |
CN114969297A (zh) | 一种电力客户诉求相关度分析方法 | |
CN110196897A (zh) | 一种基于问答模板的案例识别方法 | |
CN111427996B (zh) | 一种人机交互文本中抽取日期时间的方法和装置 | |
CN109618067A (zh) | 外呼对话处理方法和系统 | |
CN111339757A (zh) | 一种催收场景下语音识别结果的纠错方法 | |
CN116828109A (zh) | 一种电话客服服务质量智能评估方法及系统 | |
CN111246026A (zh) | 一种基于卷积神经网络和连接性时序分类的录音处理方法 | |
CN116341525A (zh) | 一种基于自然语言处理的文本审查纠错系统 | |
CN107291952B (zh) | 一种提取有意义串的方法及装置 | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
CN114707515A (zh) | 话术判别方法、装置、电子设备及存储介质 | |
CN114419645A (zh) | 一种基于ai的合同智能解析方法 | |
CN113936692A (zh) | 基于机器学习的客服语音文本的大数据质检方法 | |
CN114492436A (zh) | 一种审计访谈信息的处理方法、装置和系统 | |
CN111489744A (zh) | 一种智慧银行管理系统 | |
CN112488593A (zh) | 一种用于招标的辅助评标系统及方法 | |
CN112364212A (zh) | 一种基于近似音识别的语音人名识别方法 | |
CN111507751A (zh) | 一种基于沟通数据的线索打分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |