CN110059161A - 一种基于文本分类技术的电话语音机器人系统 - Google Patents

一种基于文本分类技术的电话语音机器人系统 Download PDF

Info

Publication number
CN110059161A
CN110059161A CN201910330593.0A CN201910330593A CN110059161A CN 110059161 A CN110059161 A CN 110059161A CN 201910330593 A CN201910330593 A CN 201910330593A CN 110059161 A CN110059161 A CN 110059161A
Authority
CN
China
Prior art keywords
text
classification
voice
training
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910330593.0A
Other languages
English (en)
Inventor
陈捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dazhong Communication Technology Co Ltd
Original Assignee
Shenzhen Dazhong Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dazhong Communication Technology Co Ltd filed Critical Shenzhen Dazhong Communication Technology Co Ltd
Priority to CN201910330593.0A priority Critical patent/CN110059161A/zh
Publication of CN110059161A publication Critical patent/CN110059161A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/4228Systems providing special services or facilities to subscribers in networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于文本分类技术的电话语音机器人系统,包括语音网关、呼叫与媒体服务器、语音识别服务器、对话服务器及分类模块,本发明的文本分类方法包括以下步骤:S1,获取语音识别文本;S2,将所述文本进行预处理,删除非标准字符;S3,调用分词工具进行分词;S4,删除高词频的停用词;S5,使用预先训练完成的模型对文本进行分类。本发明通过对用户语音识别文本进行准确分类,增强了关键词的匹配度,能够有效识别同音字及近音字,支持多个关键词相关文本的正确分类,提高了电话语音机器人对客户问题的理解能力。

Description

一种基于文本分类技术的电话语音机器人系统
技术领域
本发明涉及通信技术领域,特别是涉及一种基于文本分类技术电话语音机器人系统。
背景技术
传统呼叫中心的话务员工作简单重复、工作压力大、效率低,随着经济发展,人力成本上升得非常快,因此越来越多的呼叫中心采用电话机器人来部分取代这些简单重复的话务员工作。
目前,也有一些电话机器人开始投入使用,但是目前的电话机器人存在以下问题:
1、电话机器人并不能理解客户的问题,只是对语音识别后的文字进行关键词匹配,搜寻现有答案。
2、语音识别准确度普遍不高,有一定概率的识别错误或者识别成同音词的情况,会使关键词匹配错误,导致所答非所问。
3、关键词匹配不能根据语义进行匹配,客户同一个语义的不同表述方式不能进行正确匹配。
4、关键词匹配目前大都只能支持单关键词,对于多个关键词的情况,无法正确匹配。
发明内容
本发明的目的是克服现有技术中的不足之处,提供一种基于文本分类技术电话语音机器人系统,以解决上述背景技术中存在的问题。
为解决上述技术问题,本发明通过下述技术方案来解决:
一种基于文本分类技术的电话语音机器人系统,包括:
呼叫与媒体服务器,用于根据对话服务器的指令通过语音网关向用户终端发起语音呼叫,并接收用户终端发送的语音,以及将所接收到的语音发送至语音识别服务器进行语音识别;
所述语音识别服务器,用于将所接收到的语音进行识别,生成文本,以及将所述识别得到的文本发送至所述对话服务器;
所述对话服务器,用于调用分类模块对所述识别文本进行分类,并根据分类结果以及当前系统状态向用户播放不同语音,然后进行状态迁移;
所述分类模块,用于在离线状态以预训练词向量为基础,使用人工生成的小样本数据进行分类训练,并根据分类训练得到的模型对所述识别文本进行在线分类处理。
进一步的,所述对话服务器向用户播放的语音通知为预先录制的语音或文本转换的语音。
本发明还提供了一种应用于所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法,包括以下步骤:
S1,获取语音识别后得到的识别结果文本;
S2,将所述文本进行预处理,删除非标准字符;
S3,调用分词工具进行分词;
S4,删除高词频的停用词;
S5,使用预先训练完成的模型对文本进行分类。
其中,步骤S5中的所述预先训练完成的模型通过以下步骤获得:
S51,获取预训练词向量;
S52,制作文本分类所需的数据集,将电话语音机器人与用户的对话内容分成问答序列,每一个不同回答作为一个单独类别;
S53,文本分类以预训练词向量为基础,以手工制作的小样本数据集进行分类训练。
其中,步骤S53中,分类训练采用的分类器为fasttext,算法为CBOW(连续词袋)+softmax。
本发明相比现有技术具有以下优点及有益效果:
1,本发明的电话语音机器人系统包括用分类模块,通过对用户语音信号的识别文本进行准确分类,增强了关键词的匹配度,提高了电话语音机器人对客户意图的理解能力。
2,本发明语音识别的文本分类方法中,以预训练词向量作为训练样本进行分类训练,将对话机器人与客户的对话内容分成问答序列,每一个不同回答作为一个单独类别,并手工制作分类训练的数据集,然后根据分类训练得到的模型对所述识别文本进行分类处理,分类过程中,具有一定的容错能力,对词义相似但表达不同的文本也能完成准确分类,使电话语音机器人能够对客户的意图进行准确识别,有效避免了答非所问。
3.本发明语音识别的文本分类方法能够支持多个关键词相关文本的正确分类,在通话过程中,可对多个关键词正确匹配,避免了现有技术中只能支持单个关键词的缺陷,提高电话语音机器人的语音识别效率。
4.本发明语音识别的文本分类方法中,使用预先训练完成的模型对文本进行分类,在电话机器人与客户的通话过程中,对于个别语音识别错误、同音字、近音字识别错误的情况,只要将错误识别的数据写入分类训练的数据集进行重新训练,也能够保证正确分类,进一步提高了对客户意图理解的准确性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为一种基于文本分类技术的电话语音机器人系统架构图。
图2为一种基于文本分类技术的电话语音机器人系统的工作流程图。
图3为一种基于文本分类技术的电话语音机器人系统的文本分类方法流程图。
图4为一种基于文本分类技术的电话语音机器人系统的文本分类方法训练流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明的具体实施过程如下:
如图1所示,一种基于文本分类技术的电话语音机器人系统,包括:
呼叫与媒体服务器2,用于根据对话服务器3的指令通过语音网关1向用户终端发起语音呼叫,并接收用户终端发送的语音,以及将所接收到的语音发送至语音识别服务器4进行语音识别;
所述语音识别服务器4,用于将所接收到的语音进行识别,并生成文本,以及将所述识别生成文本发送至所述对话服务器3;
所述对话服务器3,用于调用分类模块对所述识别文本进行分类处理,并根据分类处理结果以及系统状态向用户播放不同的语音通知,之后进行状态迁移,本实施例中,所述语音通知为预先录制的语音或文本转换的语音;
所述分类模块,以预训练词向量为基础使用手工生成的小样本数据进行分类训练,并根据分类训练得到的模型对所述识别文本进行分类处理。
请参考图2,本实施例中的电话语音机器人系统的工作过程如下:
(1)对话服务器向呼叫与媒体服务器发出指令以发起呼叫;
(2)呼叫与媒体服务器发送SIP invite消息给语音网关,语音网关通过运营商电信网络发起呼叫;
(3)用户应答后,语音网关返回SIP 200 OK响应给呼叫与媒体服务器,并转发至对话服务器;
(4)呼叫进入通话状态;
(5)呼叫与媒体服务器接收到用户终端发送的语音,并将语音媒体流发送到语音识别服务器进行语音识别;
(6)语音识别服务器对所述语音进行识别并向呼叫与媒体服务器反馈语音识别结果,所述识别结果是将所述语音进行识别后得到的文本;
(7)呼叫与媒体服务器将所述识别文本转发至对话服务器;
(8)对话服务器调用分类模块对所述识别文本进行分类;
(9)对话服务器查询状态,根据分类结果和状态决定播放的语音通知类型和新状态迁移;
(10)对话服务器执行向用户发送语音通知以及状态迁移的动作;
(11)重复(5)至(10)的步骤以持续通话。
请参考图3,本发明还提供了一种应用于所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法,包括以下步骤:
S1,获取语音识别文本;
S2,将所述文本进行预处理,删除非标准字符,仅保留中英文和数字;
S3,调用分词工具进行分词;
S4,删除高词频的停用词;
S5,使用预先训练完成的模型对文本进行分类,分类器可使用fasttext。
进一步的,请参考图4,步骤S5中的所述预先训练完成的模型通过以下步骤获得:
S51,获取预训练词向量,所述预训练词向量可以是现有的,目前有多个自然语言处理相关的互联网站提供工业级预训练词向量的下载,若无法获取,也可以下载维基百科或其他语料使用word2vec或者fasttext工具进行训练获得词向量。
S52,手工制作文本分类所需的数据集,将电话语音机器人与用户的对话内容分成问答序列,每一个不同回答作为一个单独类别;
S53,文本分类以预训练词向量为基础,以手工制作的小样本数据集进行分类训练。
进一步的,步骤S53中,分类训练采用的分类器为fasttext,算法为CBOW(连续词袋)+softmax。通过上述分类模型的训练,使本发明在语音识别的过程中,对于个别语音识别错误、同音字、近音字识别错误的情况,只要将错误识别的数据写入分类训练的数据集进行重新训练,也能够保证正确分类,能够提高了语音识别的准确性。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于文本分类技术的电话语音机器人系统,其特征在于,包括:
呼叫与媒体服务器,用于根据对话服务器的指令通过语音网关向用户终端发起语音呼叫,并接收用户终端发送的语音,以及将所接收到的语音发送至语音识别服务器进行语音识别;
所述语音识别服务器,用于将所接收到的语音进行识别,并生成文本,以及将所述识别得到的文本发送至所述对话服务器;
所述对话服务器,用于调用分类模块对所述语音识别服务器识别的文本进行分类,并根据分类结果以及当前系统状态向用户播放不同语音,然后进行状态迁移;
所述分类模块,用于在离线状态以预训练词向量为基础,使用人工生成的小样本数据进行分类训练,并根据分类训练得到的模型对所述识别到的文本进行在线分类处理。
2.根据权利要求1所述的一种基于文本分类技术的电话语音机器人系统,其特征在于:所述对话服务器向用户播放的语音为预先录制的语音或文本转换的语音。
3.一种应用于权利要求1至2任一项所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法,其特征在于,包括以下步骤:
S1,获取语音识别后得到的识别结果文本;
S2,将所述文本进行预处理,删除非标准字符;
S3,调用分词工具进行分词;
S4,删除高词频的停用词;
S5,使用预先训练完成的模型对文本进行分类。
4.根据权利要求3所述的方法,其特征在于:步骤S5中的所述预先训练完成的模型通过以下步骤获得:
S51,获取预训练词向量;
S52,制作文本分类所需的数据集,将电话语音机器人与用户的对话内容分成问答序列,每一个不同回答作为一个单独类别;
S53,文本分类以预训练词向量为基础,以手工制作的小样本数据集进行分类训练。
5.根据权利要求4所述的方法,其特征在于:步骤S53中,分类训练采用的分类器为fasttext,算法为CBOW+softmax。
CN201910330593.0A 2019-04-23 2019-04-23 一种基于文本分类技术的电话语音机器人系统 Pending CN110059161A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910330593.0A CN110059161A (zh) 2019-04-23 2019-04-23 一种基于文本分类技术的电话语音机器人系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910330593.0A CN110059161A (zh) 2019-04-23 2019-04-23 一种基于文本分类技术的电话语音机器人系统

Publications (1)

Publication Number Publication Date
CN110059161A true CN110059161A (zh) 2019-07-26

Family

ID=67320270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910330593.0A Pending CN110059161A (zh) 2019-04-23 2019-04-23 一种基于文本分类技术的电话语音机器人系统

Country Status (1)

Country Link
CN (1) CN110059161A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705218A (zh) * 2019-10-11 2020-01-17 浙江百应科技有限公司 一种基于深度学习的外呼状态识别方式
CN110929031A (zh) * 2019-11-14 2020-03-27 国家电网有限公司客户服务中心南方分中心 一种线上客服交谈文本分类管理系统
CN111125337A (zh) * 2019-12-31 2020-05-08 慧择保险经纪有限公司 一种文本类型确定方法及装置
CN112836039A (zh) * 2021-01-27 2021-05-25 成都网安科技发展有限公司 基于深度学习的语音数据处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010070A1 (en) * 2006-07-10 2008-01-10 Sanghun Kim Spoken dialog system for human-computer interaction and response method therefor
CN107665706A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 快速语音交互方法及系统
CN108170818A (zh) * 2017-12-29 2018-06-15 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读介质
CN109361823A (zh) * 2018-11-01 2019-02-19 深圳市号互联科技有限公司 一种语音与文本相互转化的智能交互方式
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010070A1 (en) * 2006-07-10 2008-01-10 Sanghun Kim Spoken dialog system for human-computer interaction and response method therefor
CN107665706A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 快速语音交互方法及系统
CN108170818A (zh) * 2017-12-29 2018-06-15 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读介质
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109361823A (zh) * 2018-11-01 2019-02-19 深圳市号互联科技有限公司 一种语音与文本相互转化的智能交互方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705218A (zh) * 2019-10-11 2020-01-17 浙江百应科技有限公司 一种基于深度学习的外呼状态识别方式
CN110929031A (zh) * 2019-11-14 2020-03-27 国家电网有限公司客户服务中心南方分中心 一种线上客服交谈文本分类管理系统
CN111125337A (zh) * 2019-12-31 2020-05-08 慧择保险经纪有限公司 一种文本类型确定方法及装置
CN111125337B (zh) * 2019-12-31 2023-10-13 慧择保险经纪有限公司 一种文本类型确定方法及装置
CN112836039A (zh) * 2021-01-27 2021-05-25 成都网安科技发展有限公司 基于深度学习的语音数据处理方法和装置

Similar Documents

Publication Publication Date Title
CN112804400B (zh) 客服呼叫语音质检方法、装置、电子设备及存储介质
CN110059161A (zh) 一种基于文本分类技术的电话语音机器人系统
RU2391791C2 (ru) Машинное обучение
CN103458056B (zh) 自动外呼系统基于自动分类技术的语音意图判定系统
CN110459210A (zh) 基于语音分析的问答方法、装置、设备及存储介质
CN110853649A (zh) 基于智能语音技术的标签提取方法、系统、设备及介质
CN111489765A (zh) 一种基于智能语音技术的话务服务质检方法
CN111739519A (zh) 基于语音识别的对话管理处理方法、装置、设备及介质
CN116665676B (zh) 一种用于智能语音外呼系统的语义识别方法
Kopparapu Non-linguistic analysis of call center conversations
CN111651497A (zh) 用户标签挖掘方法、装置、存储介质及电子设备
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN112364622A (zh) 对话文本分析方法、装置、电子装置及存储介质
CN116166688A (zh) 基于自然语言交互的业务数据检索方法、系统及处理设备
CN109618067A (zh) 外呼对话处理方法和系统
CN114491010A (zh) 信息抽取模型的训练方法及装置
CN115022471B (zh) 一种智能机器人语音交互系统和方法
EP3908941A1 (en) Artificial intelligence system for business processes
CN113990288B (zh) 一种语音客服自动生成部署语音合成模型的方法
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
CN111382230B (zh) 用于法律咨询选项的模糊识别方法
CN113822029A (zh) 客服辅助方法、装置和系统
CN117648408B (zh) 基于大模型的智能问答方法、装置、电子设备及存储介质
CN117411970B (zh) 一种基于声音处理的人机耦合客服控制方法及系统
CN111683174B (zh) 来电处理方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190726