CN108364652A - 一种用于人工智能电话的智能语音对答交互控制系统 - Google Patents

一种用于人工智能电话的智能语音对答交互控制系统 Download PDF

Info

Publication number
CN108364652A
CN108364652A CN201810042087.7A CN201810042087A CN108364652A CN 108364652 A CN108364652 A CN 108364652A CN 201810042087 A CN201810042087 A CN 201810042087A CN 108364652 A CN108364652 A CN 108364652A
Authority
CN
China
Prior art keywords
voice
control terminal
sound
interactive voice
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810042087.7A
Other languages
English (en)
Inventor
杨大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Ehoo Call Technology Co Ltd
Original Assignee
Chengdu Ehoo Call Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Ehoo Call Technology Co Ltd filed Critical Chengdu Ehoo Call Technology Co Ltd
Priority to CN201810042087.7A priority Critical patent/CN108364652A/zh
Publication of CN108364652A publication Critical patent/CN108364652A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种用于人工智能电话的智能语音对答交互控制系统,包括普通电话线,所述普通电话线连接语音网关,还包括语音交互控制端,用于接收所述语音网关接入的语音数据;语音识别模块,用于利用所述语音交互控制端分配的语音数据进行语音识别产生分析文本,并将分析文本返回至语音交互控制端;语音库,用于语音交互控制端根据所述分析文本调取语音库数据并推送至来电端;本发明大大提高了工作效率,每天可处理至少3000个电话;减少坐席人员重复工作的劳动次数,利用该系统去完成重复的语音播报工作。

Description

一种用于人工智能电话的智能语音对答交互控制系统
技术领域
本发明涉及通讯领域,具体涉及一种用于人工智能电话的智能语音对答交互控制系统。
背景技术
传统的电话语音系统通过语音按键进行交互,传统的语音电话实现方式如下,将普通电话线(PSTN)接入到语音网关,语音网关对接语音服务器(CTI/CRM服务器),语音服务器控制电话的进出,包括语音导航、挂机、转接、接听、三方通话、录音等功能。语音服务器将电话的数据实时存入数据库服务器,主要存储通话时间、录音文件信息、来电客户信息等。路由器连接局域网或广域网实现路由中转,电话坐席人员可以实时与进线电话进行通话沟通,采用人工坐席进行交互,打电话的速度很慢,一天最多300个电话,效率低,坐席人员的劳动强度大。通过语音按键进行交互,对于老年人或者不熟悉电话的人群来说,操作困难;在需要查询一些问题或资料时,难以实现目的。
发明内容
本发明的目的在于:提供一种用于人工智能电话的智能语音对答交互控制系统,解决了目前采用人工坐席进行交互效率低下的技术问题。
本发明采用的技术方案如下:
一种用于人工智能电话的智能语音对答交互控制系统,包括普通电话线,所述普通电话线连接语音网关,还包括语音交互控制端,用于接收所述语音网关接入的语音数据;语音识别模块,用于利用所述语音交互控制端分配的语音数据进行语音识别产生分析文本,并将分析文本返回至语音交互控制端;语音库,用于语音交互控制端根据所述分析文本调取语音库数据并推送至来电端。
进一步的,所述语音交互控制端设置有语音缓冲池,所述语音网关接入的语音数据传输至语音缓冲池,当语音缓冲池装满后,将数据打包压缩并实时发送至所述语音识别模块进行识别。
进一步的,所述语音交互控制端内设置有内存空间,所述分析文本储存至所述内存空间中,当电话线路断开时,所述语音交互控制端释放所述内存空间。
进一步的,所述语音交互控制端采用NLP算法进行语音训练并输出分析文本对应的结果。
进一步的,所述NLP算法进行语音训练产生的语音特征储存至所述语音库。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明大大提高了工作效率,每天可处理至少3000个电话。
2.减少坐席人员重复工作的劳动次数,利用该系统去完成重复的语音播报工作。
3.颠覆传统外呼只能播放语音的问题,系统支持模拟行业专家与目标客户进行通话,让其拥有复制精英销售的能力。
4.不同行业的语音交互逻辑思维不同,个性化更强。
5.采用数据缓冲池结构,实现了语音数据的快速传入。
6.语音交互控制端中设置内存空间,并在电话线路断开时,自动释放内存空间,大大方便文字内容的分析与参数快速的传递作用。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的整体架构。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合图1对本发明作详细说明。
一种用于人工智能电话的智能语音对答交互控制系统,包括普通电话线,所述普通电话线连接语音网关,还包括语音交互控制端,用于接收所述语音网关接入的语音数据;语音识别模块,用于利用所述语音交互控制端分配的语音数据进行语音识别产生分析文本,并将分析文本返回至语音交互控制端;语音库,用于语音交互控制端根据所述分析文本调取语音库数据并推送至来电端。
所述语音交互控制端设置有语音缓冲池,所述语音网关接入的语音数据传输至语音缓冲池,当语音缓冲池装满后,将数据打包压缩并实时发送至所述语音识别模块进行识别。
所述语音交互控制端内设置有内存空间,所述分析文本储存至所述内存空间中,当电话线路断开时,所述语音交互控制端释放所述内存空间。
所述语音交互控制端采用NLP算法进行语音训练并输出分析文本对应的结果。
所述NLP算法进行语音训练产生的语音特征储存至所述语音库。
具体实施方式1
普通电话线(PSTN)连接语音网关,语音网关将接入的语音数据传入所述语音交互控制端,语音交互控制端设置有语音缓冲池,所述语音网关接入的语音数据传输至语音缓冲池,当语音缓冲池装满后,将数据打包压缩并实时发送至所述语音识别模块进行识别,生成分析文本,语音识别模块采用科大讯飞的语音识别技术,语音识别模块中包括语音模型数据、声学模型数据和发音模型数据,语音识别模块将分析文本返回至语音交互控制端,语音交互控制端从语音库中调取语音库数据并推送至来电端;语音识别模块中还加入四川话识别模块,用户利用四川话进行交互时,系统能够自动识别语音数据内容,将语音数据翻译成文字内容形成分析文本,返回至语音交互控制端。
所述语音交互控制端内设置有内存空间,所述分析文本储存至所述内存空间中,当电话线路断开时,所述语音交互控制端释放所述内存空间;当需要多路数据进行交互时,开辟多个内存空间即可。
具体实施方式2
所述语音交互控制端采用NLP算法进行语音训练并输出分析文本对应的结果;利用NLP算法进行语音控制训练时采用Topic Model,无论维度是多少的数据集,关键特征很少,因此关键特征之间刻画了除噪声外的全部关键信息,且特征之间没有太多的相关性。例如一个含有K个主题的文本,将文本压缩成K维向量,每个维度中的数据代表该文本该主题的概率,将文本压缩为K维向量后使用任何类型的分类器,即能得到效果很好的分类结果。

Claims (5)

1.一种用于人工智能电话的智能语音对答交互控制系统,包括普通电话线,所述普通电话线连接语音网关,其特征在于:还包括语音交互控制端,用于接收所述语音网关接入的语音数据;语音识别模块,用于利用所述语音交互控制端分配的语音数据进行语音识别产生分析文本,并将分析文本返回至语音交互控制端;语音库,用于语音交互控制端根据所述分析文本调取语音库数据并推送至来电端。
2.根据权利要求1所述的一种用于人工智能电话的智能语音对答交互控制系统,其特征在于:所述语音交互控制端设置有语音缓冲池,所述语音网关接入的语音数据传输至语音缓冲池,当语音缓冲池装满后,将数据打包压缩并实时发送至所述语音识别模块进行识别。
3.根据权利要求1所述的一种用于人工智能电话的智能语音对答交互控制系统,其特征在于:所述语音交互控制端内设置有内存空间,所述分析文本储存至所述内存空间中,当电话线路断开时,所述语音交互控制端释放所述内存空间。
4.根据权利要求1所述的一种用于人工智能电话的智能语音对答交互控制系统,其特征在于:所述语音交互控制端采用NLP算法进行语音训练并输出分析文本对应的结果。
5.根据权利要求4所述的一种用于人工智能电话的智能语音对答交互控制系统,其特征在于:所述NLP算法进行语音训练产生的语音特征储存至所述语音库。
CN201810042087.7A 2018-01-16 2018-01-16 一种用于人工智能电话的智能语音对答交互控制系统 Withdrawn CN108364652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810042087.7A CN108364652A (zh) 2018-01-16 2018-01-16 一种用于人工智能电话的智能语音对答交互控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810042087.7A CN108364652A (zh) 2018-01-16 2018-01-16 一种用于人工智能电话的智能语音对答交互控制系统

Publications (1)

Publication Number Publication Date
CN108364652A true CN108364652A (zh) 2018-08-03

Family

ID=63006556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810042087.7A Withdrawn CN108364652A (zh) 2018-01-16 2018-01-16 一种用于人工智能电话的智能语音对答交互控制系统

Country Status (1)

Country Link
CN (1) CN108364652A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109451186A (zh) * 2018-11-06 2019-03-08 中国联合网络通信集团有限公司 一种语音拦截方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297179A (ja) * 2001-03-29 2002-10-11 Fujitsu Ltd 自動応答対話システム
CN101377726A (zh) * 2007-08-31 2009-03-04 西门子(中国)有限公司 语音识别和笔划识别相结合的输入方法及其终端
CN102868836A (zh) * 2012-09-17 2013-01-09 北京讯鸟软件有限公司 用于呼叫中心的真人话术系统及其实现方法
CN106710585A (zh) * 2016-12-22 2017-05-24 上海语知义信息技术有限公司 语音交互过程中的多音字播报方法及系统
CN106792048A (zh) * 2016-12-20 2017-05-31 Tcl集团股份有限公司 一种识别智能电视用户语音命令的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297179A (ja) * 2001-03-29 2002-10-11 Fujitsu Ltd 自動応答対話システム
CN101377726A (zh) * 2007-08-31 2009-03-04 西门子(中国)有限公司 语音识别和笔划识别相结合的输入方法及其终端
CN102868836A (zh) * 2012-09-17 2013-01-09 北京讯鸟软件有限公司 用于呼叫中心的真人话术系统及其实现方法
CN106792048A (zh) * 2016-12-20 2017-05-31 Tcl集团股份有限公司 一种识别智能电视用户语音命令的方法和装置
CN106710585A (zh) * 2016-12-22 2017-05-24 上海语知义信息技术有限公司 语音交互过程中的多音字播报方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109451186A (zh) * 2018-11-06 2019-03-08 中国联合网络通信集团有限公司 一种语音拦截方法及系统
CN109451186B (zh) * 2018-11-06 2021-10-01 中国联合网络通信集团有限公司 一种语音拦截方法及系统

Similar Documents

Publication Publication Date Title
WO2021051506A1 (zh) 语音交互方法、装置、计算机设备及存储介质
CN111048064B (zh) 基于单说话人语音合成数据集的声音克隆方法及装置
CN1200548C (zh) 用于路由选择的带内信令
CN111294463B (zh) 一种智能应答方法及系统
CN1327406C (zh) 开放式词汇表语音识别的方法
CN113239147B (zh) 基于图神经网络的智能会话方法、系统及介质
CN108847249A (zh) 声音转换优化方法和系统
CN108777751A (zh) 一种呼叫中心系统及其语音交互方法、装置和设备
CN109587358A (zh) 人工智能客服转人工客服呼叫方法
CN109361823A (zh) 一种语音与文本相互转化的智能交互方式
CN103685783B (zh) 信息处理系统和存储介质
CN103327198B (zh) 验证电话呼入中心的呼叫者的系统和方法
CN111445903B (zh) 企业名称识别方法及装置
CN105895082A (zh) 声学模型训练方法、语音识别方法及装置
CN113823273B (zh) 音频信号处理方法、装置、电子设备及存储介质
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
CN116631412A (zh) 一种通过声纹匹配判断语音机器人的方法
CN111696576A (zh) 一种智能语音机器人话术测试系统
CN112150694A (zh) 一种智能语音电费催缴系统及方法
CN108364652A (zh) 一种用于人工智能电话的智能语音对答交互控制系统
CN101098366A (zh) 以网络电话进行在线互动学习的系统及方法
US20090103711A1 (en) Methods and systems for determining inappropriate threats during a telephonic communication between a customer and a contact center
US6501751B1 (en) Voice communication with simulated speech data
CN111858884A (zh) 一种机器人学习真人深度对话内容的方法与系统
CN111353258A (zh) 基于编码解码神经网络的回声抑制方法及音频装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180803

WW01 Invention patent application withdrawn after publication