CN109036407A - 基于语音识别技术实现智能机器人应答的系统和方法 - Google Patents

基于语音识别技术实现智能机器人应答的系统和方法 Download PDF

Info

Publication number
CN109036407A
CN109036407A CN201810932116.7A CN201810932116A CN109036407A CN 109036407 A CN109036407 A CN 109036407A CN 201810932116 A CN201810932116 A CN 201810932116A CN 109036407 A CN109036407 A CN 109036407A
Authority
CN
China
Prior art keywords
module
speech recognition
service
voice
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810932116.7A
Other languages
English (en)
Inventor
郑龙飞
左小舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Changyuan Information Technology Co Ltd
Original Assignee
Hunan Changyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Changyuan Information Technology Co Ltd filed Critical Hunan Changyuan Information Technology Co Ltd
Priority to CN201810932116.7A priority Critical patent/CN109036407A/zh
Publication of CN109036407A publication Critical patent/CN109036407A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于语音识别技术实现智能机器人应答的系统及方法,通过客户语音输入信息,语音识别模块接受信息并转化为智能机器人可识别的信号,智能机器人通过webservice或者restful协议与服务系统交互获取服务信息,实现通过语音呼叫完成远程操作,实现从人工呼入到系统自动完成人工指令并获取结果的过程。

Description

基于语音识别技术实现智能机器人应答的系统和方法
技术领域
本发明涉及智能设备技术领域,具体涉及一种基于语音识别技术实现智能机器人应答的系统和方法。
背景技术
在电信领域,语音识别技术也已经应用多年,但一直停留在交互式语音应答(Interactive Voice Response,IVR)上,其特点是以词或者短句为单位进行识别,并且准确率和实时性要求比较高,否则服务质量根本无法保证。而用户对于繁琐的IVR业务办理越来越反感,都希望能够直接由人工服务快速解决问题,但是人工成本高昂,所以如何提升服务效率以及深入挖掘服务的价值,一直以来都是各运营商在研究的问题。
传统交互式语音应答通过直接录语音放给客户听的,但是需要客户进行按键选择。而且交互的形式比较单一,而且并不能达到客户所需要的效果。客户更希望直接由人工来替代。
目前的交互式应答也有采用APP、网站等来实现,但对于一些老年人或一部分习惯用电话语音来实现交互的人群来说,电话交互实现问题的解决是较佳的处理方式。
发明内容:
为解决现有技术的不足,本发明的目的在于提供一种基于语音识别技术实现智能机器人应答的系统和方法,通过语音呼叫、语音识别,实现智能机器人与用户之间的语音交互,还能直接解决客户的需求,实现智能化分析、语音沟通自由、快速反应的目的,方便客户使用,显著缩短客户业务处理的时间。
为实现上述目的,本发明采用的技术方案如下:
一方面,本发明提供一种基于语音识别技术实现智能机器人应答的系统,包括
用户终端,向语音识别模块发送语音数据;以及,接收从语音识别模块发送的语音数据,并进行识别确认;
语音识别模块,接收到用户终端发送的语音数据,对语音数据进行识别,并家识别结果存储在云端服务器;以及对语音识别数据进行整理并转换为用户所能理解的语音数据,
云端服务器,存储语音识别结果并转换为相应的服务数据;以及接收服务数据并转换为语音识别数据;
服务后台模块,接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;以及接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
机器人操作模块,根据服务信号进行服务操作;完成用户终端输入的指令,并将对应的指令处理出对应的结果;以及将服务操作对应的处理结果转换为服务信号;以及接收到经用户确认识别正确的结果后,发送终止服务信号。
进一步地,所述服务操作是指:机器人操作模块与对应的服务平台进行交互获取服务信息,即运行对应的程序软件。
进一步地,所述语音识别模块包括:录音文件采集模块和语音识别网关模块。
另一方面,本发明提供一种基于语音识别技术实现智能机器人应答的方法,所述方法通过上述的系统实现,具体过程如下:
1)用户终端呼叫成功后,进入录音文件采集模块,将客户的语音流进行转码,并将转码的二进制语音流提取给语音识别网关模块;
2)语音识别网关模块接收到用户终端发送的语音数据,通过云端服务器对语音数据进行识别,并转换为文本数据,将文本文件根据语音语义规则进行识别结果并存储在云端服务器;
3)云端服务器将语音识别结果存储并在信息库中找到对应的服务数据;
4)语音识别网关模块接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;
5)机器人操作模块根据接收服务信号进行服务操作,运行对应的软件程序;
6)机器人操作模块,将服务操作对应的处理结果转换为服务信号;
7)服务后台模块,接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
8)文本转语音网关模块,对机器人操作模块产生的业务服务数据进行分析并转换为用户所能理解的语音数据;
9)用户终端,接收从语音识别模块发送的语音数据,并通过语音转文本引擎播放给用户进行语音识别确认;
10)机器人操作模块,接收到经用户确认识别正确的结果后,发送终止服务信号。
进一步地,步骤3)中,所述语音识别结果以文件的方式进行储存,并转换为语音识别网关模块能够接收到额服务数据。
进一步地,步骤5)中,所述运行对应的软件程序是指,机器人操作模块通过webservice或者restful协议与即将操作的运行系统交互获取服务信息。
进一步地,所述服务信息获取过程中,机器人操作模块判断是否获取成功,并将获取的结果返回。
进一步地,若所述结果返回过程中,若返回的结果是成功的,则通过TTS转化成成功的语音放给客户听;若返回的结果是失败的,则返回失败的原因。
有益效果:
本发明提供一种基于语音识别技术实现智能机器人应答的系统和方法,通过语音呼叫、语音识别,实现智能机器人与用户之间的语音交互,还能直接解决客户的需求,实现智能化分析、语音沟通自由、快速反应的目的,方便客户使用,显著缩短客户业务处理的时间。
本发明机器人操作模块通过webservice或者restful协议与即将操作的运行系统交互获取服务信息,通过利用智能化的语音识别能力,直接了解客户的需求,并对客户的需求进行相应,实现智能化分析、处理客户的需求,提高对客户业务处理的时间和效率。
具体实施方式
下面结合具体实施例对本发明做进一步地说明,但实施例并不对本发明作任何形式的限定。
实施例1
本发明提供一种基于语音识别技术实现智能机器人应答的系统,包括
用户终端,向语音识别模块发送语音数据;以及,接收从语音识别模块发送的语音数据,并进行识别确认;
语音识别模块,接收到用户终端发送的语音数据,对语音数据进行识别,并家识别结果存储在云端服务器;以及对语音识别数据进行整理并转换为用户所能理解的语音数据,
云端服务器,存储语音识别结果并转换为相应的服务数据;以及接收服务数据并转换为语音识别数据;
服务后台模块,接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;以及接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
机器人操作模块,根据服务信号进行服务操作;例如,运行对应的程序软件,找到客户需要的信息,并将对应的信息处理出对应的结果;以及将服务操作对应的处理结果转换为服务信号;以及接收到经用户确认识别正确的结果后,发送终止服务信号。
实施例2
运用实施例1所提供的系统,实现一种基于语音识别技术实现智能机器人应答的方法,包括如下步骤:
1)用户终端呼叫成功后,进入录音文件采集模块,将客户的语音流进行转码,并将转码的二进制语音流提取给语音识别网关模块;例如,“在湘雅医院挂号”;
2)语音识别网关模块接收到用户终端发送的语音数据,通过云端服务器对语音数据进行识别,并转换为文本数据,将文本文件根据语音语义规则进行识别结果并存储在云端服务器;例如,语音识别“湘雅”,“挂号”的字段,转换为对应的语义,并将识别结果进行备份存储并传输;
3)云端服务器将语音识别结果存储并在信息库中找到对应的服务数据;例如,将语音以文件的方式进行存储,并转换为语音识别网关模块能够接受的服务数据;
4)语音识别网关模块接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;
5)机器人操作模块根据接收服务信号进行服务操作,运行对应的软件程序;例如,连接湘雅医院的服务后台,运行对应的程序软件,找到客户需要的信息,并将对应的信息处理出对应的结果,即软件自动运行完成对应的“挂号”过程;
6)机器人操作模块,将服务操作对应的处理结果转换为服务信号;例如,将“挂号”所得到信息,挂号科室、挂号号码、挂号时间、挂号医生、挂号对象等处理结果,以服务信号的形式发送出去;通过常用的webservice或者restful协议与医院his系统交互获取服务信息(判断是否处理成功,成功就通过TTS转化成成功的语音放给客户听,失败就播放失败的原因。
7)服务后台模块,接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
8)文本转语音网关模块,对机器人操作模块产生的业务服务数据(文本)进行分析并转换为用户所能理解的语音数据,例如,采用
9)用户终端,接收从语音识别模块发送的语音数据,并通过语音转文本(TTS)引擎播放给用户进行语音识别确认;
10)机器人操作模块,接收到经用户确认识别正确的结果后,发送终止服务信号。
在本实施例的方法过程中,机器人操作模块的智能机器人通过语音回复引导、采集客户输入的信息;比如,身份证号、姓名、年龄、挂哪个科;然后机器人操作模块识别出这些信息后就通过RESTFUL协议送给医院的his系统,his系统将处理结果再返回,实现客户语音挂号,为客户的需求节省时间,提高客户服务的业务效率。机器人操作模块通过脚本配置,在语音数据库中找到对应匹配的数据信号,讲过借助数据库的搜索算法,得到最佳的结果,并将结果传输给待处理的软件程序,完成了客户的挂号流程;脚本配置过程相当于引导客户按步骤输入相应的信息的过程。医院的His系统将机器人操作模块获得的信息输入其对应的软件过程中,完成客户语音属于的需求。
以上所述仅为本发明的优选实施例,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的相关技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,其中所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于语音识别技术实现智能机器人应答的系统,其特征在于,包括
用户终端,向语音识别模块发送语音数据;以及,接收从语音识别模块发送的语音数据,并进行识别确认;
语音识别模块,接收到用户终端发送的语音数据,对语音数据进行识别,并家识别结果存储在云端服务器;以及对语音识别数据进行整理并转换为用户所能理解的语音数据,
云端服务器,存储语音识别结果并转换为相应的服务数据;以及接收服务数据并转换为语音识别数据;
服务后台模块,接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;以及接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
机器人操作模块,根据服务信号进行服务操作;完成用户终端输入的指令,并将对应的指令处理出对应的结果;以及将服务操作对应的处理结果转换为服务信号;以及接收到经用户确认识别正确的结果后,发送终止服务信号。
2.根据权利要求1所述的基于语音识别技术实现智能机器人应答的系统,其特征在于,所述服务操作是指:机器人操作模块与对应的服务平台进行交互获取服务信息,即运行对应的程序软件。
3.根据权利要求1所述的基于语音识别技术实现智能机器人应答的系统,其特征在于,所述语音识别模块包括:录音文件采集模块和语音识别网关模块。
4.基于语音识别技术实现智能机器人应答的方法,其特征在于,所述方法通过权利要求1~3任一所示的系统实现,具体过程如下:
1)用户终端呼叫成功后,进入录音文件采集模块,将客户的语音流进行转码,并将转码的二进制语音流提取给语音识别网关模块;
2)语音识别网关模块接收到用户终端发送的语音数据,通过云端服务器对语音数据进行识别,并转换为文本数据,将文本文件根据语音语义规则进行识别结果并存储在云端服务器;
3)云端服务器将语音识别结果存储并在信息库中找到对应的服务数据;
4)语音识别网关模块接收云端服务器发送的服务数据并将其转换成机器人操作模块能够接收的服务信号;
5)机器人操作模块根据接收服务信号进行服务操作,运行对应的软件程序;
6)机器人操作模块,将服务操作对应的处理结果转换为服务信号;
7)服务后台模块,接收机器人操作模块返回的服务信号,并将其转换成服务数据发出;
8)文本转语音网关模块,对机器人操作模块产生的业务服务数据进行分析并转换为用户所能理解的语音数据;
9)用户终端,接收从语音识别模块发送的语音数据,并通过语音转文本引擎播放给用户进行语音识别确认;
10)机器人操作模块,接收到经用户确认识别正确的结果后,发送终止服务信号。
5.根据权利要求4所述的基于语音识别技术实现智能机器人应答的方法,其特征在于,步骤3)中,所述语音识别结果以文件的方式进行储存,并转换为语音识别网关模块能够接收到额服务数据。
6.根据权利要求4所述的基于语音识别技术实现智能机器人应答的方法,其特征在于,步骤5)中,所述运行对应的软件程序是指,机器人操作模块通过webservice或者restful协议与即将操作的运行系统交互获取服务信息。
7.根据权利要求6所述的基于语音识别技术实现智能机器人应答的方法,其特征在于,所述服务信息获取过程中,机器人操作模块判断是否获取成功,并将获取的结果返回。
8.根据权利要求7所述的基于语音识别技术实现智能机器人应答的方法,其特征在于,若所述结果返回过程中,若返回的结果是成功的,则通过TTS转化成成功的语音放给客户听;若返回的结果是失败的,则返回失败的原因。
CN201810932116.7A 2018-08-16 2018-08-16 基于语音识别技术实现智能机器人应答的系统和方法 Pending CN109036407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810932116.7A CN109036407A (zh) 2018-08-16 2018-08-16 基于语音识别技术实现智能机器人应答的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810932116.7A CN109036407A (zh) 2018-08-16 2018-08-16 基于语音识别技术实现智能机器人应答的系统和方法

Publications (1)

Publication Number Publication Date
CN109036407A true CN109036407A (zh) 2018-12-18

Family

ID=64630587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810932116.7A Pending CN109036407A (zh) 2018-08-16 2018-08-16 基于语音识别技术实现智能机器人应答的系统和方法

Country Status (1)

Country Link
CN (1) CN109036407A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048084A (zh) * 2019-12-18 2020-04-21 上海智勘科技有限公司 在智能语音交互过程中推送信息的方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319759A1 (en) * 2007-06-20 2008-12-25 International Business Machines Corporation Integrating a voice browser into a web 2.0 environment
CN201504266U (zh) * 2009-07-16 2010-06-09 交通银行股份有限公司 一种基于电话银行的用户语音处理系统
CN105072297A (zh) * 2015-08-27 2015-11-18 携程计算机技术(上海)有限公司 呼叫中心的语音智能转接系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319759A1 (en) * 2007-06-20 2008-12-25 International Business Machines Corporation Integrating a voice browser into a web 2.0 environment
CN201504266U (zh) * 2009-07-16 2010-06-09 交通银行股份有限公司 一种基于电话银行的用户语音处理系统
CN105072297A (zh) * 2015-08-27 2015-11-18 携程计算机技术(上海)有限公司 呼叫中心的语音智能转接系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048084A (zh) * 2019-12-18 2020-04-21 上海智勘科技有限公司 在智能语音交互过程中推送信息的方法及系统

Similar Documents

Publication Publication Date Title
CN110266899B (zh) 客户意图的识别方法和客服系统
CN110263144A (zh) 一种答案获取方法及装置
CN111192060B (zh) 一种基于电力it服务全渠道自助应答实现方法
CN109413286A (zh) 一种智能客服语音应答系统及方法
CN107623614A (zh) 用于推送信息的方法和装置
US10382624B2 (en) Bridge for non-voice communications user interface to voice-enabled interactive voice response system
WO2015062284A1 (zh) 自然表达处理方法、处理及回应方法、设备及系统
CN105075230B (zh) 交互式语音应答会话的声纹标注
CN108777751A (zh) 一种呼叫中心系统及其语音交互方法、装置和设备
CN104064062A (zh) 一种基于声纹和语音识别的在线听力学习方法及系统
CN110266900B (zh) 客户意图的识别方法、装置及客服系统
CN109065052A (zh) 一种语音机器人
CN109697243A (zh) 回铃音聚类分析方法、装置、介质和计算设备
CN109922213A (zh) 语音咨询时的数据处理方法、装置、存储介质及终端设备
CN110287299A (zh) 一种通话中多话术语句智能切换方法
CN109345072A (zh) 用于配网分支线调度场景的调度方法
CN112885348A (zh) 结合ai智能语音电销方法
CN109417583A (zh) 一种将音频信号实时转录为文本的系统和方法
CN111128241A (zh) 语音通话的智能质检方法及系统
CN109885666A (zh) 一种基于html5的智能语音客服机器人的方法及系统
CN110704618A (zh) 确定对话数据对应的标准问题的方法及装置
CN105206273B (zh) 语音传输控制方法及系统
CN107566168A (zh) 远程配置方法、设备配置方法及远程配置设备方法
KR20200092166A (ko) 감정을 인식하는 서버, 방법 및 컴퓨터 프로그램
CN109325771A (zh) 身份验证方法、装置、计算机程序、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication