CN112259090A - 基于语音交互的业务办理方法、装置和电子设备 - Google Patents

基于语音交互的业务办理方法、装置和电子设备 Download PDF

Info

Publication number
CN112259090A
CN112259090A CN202010948343.6A CN202010948343A CN112259090A CN 112259090 A CN112259090 A CN 112259090A CN 202010948343 A CN202010948343 A CN 202010948343A CN 112259090 A CN112259090 A CN 112259090A
Authority
CN
China
Prior art keywords
voice
voice interaction
service
query result
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010948343.6A
Other languages
English (en)
Inventor
杨松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010948343.6A priority Critical patent/CN112259090A/zh
Publication of CN112259090A publication Critical patent/CN112259090A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了基于语音交互的业务办理方法、装置和电子设备,涉及语音交互、业务办理技术领域。具体实现方案为:接收智能语音交互设备发送的用户的第一语音信号;对所述第一语音信号进行语音识别,得到语言文本;对所述语言文本进行语义解析,得到语义文本;根据所述语义文本获取对应的业务查询结果;以及将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。本申请的业务办理方法,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。

Description

基于语音交互的业务办理方法、装置和电子设备
技术领域
本申请涉及计算机技术领域中的语音交互、业务办理技术领域,尤其涉及一种基于语音交互的业务办理方法、装置、服务器、智能语音交互设备、电子设备和存储介质。
背景技术
目前,一些业务仍需人们到特定的业务网点进行办理,例如,银行业务、保险业务、纳税业务等,办理方式主要包括人工窗口方式和自助机方式,由于人工窗口数量有限,人流量较大时往往需要人们等待较长时间,另外,由于业务的专业性较强,人们往往对待办理的业务了解度较低,操作自助机时大多需要工作人员协助,这两种方式均耗费了较大的人工成本。
发明内容
提供了一种基于语音交互的业务办理方法、装置、服务器、智能语音交互设备、电子设备和存储介质。
根据第一方面,提供了一种基于语音交互的业务办理方法,包括:接收智能语音交互设备发送的用户的第一语音信号;对所述第一语音信号进行语音识别,得到语言文本;对所述语言文本进行语义解析,得到语义文本;根据所述语义文本获取对应的业务查询结果;以及将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。
根据第二方面,提供了另一种基于语音交互的业务办理方法,包括:获取用户的第一语音信号;将所述第一语音信号发送至服务器;接收所述服务器发送的业务查询结果,所述业务查询结果为所述服务器根据所述第一语音信号获取到的;以及显示所述业务查询结果。
根据第三方面,提供了一种基于语音交互的业务办理装置,包括:接收模块,用于接收智能语音交互设备发送的用户的第一语音信号;识别模块,用于对所述第一语音信号进行语音识别,得到语言文本;解析模块,用于对所述语言文本进行语义解析,得到语义文本;获取模块,用于根据所述语义文本获取对应的业务查询结果;以及发送模块,用于将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。
根据第四方面,提供了另一种基于语音交互的业务办理装置,包括:第一获取模块,用于获取用户的第一语音信号;发送模块,用于将所述第一语音信号发送至服务器;接收模块,用于接收所述服务器发送的业务查询结果,所述业务查询结果为所述服务器根据所述第一语音信号获取到的;以及显示模块,用于显示所述业务查询结果。
根据第五方面,提供了一种服务器,包括本申请第三方面所述的基于语音交互的业务办理装置。
据第六方面,提供了一种智能语音交互设备,包括本申请第四方面所述的基于语音交互的业务办理装置。
根据第七方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面所述的基于语音交互的业务办理方法,或者能够执行本申请第二方面所述的基于语音交互的业务办理方法。
根据第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面所述的基于语音交互的业务办理方法,或者执行本申请第二方面所述的基于语音交互的业务办理方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的基于语音交互的业务办理方法的流程示意图;
图2是根据本申请第二实施例的基于语音交互的业务办理方法中获取对应的业务查询结果之后的流程示意图;
图3是根据本申请第三实施例的基于语音交互的业务办理方法的流程示意图;
图4是根据本申请第四实施例的基于语音交互的业务办理方法中获取用户的第一语音信号之前的流程示意图;
图5是根据本申请第五实施例的基于语音交互的业务办理方法的流程示意图;
图6是根据本申请第六实施例的基于语音交互的业务办理方法的场景示意图;
图7是根据本申请第七实施例的基于语音交互的业务办理方法的场景示意图;
图8是根据本申请第一实施例的基于语音交互的业务办理装置的框图;
图9是根据本申请第二实施例的基于语音交互的业务办理装置的框图;
图10是根据本申请第三实施例的基于语音交互的业务办理装置的框图;
图11是根据本申请第四实施例的基于语音交互的业务办理装置的框图;
图12是用来实现本申请实施例的基于语音交互的业务办理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的基于语音交互的业务办理方法的流程示意图。
如图1所示,本申请第一实施例的基于语音交互的业务办理方法包括:
S101,接收智能语音交互设备发送的用户的第一语音信号。
需要说明的是,本申请实施例的基于语音交互的业务办理方法的执行主体可为服务器。
本公开的实施例中,用户可和智能语音交互设备进行语音交互,服务器和智能语音交互设备之间建立有网络连接,以和智能语音交互设备进行数据传输。可选的,网络连接可为移动网络,例如3G、4G、5G等。
本公开的实施例中,服务器可接收智能语音交互设备发送的用户的第一语音信号。
S102,对第一语音信号进行语音识别,得到语言文本。
本公开的实施例中,服务器可对第一语音信号进行语音识别,得到语言文本。
在具体实施中,服务器可采用语音识别算法对第一语音信号进行语音识别,得到语言文本。其中,语音识别算法可根据实际情况进行标定,例如可为深度学习算法,并预先设置在服务器的存储空间中。
在具体实施中,对第一语音信号进行语音识别之前,还可对第一语音信号进行语音增强,以去除第一语音信号中的噪声干扰,进而有利于增强语音识别效果。
其中,对第一语音信号进行语音增强,包括但不限于声源定位(Sound Location)、波束成形(Beam Forming)、回声消除(Echo Cancellation)、噪声抑制(Noise Control)、去混响(Dereverberation)、非线性处理等,这里不做过多限定。
S103,对语言文本进行语义解析,得到语义文本。
可以理解的是,语言文本仅是用户的第一语音信号的文本信息,为了获取用户的第一语音信号的语义,服务器还需对语言文本进行语义解析,得到语义文本。
在具体实施中,服务器可采用深度学习算法对语言文本进行语义解析,得到语义文本。
在具体实施中,语言文本中可能存在其他人的语音干扰、和业务内容无关的对话、重复性的对话等,则服务器在对语言文本进行语义解析时,可从语言文本中提取用户本人发出的、与业务内容有关的不重复的关键词,并根据上述关键词得到语义文本。
S104,根据语义文本获取对应的业务查询结果。
本公开的实施例中,服务器中预先设置了语义文本对应的业务,则在获取语义文本之后,可根据语义文本在服务器的存储空间中查询其对应的业务,将查询到的业务作为业务查询结果。
在具体实施中,应用场景为银行业务时,若用户的第一语音信号对应的语言文本为“我要办理理财产品”,则语义文本可为“理财产品”,可根据语义文本“理财产品”获取某个银行的理财产品列表,并将某个银行的理财产品列表作为业务查询结果。
或者,应用场景为银行业务时,若用户的第一语音信号对应的语言文本为“我要办理定期存款”,则语义文本可为“定期”,可根据语义文本“定期”获取某个银行的存期为六个月、一年、二年、三年等的年利率,并将上述某个银行的存期为六个月、一年、二年、三年等的年利率作为业务查询结果。
在具体实施中,应用场景为保险业务时,若用户的第一语音信号对应的语言文本为“我要办理车险”,则语义文本可为“车险”,可根据语义文本“车险”获取某个保险公司的车险产品列表,并将某个保险公司的车险产品列表作为业务查询结果。
S105,将业务查询结果发送至智能语音交互设备,以供智能语音交互设备显示业务查询结果。
本公开的实施例中,服务器在获取到业务查询结果之后,可将业务查询结果发送至智能语音交互设备,以供智能语音交互设备显示业务查询结果。
综上,根据本申请实施例的基于语音交互的业务办理方法,服务器能够根据智能语音交互设备发送的用户的第一语音信号,进行语音识别和语义解析,以得到用户的语义文本,并可根据语义文本获取业务查询结果并反馈给智能语音交互设备,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。
在上述任一实施例的基础上,如图2所示,步骤S104获取对应的业务查询结果之后,可包括:
S201,根据业务查询结果生成对话文本。
本公开的实施例中,服务器在获取到业务查询结果之后,还可根据业务查询结果生成对话文本。
在具体实施中,若业务查询结果为某个银行的理财产品列表,该理财产品列表包括N个理财产品的序号、名称、年利率等,则对应的对话文本可为“为您查询到N款理财产品,第一个理财产品的名称为A,年利率为a;第二个理财产品的名称为B,年利率为b”,之后的对话文本为类似形式,这里不再赘述。其中,N为正整数。
S202,根据对话文本合成对话语音。
本公开的实施例中,服务器可根据对话文本合成对话语音。
在具体实施中,服务器可采用线性预测编码(Linear Predictive Coding,LPC)算法、基音同步叠加(Pitch Synchronous Overlap Add,PSOLA)算法、LMA(Log MagnitudeApproximate)声道模型等技术合成对话语音。
S203,将对话语音发送至智能语音交互设备,以供智能语音交互设备播放对话语音。
由此,服务器能够根据业务查询结果生成对话文本,并可根据对话文本合成对话语音并反馈给智能语音交互设备,可利用语音处理技术实现业务办理的自动化。
图3是根据本申请第三实施例的基于语音交互的业务办理方法的流程示意图。
如图3所示,本申请第三实施例的基于语音交互的业务办理方法包括:
S301,获取用户的第一语音信号。
需要说明的是,本申请实施例的基于语音交互的业务办理方法的执行主体可为智能语音交互设备。其中,智能语音交互设备包括但不限于手机、电脑、智能家电、车载终端等。
本公开的实施例中,用户可和智能语音交互设备进行语音交互,智能语音交互设备能够获取用户的第一语音信号。
在具体实施中,智能语音交互设备上具有语音采集装置,用于获取用户的语音信号。其中,语音采集装置可为麦克风(Microphone)、麦克风阵列(Microphone Array)等装置。
S302,将第一语音信号发送至服务器。
本公开的实施例中,智能语音交互设备在获取到第一语音信号之后,能够将第一语音信号发送至服务器,以供服务器根据第一语音信号进行语音识别、语义解析和业务查询,以获取对应的业务查询结果。
本公开的实施例中,智能语音交互设备和服务器之间建立有网络连接,以和服务器进行数据传输。可选的,智能语音交互设备上具有联网模块,智能语音交互设备可通过联网模块与服务器进行数据传输。例如,联网模块可为无线通信模块。
S303,接收服务器发送的业务查询结果,业务查询结果为服务器根据第一语音信号获取到的。
关于步骤S303的具体实现过程及原理,请参照上述实施例中的相关内容,这里不再赘述。
S304,显示业务查询结果。
本公开的实施例中,智能语音交互设备能够显示业务查询结果,以供用户查看。
在具体实施中,智能语音交互设备上具有显示屏,可在显示屏上显示业务查询结果。
综上,根据本申请实施例的基于语音交互的业务办理方法,智能语音交互设备能够获取用户的第一语音信号并发送给服务器,以获取业务查询结果,之后可显示业务查询结果,以供用户查看,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。
在上述任一实施例的基础上,步骤S302中将第一语音信号发送至服务器之后,可包括接收服务器发送的对话语音,对话语音为服务器根据业务查询结果生成的,之后播放对话语音。
在具体实施中,智能语音交互设备上具有扬声器等功放模块,以播放对话语音。
由此,智能语音交互设备能够播放对话语音,以向用户介绍业务查询结果,方便了用户获取业务查询结果,也增强了业务办理的交互度。
在上述任一实施例的基础上,如图4所示,步骤S301中获取用户的第一语音信号之前,可包括:
S401,获取用户的第二语音信号。
关于步骤S401的具体实现过程及原理,请参照上述实施例中的相关内容,这里不再赘述。
S402,对第二语音信号进行唤醒词检测。
需要说明的是,智能语音交互设备具有唤醒功能,唤醒智能语音交互设备之前,智能语音交互设备上的大部分功能均无法实现,包括获取用户的第一语音信号、将用户的第一语音信号发送至服务器、显示业务查询结果、播放对话语音等功能,功耗较低;唤醒智能语音交互设备之后,智能语音交互设备上的功能均可实现。
可以理解的是,可预先为智能语音交互设备设置唤醒词,并对获取的第二语音信号进行唤醒词检测,以判断当前是否需要唤醒智能语音交互设备。
在具体实施中,唤醒词检测可包括语音识别,以得到第二语音信号的语言文本,并识别第二语音信号的语言文本中是否包括唤醒词,若上述语言文本中包括唤醒词,则可确定第二语音信号中包括预设的唤醒词;反之,若上述语言文本中不包括唤醒词,则可确定第二语音信号不包括预设的唤醒词。
S403,若第二语音信号中包括预设的唤醒词,则唤醒智能语音交互设备,并输出唤醒成功提示信息。
可以理解的是,当获取的第二语音信号中包括预设的唤醒词时,表明用户有唤醒智能语音交互设备的意愿,则可唤醒智能语音交互设备,并输出唤醒成功提示信息,以告知用户设备已唤醒成功。
作为另一种可能的实施方式,当第二语音信号中不包括预设的唤醒词时,表明用户没有唤醒智能语音交互设备的意愿,则可输出唤醒失败提示信息,以告知用户唤醒失败。
在具体实施中,唤醒成功提示信息、唤醒失败提示信息均可为文本或者音频形式,均可在显示屏上显示对应的文本,或者播放对应的音频,来告知用户唤醒成功或者失败。
由此,该方法可对第二语音信号进行唤醒词检测,若第二语音信号中包括唤醒词,则唤醒智能语音交互设备,可有效降低智能语音交互设备的工作负荷,有利于节约能耗。
在上述任一实施例的基础上,除了唤醒词方式以唤醒智能语音交互设备,还可在智能语音交互设备上设置一个按钮,用于触发唤醒功能。步骤S301中获取用户的第一语音信号之前,可检测该按钮是否被按下,当检测到该按钮被按下时,可唤醒智能语音交互设备,并输出唤醒成功提示信息;反之,若未检测到该按钮被按下,则不需要唤醒智能语音交互设备。
为使本领域技术人员更清楚地了解本申请,图5为根据本申请第五实施例的基于语音交互的业务办理方法的流程示意图。如图5所示,该业务办理方法可包括以下步骤:
S501,智能语音交互设备获取用户的第二语音信号。
S502,智能语音交互设备对第二语音信号进行唤醒词检测,若第二语音信号中包括预设的唤醒词,唤醒智能语音交互设备,并输出唤醒成功提示信息。
S503,智能语音交互设备获取用户的第一语音信号。
S504,智能语音交互设备向服务器发送第一语音信号。
S505,服务器对第一语音信号进行语音识别,得到语言文本。
S506,服务器对语言文本进行语义解析,得到语义文本。
S507,服务器根据语义文本获取对应的业务查询结果。
S508,服务器向智能语音交互设备发送业务查询结果。
S509,智能语音交互设备显示业务查询结果。
关于步骤S501-S509的具体实现过程及原理,请参照上述实施例中的相关内容,这里不再赘述。
在具体实施中,如图6所示,智能语音交互设备和服务器可通过软件开发工具包(Software Development Kit,SDK)进行数据传输。智能语音交互设备可将用户的第一语音信号发送至SDK,SDK可将第一语音信号发送至服务器,服务器可对第一语音信号进行语音识别、语义解析和业务查询,以获取对应的业务查询结果,还可根据业务查询结果得到对话语音,并可将得到的业务查询结果、对话语音发送至SDK,SDK可将业务查询结果、对话语音发送至智能语音交互设备,以供智能语音交互设备显示业务查询结果,或者播放对话语音。
在具体实施中,如图7所示,服务器可由识别子服务器、合成子服务器、业务子服务器组成,识别子服务器用于对第一语音信号进行语音识别,得到语义文本并发送至业务子服务器,业务子服务器用于根据语义文本获取对应的业务查询结果,还可将业务查询结果反馈给识别子服务器,识别子服务器可根据业务查询结果生成对话文本,并将对话文本发送至合成子服务器,合成子服务器可根据对话文本合成对话语音。
图8是根据本申请第一实施例的基于语音交互的业务办理装置的框图。
如图8所示,本申请实施例的基于语音交互的业务办理装置600,包括:接收模块601、识别模块602、解析模块603、获取模块604、发送模块605。
接收模块601,用于接收智能语音交互设备发送的用户的第一语音信号;
识别模块602,用于对所述第一语音信号进行语音识别,得到语言文本;
解析模块603,用于对所述语言文本进行语义解析,得到语义文本;
获取模块604,用于根据所述语义文本获取对应的业务查询结果;
发送模块605,用于将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。
在本申请的一个实施例中,如图9所示,所述基于语音交互的业务办理装置600,还包括:生成模块606,用于根据所述业务查询结果生成对话文本;合成模块607,用于根据所述对话文本合成对话语音;以及所述发送模块605,还用于将所述对话语音发送至所述智能语音交互设备,以供所述智能语音交互设备播放所述对话语音。
根据本申请实施例的基于语音交互的业务办理装置,能够根据智能语音交互设备发送的用户的第一语音信号,进行语音识别和语义解析,以得到用户的语义文本,并可根据语义文本获取业务查询结果并反馈给智能语音交互设备,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。
图10是根据本申请第三实施例的基于语音交互的业务办理装置的框图。
如图10所示,本申请实施例的基于语音交互的业务办理装置700,包括:第一获取模块701、发送模块702、接收模块703、显示模块704。
第一获取模块701,用于获取用户的第一语音信号;
发送模块702,用于将所述第一语音信号发送至服务器;
接收模块703,用于接收所述服务器发送的业务查询结果,所述业务查询结果为所述服务器根据所述第一语音信号获取到的;以及
显示模块704,用于显示所述业务查询结果。
在本申请的一个实施例中,所述接收模块703,还用于:接收所述服务器发送的对话语音,所述对话语音为所述服务器根据所述业务查询结果生成的;如图11所示,所述基于语音交互的业务办理装置700,还包括:播放模块705,所述播放模块705,用于:播放所述对话语音。
在本申请的一个实施例中,如图11所示,所述基于语音交互的业务办理装置700,还包括:第二获取模块706,用于所述获取用户的第一语音信号之前,获取所述用户的第二语音信号;检测模块707,用于对所述第二语音信号进行唤醒词检测;唤醒模块708,用于若所述第二语音信号中包括预设的唤醒词,则唤醒智能语音交互设备,并输出唤醒成功提示信息。
在本申请的一个实施例中,所述唤醒模块708,还用于:若所述第二语音信号中不包括所述预设的唤醒词,则输出唤醒失败提示信息。
根据本申请实施例的基于语音交互的业务办理装置,能够获取用户的第一语音信号并发送给服务器,以获取业务查询结果,之后可显示业务查询结果,以供用户查看,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。
根据本申请的实施例,本申请还提供了一种服务器,包括上述基于语音交互的业务办理装置600。
根据本申请的实施例,本申请还提供了一种智能语音交互设备,包括上述基于语音交互的业务办理装置700。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图12所示,是根据本申请实施例的基于语音交互的业务办理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,智能语音交互设备、个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图12所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器801可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的基于语音交互的业务办理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的基于语音交互的业务办理方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的基于语音交互的业务办理方法对应的程序指令/模块(例如,附图8所示的接收模块601、识别模块602、解析模块603、获取模块604、发送模块605)。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的基于语音交互的业务办理方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于语音交互的业务办理方法的电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至基于语音交互的业务办理方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
基于语音交互的业务办理方法的电子设备还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图12中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与基于语音交互的业务办理方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。
根据本申请实施例的技术方案,服务器能够根据智能语音交互设备发送的用户的第一语音信号,进行语音识别和语义解析,以得到用户的语义文本,并可根据语义文本获取业务查询结果并反馈给智能语音交互设备,该方法可利用语音处理技术实现业务办理的自动化,用户不需要工作人员协助就可自行办理业务,人工成本较低,有助于减少人们办理业务的等待时间和办理时间,提高了业务办理的效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种基于语音交互的业务办理方法,包括:
接收智能语音交互设备发送的用户的第一语音信号;
对所述第一语音信号进行语音识别,得到语言文本;
对所述语言文本进行语义解析,得到语义文本;
根据所述语义文本获取对应的业务查询结果;以及
将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。
2.根据权利要求1所述的业务办理方法,还包括:
根据所述业务查询结果生成对话文本;
根据所述对话文本合成对话语音;以及
将所述对话语音发送至所述智能语音交互设备,以供所述智能语音交互设备播放所述对话语音。
3.一种基于语音交互的业务办理方法,包括:
获取用户的第一语音信号;
将所述第一语音信号发送至服务器;
接收所述服务器发送的业务查询结果,所述业务查询结果为所述服务器根据所述第一语音信号获取到的;以及
显示所述业务查询结果。
4.根据权利要求3所述的业务办理方法,还包括:
接收所述服务器发送的对话语音,所述对话语音为所述服务器根据所述业务查询结果生成的;
播放所述对话语音。
5.根据权利要求3所述的业务办理方法,所述获取用户的第一语音信号之前,还包括:
获取所述用户的第二语音信号;
对所述第二语音信号进行唤醒词检测;
若所述第二语音信号中包括预设的唤醒词,则唤醒智能语音交互设备,并输出唤醒成功提示信息。
6.根据权利要求5所述的业务办理方法,还包括:
若所述第二语音信号中不包括所述预设的唤醒词,则输出唤醒失败提示信息。
7.一种基于语音交互的业务办理装置,包括:
接收模块,用于接收智能语音交互设备发送的用户的第一语音信号;
识别模块,用于对所述第一语音信号进行语音识别,得到语言文本;
解析模块,用于对所述语言文本进行语义解析,得到语义文本;
获取模块,用于根据所述语义文本获取对应的业务查询结果;以及
发送模块,用于将所述业务查询结果发送至所述智能语音交互设备,以供所述智能语音交互设备显示所述业务查询结果。
8.根据权利要求7所述的装置,还包括:
生成模块,用于根据所述业务查询结果生成对话文本;
合成模块,用于根据所述对话文本合成对话语音;以及
所述发送模块,还用于将所述对话语音发送至所述智能语音交互设备,以供所述智能语音交互设备播放所述对话语音。
9.一种基于语音交互的业务办理装置,包括:
第一获取模块,用于获取用户的第一语音信号;
发送模块,用于将所述第一语音信号发送至服务器;
接收模块,用于接收所述服务器发送的业务查询结果,所述业务查询结果为所述服务器根据所述第一语音信号获取到的;以及
显示模块,用于显示所述业务查询结果。
10.根据权利要求9所述的装置,所述接收模块,还用于:接收所述服务器发送的对话语音,所述对话语音为所述服务器根据所述业务查询结果生成的;
所述装置,还包括:播放模块,所述播放模块,用于:
播放所述对话语音。
11.根据权利要求9所述的装置,还包括:
第二获取模块,用于所述获取用户的第一语音信号之前,获取所述用户的第二语音信号;
检测模块,用于对所述第二语音信号进行唤醒词检测;
唤醒模块,用于若所述第二语音信号中包括预设的唤醒词,则唤醒智能语音交互设备,并输出唤醒成功提示信息。
12.根据权利要求11所述的装置,所述唤醒模块,还用于:
若所述第二语音信号中不包括所述预设的唤醒词,则输出唤醒失败提示信息。
13.一种服务器,包括权利要求7-8中任一项所述的基于语音交互的业务办理装置。
14.一种智能语音交互设备,包括权利要求9-12中任一项所述的基于语音交互的业务办理装置。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的基于语音交互的业务办理方法,或者能够执行权利要求3-6中任一项所述的基于语音交互的业务办理方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的基于语音交互的业务办理方法,或者执行权利要求3-6中任一项所述的基于语音交互的业务办理方法。
CN202010948343.6A 2020-09-10 2020-09-10 基于语音交互的业务办理方法、装置和电子设备 Pending CN112259090A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010948343.6A CN112259090A (zh) 2020-09-10 2020-09-10 基于语音交互的业务办理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010948343.6A CN112259090A (zh) 2020-09-10 2020-09-10 基于语音交互的业务办理方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN112259090A true CN112259090A (zh) 2021-01-22

Family

ID=74232143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010948343.6A Pending CN112259090A (zh) 2020-09-10 2020-09-10 基于语音交互的业务办理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112259090A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114443825A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的热线业务处理方法、装置及电子设备
CN115760022A (zh) * 2023-01-10 2023-03-07 广州佰锐网络科技有限公司 一种金融业务的智能化办理方法、系统及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105578437A (zh) * 2014-10-09 2016-05-11 中国移动通信集团公司 一种业务处理方法、装置和系统
CN106941000A (zh) * 2017-03-21 2017-07-11 百度在线网络技术(北京)有限公司 基于人工智能的语音交互方法和装置
CN109964473A (zh) * 2017-04-01 2019-07-02 华为技术有限公司 语音业务应答的方法及装置
CN110489527A (zh) * 2019-08-13 2019-11-22 南京邮电大学 基于语音交互的银行业务智能咨询以及办理方法和系统
CN111488433A (zh) * 2020-06-28 2020-08-04 南京银行股份有限公司 一种适用于银行的提升现场体验感的人工智能交互系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105578437A (zh) * 2014-10-09 2016-05-11 中国移动通信集团公司 一种业务处理方法、装置和系统
CN106941000A (zh) * 2017-03-21 2017-07-11 百度在线网络技术(北京)有限公司 基于人工智能的语音交互方法和装置
CN109964473A (zh) * 2017-04-01 2019-07-02 华为技术有限公司 语音业务应答的方法及装置
CN110489527A (zh) * 2019-08-13 2019-11-22 南京邮电大学 基于语音交互的银行业务智能咨询以及办理方法和系统
CN111488433A (zh) * 2020-06-28 2020-08-04 南京银行股份有限公司 一种适用于银行的提升现场体验感的人工智能交互系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114443825A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的热线业务处理方法、装置及电子设备
WO2023137866A1 (zh) * 2022-01-24 2023-07-27 来也科技(北京)有限公司 结合rpa和ai的热线业务处理方法、装置及电子设备
CN115760022A (zh) * 2023-01-10 2023-03-07 广州佰锐网络科技有限公司 一种金融业务的智能化办理方法、系统及介质

Similar Documents

Publication Publication Date Title
CN111192591B (zh) 智能设备的唤醒方法、装置、智能音箱及存储介质
US10304448B2 (en) Environmentally aware dialog policies and response generation
CN110069608B (zh) 一种语音交互的方法、装置、设备和计算机存储介质
EP3531416A1 (en) System for processing user utterance and controlling method thereof
US20170286404A1 (en) Distributed server system for language understanding
KR20190023341A (ko) 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치
US11587550B2 (en) Method and apparatus for outputting information
CN112533041A (zh) 视频播放方法、装置、电子设备和可读存储介质
CN104866275B (zh) 一种用于获取图像信息的方法和装置
CN111862940A (zh) 基于耳机实现的翻译方法、装置、系统、设备和存储介质
CN110675873B (zh) 智能设备的数据处理方法、装置、设备及存储介质
CN108564944B (zh) 智能控制方法、系统、设备及存储介质
WO2015191651A1 (en) Advanced recurrent neural network based letter-to-sound
CN107948437B (zh) 熄屏显示方法和装置
CN107608799B (zh) 一种用于执行交互指令的方法、设备及存储介质
EP3796308A1 (en) Speech recognition control method and apparatus, electronic device and readable storage medium
CN112259090A (zh) 基于语音交互的业务办理方法、装置和电子设备
CN113674742B (zh) 人机交互方法、装置、设备以及存储介质
CN112365875B (zh) 语音合成方法、装置、声码器和电子设备
CN111312233A (zh) 一种语音数据的识别方法、装置及系统
JP2023505917A (ja) 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体
CN112133307A (zh) 人机交互方法、装置、电子设备及存储介质
CN112652304B (zh) 智能设备的语音交互方法、装置和电子设备
CN111862943A (zh) 语音识别方法和装置、电子设备和存储介质
CN112650844A (zh) 对话状态的追踪方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination