CN110265031A

CN110265031A - 一种语音处理方法及装置

Info

Publication number: CN110265031A
Application number: CN201910679051.4A
Authority: CN
Inventors: 黄杰辉; 徐浩; 吴明辉
Original assignee: Miaozhen Systems Information Technology Co Ltd
Current assignee: Miaozhen Information Technology Co Ltd; Miaozhen Systems Information Technology Co Ltd
Priority date: 2019-07-25
Filing date: 2019-07-25
Publication date: 2019-09-20

Abstract

本发明提供了一种语音处理方法及装置，其中，该方法包括：接收通过对指定按钮进行按压的触发指令；根据所述触发指令获取当前时间之前的语音信息；将所述语音信息转换成文字信息；获取与所述文字信息对应的内容；接收并通过语音播放与所述文字信息对应的内容。通过本发明，可以解决相关技术中销售与客户沟通效率低无法有效保障工作效率的问题，通过自动提供用户求助的文字信息对应的内容，协助销售快速回答问题，提高了工作效率。

Description

一种语音处理方法及装置

技术领域

本发明涉及信息处理领域，具体而言，涉及一种语音处理方法及装置。

背景技术

在销售(或者顾问)与顾客沟通交流过程中，顾客随时可能针对产品或者行业中的某个技术(专业)问题进行咨询，如果销售(或者顾问)能对答如流，体现销售(或者顾问)的专业性很强，就会给顾客带来一个良好的影响，从而能更好的促进成单。但是在实际情况中，往往会由于销售对行业专业知识掌握不足，不能很好的应对类似问题，从而让场面变得很尴尬，虽然销售可以通过个人销售技巧将场面圆过去，但终究会给顾客带来一个不好的影响，顾客在心里会认为其实并不专业。

针对相关技术中销售与客户沟通效率低无法有效保障工作效率的问题，尚未提出解决方案。

发明内容

本发明实施例提供了一种语音处理方法及装置，以至少解决相关技术中销售与客户沟通效率低无法有效保障工作效率的问题。

根据本发明的一个实施例，提供了一种语音处理方法，包括：

接收通过对指定按钮进行按压的触发指令；

根据所述触发指令获取当前时间之前的语音信息；

将所述语音信息转换成文字信息；

获取与所述文字信息对应的内容；

接收并通过语音播放与所述文字信息对应的内容。

可选地，获取与所述文字信息对应的内容包括：

将所述文字信息发送给服务器，使得所述服务器从知识库匹配与所述文字信息对应的内容；

接收所述服务器返回的所述文字信息对应的内容。

可选地，在获取与所述文字信息对应的内容之前，所述方法还包括：

根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语；

获取与所述文字信息对应的内容包括：

获取与所述目标专业术语对应的目标内容；

接收并通过语音播放与所述文字信息对应的内容包括：

接收并通过语音播放所述目标内容。

可选地，获取与所述目标专业术语对应的目标内容包括：

根据预先保存的专业术语与内容的对应关系获取所述目标专业术语对应的目标内容。

可选地，根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语包括：

将所述文字信息输入预先训练好的目标神经网络模型，得到所述目标神经网络模型输出的所述文字信息对应每种专业术语的概率，其中，所述概率大于预定阈值的专业术语确定为所述文字信息对应的目标专业术语。

可选地，在根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语之前，所述方法还包括：

获取预定数量的文字信息、以及所述文字信息实际对应的专业术语；

使用所述预定数量的文字信息、以及所述文字信息实际对应的专业术语对原始神经网络模型进行训练，得到所述目标神经网络模型，其中，所述预定数量的文字信息为所述原始神经网络模型的输入，训练好的所述目标神经网络模型输出的目标文字信息对应的目标专业术语与所述目标文字信息实际对应的专业术语满足预定目标函数。

可选地，在接收通过对指定按钮进行按压的触发指令之前，所述方法还包括：

接收启动录音的开始指令；

根据所述开始指令对当前对话进行语音录制。

可选地，所述方法还包括：

对录制的语音按照时间的先后顺序进行文字转换，直到通过转换后的文字内容确定所述当前对话的内容所属的专业领域；

将所述专业领域与所述当前对话的语音绑定。

可选地，所述方法还包括：

在获取到的所述文字信息对应的内容为多个的情况下，根据所述专业领域确定一个所述文字信息对应的内容。

根据本发明的另一个实施例，还提供了一种语音处理装置，包括：

第一接收模块，用于接收通过对指定按钮进行按压的触发指令；

第一获取模块，用于根据所述触发指令获取当前时间之前的语音信息；

转换模块，用于将所述语音信息转换成文字信息；

第二获取模块，用于获取与所述文字信息对应的内容；

播放模块，用于接收并通过语音播放与所述文字信息对应的内容。

可选地，所述第二获取模块，还用于

接收所述服务器返回的所述文字信息对应的内容。

可选地，所述装置还包括：

第三获取模块，用于根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语；

所述第二获取模块，还用于获取与所述目标专业术语对应的目标内容；

所述播放模块，还用于接收并通过语音播放所述目标内容。

可选地，所述第二获取模块，还用于

可选地，所述装置还包括：

第四获取模块，用于获取预定数量的文字信息、以及所述文字信息实际对应的专业术语；

训练模块，用于使用所述预定数量的文字信息、以及所述文字信息实际对应的专业术语对原始神经网络模型进行训练，得到所述目标神经网络模型，其中，所述预定数量的文字信息为所述原始神经网络模型的输入，训练好的所述目标神经网络模型输出的目标文字信息对应的目标专业术语与所述目标文字信息实际对应的专业术语满足预定目标函数。

可选地，所述装置还包括：

第二接收模块，用于接收启动录音的开始指令；

录制模块，用于根据所述开始指令对当前对话进行语音录制。

可选地，所述装置还包括：

第一确定模块，用于对录制的语音按照时间的先后顺序进行文字转换，直到通过转换后的文字内容确定所述当前对话的内容所属的专业领域；

绑定模块，用于将所述专业领域与所述当前对话的语音绑定。

可选地，所述装置还包括：

第二确定模块，用于在获取到的所述文字信息对应的内容为多个的情况下，根据所述专业领域确定一个所述文字信息对应的内容。

根据本发明的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，接收通过对指定按钮进行按压的触发指令；根据所述触发指令获取当前时间之前的语音信息；将所述语音信息转换成文字信息；获取与所述文字信息对应的内容；接收并通过语音播放与所述文字信息对应的内容，因此，可以解决相关技术中销售与客户沟通效率低无法有效保障工作效率的问题，通过自动提供用户求助的文字信息对应的内容，协助销售快速回答问题，提高了工作效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种语音处理方法的移动终端的硬件结构框图；

图2是根据本发明实施例的语音处理方法的流程图；

图3是根据本发明实施例的语音处理装置的框图；

图4是根据本发明优选实施例的语音处理装置的框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的一种语音处理方法的移动终端的硬件结构框图，如图1所示，移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的报文接收方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

基于上述的移动终端，本实施例提供了一种语音处理方法，图2是根据本发明实施例的语音处理方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，接收通过对指定按钮进行按压的触发指令；

上述的指定按钮可以是物理按钮，也可以是显示屏中的按钮组件。

步骤S204，根据所述触发指令获取当前时间之前的语音信息；

上述步骤S204中，获取的是当前时间之前，预定时间长度的语音信息，如当前时间之前1分钟内的语音信息。

步骤S206，将所述语音信息转换成文字信息；

步骤S208，获取与所述文字信息对应的内容；

步骤S210，接收并通过语音播放与所述文字信息对应的内容。

在接收到对应的内容之后，可以直接通过耳机听语音播放，之后再想开户介绍，也可以直接将耳机播放的内容与开户共享。

通过上述步骤S202至S210，接收通过对指定按钮进行按压的触发指令；根据所述触发指令获取当前时间之前的语音信息；将所述语音信息转换成文字信息；获取与所述文字信息对应的内容；接收并通过语音播放与所述文字信息对应的内容，因此，可以解决相关技术中销售与客户沟通效率低无法有效保障工作效率的问题，通过自动提供用户求助的文字信息对应的内容，协助销售快速回答问题，提高了工作效率。

本发明实施例中，可以从服务器中获取文字信息对应的内容，上述步骤S208具体可以包括：

接收所述服务器返回的所述文字信息对应的内容。

本发明实施例，在获取与所述文字信息对应的内容之前，根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语；上述步骤S208具体可以包括：获取与所述目标专业术语对应的目标内容；上述步骤S210具体可以包括：接收并通过语音播放所述目标内容。

进一步地，获取与所述目标专业术语对应的目标内容具体可以包括：根据预先保存的专业术语与内容的对应关系获取所述目标专业术语对应的目标内容。

可选地，根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语具体可以包括：将所述文字信息输入预先训练好的目标神经网络模型，得到所述目标神经网络模型输出的所述文字信息对应每种专业术语的概率，其中，所述概率大于预定阈值的专业术语确定为所述文字信息对应的目标专业术语。

可选地，在根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语之前，获取预定数量的文字信息、以及所述文字信息实际对应的专业术语；使用所述预定数量的文字信息、以及所述文字信息实际对应的专业术语对原始神经网络模型进行训练，得到所述目标神经网络模型，其中，所述预定数量的文字信息为所述原始神经网络模型的输入，训练好的所述目标神经网络模型输出的目标文字信息对应的目标专业术语与所述目标文字信息实际对应的专业术语满足预定目标函数。

本发明实施例中，当用户触发录制，将对话内容全程录下，具体的，在接收通过对指定按钮进行按压的触发指令之前，接收启动录音的开始指令，根据所述开始指令对当前对话进行语音录制。

本发明实施例中，通过录制的语音内容识别出对话涉及的专业领域，对录制的语音按照时间的先后顺序进行文字转换，每次转换可以根据时间先后顺序窃取预定时间或预定长度的语音内容进行识别，若没有识别出来，便继续转换下一条语音信息，直到通过转换后的文字内容确定所述当前对话的内容所属的专业领域，将所述专业领域与所述当前对话的语音绑定。

进一步地，在获取到的所述文字信息对应的内容为多个的情况下，根据所述专业领域确定一个所述文字信息对应的内容，提高了专业术语对应内容的准确性。

上述方法可以应用于电子设备，例如明略灵听设备，通过明略灵听设备，将销售过程中的对话，完整的录音下来。当顾客咨询销售不熟悉的产品或者行业中的某个技术(专业)问题时，销售可使用灵听设备上的一键求助功能，销售触发一键求助功能后，灵听设备将顾客的问题，转化成文字，发送到后台知识图谱进行检索；后台知识图谱检索相关知识，反馈给灵听设备；灵听设备通过耳机将内容反馈给销售，销售将知识给顾客进行解释，实现产品或者行业技术(专业)问题的同声传译。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

本发明实施例，还提供了一种语音处理装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的语音处理装置的框图，如图3所示，包括：

第一接收模块32，用于接收通过对指定按钮进行按压的触发指令；

第一获取模块34，用于根据所述触发指令获取当前时间之前的语音信息；

转换模块36，用于将所述语音信息转换成文字信息；

第二获取模块38，用于获取与所述文字信息对应的内容；

播放模块310，用于接收并通过语音播放与所述文字信息对应的内容。

可选地，所述第二获取模块38，还用于

接收所述服务器返回的所述文字信息对应的内容。

图4是根据本发明优选实施例的语音处理装置的框图，如图4所示，所述装置还包括：

第三获取模块42，用于根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语；

所述第二获取模块38，还用于获取与所述目标专业术语对应的目标内容；

所述播放模块310，还用于接收并通过语音播放所述目标内容。

可选地，所述第二获取模块38，还用于

可选地，所述装置还包括：

第二接收模块，用于接收启动录音的开始指令；

可选地，所述装置还包括：

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S11，接收通过对指定按钮进行按压的触发指令；

S12，根据所述触发指令获取当前时间之前的语音信息；

S13，将所述语音信息转换成文字信息；

S14，获取与所述文字信息对应的内容；

S15，接收并通过语音播放与所述文字信息对应的内容。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S11，接收通过对指定按钮进行按压的触发指令；

S12，根据所述触发指令获取当前时间之前的语音信息；

S13，将所述语音信息转换成文字信息；

S14，获取与所述文字信息对应的内容；

S15，接收并通过语音播放与所述文字信息对应的内容。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种语音处理方法，其特征在于，包括：

接收通过对指定按钮进行按压的触发指令；

根据所述触发指令获取当前时间之前的语音信息；

将所述语音信息转换成文字信息；

获取与所述文字信息对应的内容；

接收并通过语音播放与所述文字信息对应的内容。

2.根据权利要求1所述的方法，其特征在于，

在获取与所述文字信息对应的内容之前，所述方法还包括：

获取与所述文字信息对应的内容包括：

获取与所述目标专业术语对应的目标内容；

接收并通过语音播放与所述文字信息对应的内容包括：

接收并通过语音播放所述目标内容。

3.根据权利要求2所述的方法，其特征在于，获取与所述目标专业术语对应的目标内容包括：

4.根据权利要求2所述的方法，其特征在于，根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语包括：

5.根据权利要求4所述的方法，其特征在于，在根据预先训练好的目标神经网络模型从所述文字信息中提取目标专业术语之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，在接收通过对指定按钮进行按压的触发指令之前，所述方法还包括：

接收启动录音的开始指令；

根据所述开始指令对当前对话进行语音录制。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

将所述专业领域与所述当前对话的语音绑定。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.一种语音处理装置，其特征在于，包括：

转换模块，用于将所述语音信息转换成文字信息；

第二获取模块，用于获取与所述文字信息对应的内容；

10.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至8中任一项所述的方法。

11.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8中任一项所述的方法。