CN109859776A

CN109859776A - 一种语音编辑方法以及装置

Info

Publication number: CN109859776A
Application number: CN201711236599.9A
Authority: CN
Inventors: 谭啸
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2019-06-07
Anticipated expiration: 2037-11-30
Also published as: CN109859776B

Abstract

本申请公开了一种语音编辑方法、装置以及计算机可读存储介质，所述语音编辑方法包括：在语音交互接口中接收针对初始语音数据的编辑触发指令；基于所述编辑触发指令生成对应的语音编辑接口；通过所述语音编辑接口接收编辑指令；根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。通过本申请所提供的方法，可使所述初始语音数据在发送前首先进行编辑，增加了语音交互过程中的全面性和便利性。

Description

一种语音编辑方法以及装置

技术领域

本申请涉及网络通信技术领域，具体涉及一种语音编辑方法。本申请同时涉及一种语音编辑装置，以及一种计算机可读存储介质。

背景技术

现有的语音处理技术中，语音编辑技术已经越来越多的应用到各种语音播放场景中，例如各种音乐播放器和音频学习软件中，对于语音的剪辑、语音播放效果选择等功能应用日趋成熟。在现有的交互场景中，如应用较为广泛的钉钉、微信等社交软件上均设有语音交互功能，其大大提高了信息交互的便利性和可靠性，现有的语音交互方式一般为输入语音数据后直接进行发送或取消。

然而，上述的语音交互方式存在以下不足：

在现有的语音交互场景下，对于已输入的语音数据，只可进行发送和删除操作，而无法对输入的语音数据按预定方式进行编辑，如此便造成了用户无法对所述已输入的语音数据进行灵活操作，例如，无法对所述已输入的语音数据进行剪辑、播放效果选择等语音编辑操作，若所述已输入的语音数据的某一部分需作修整，或者预使所述语音数据以预想的播放效果进行播放，则无法实现。上述无法对已输入的语音数据进行编辑使得现有的语音交互过程缺乏科学性和便利性。

发明内容

本申请提供一种语音编辑方法，以解决现有的语音数据在发送之前无法进行编辑的问题。本申请另外提供一种语音编辑的装置以及一种计算机可读存储介质。

本申请提供一种语音编辑方法，所述方法包括：

在语音交互接口中接收针对初始语音数据的编辑触发指令；

基于所述编辑触发指令生成对应的语音编辑接口；

通过所述语音编辑接口接收编辑指令；

根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；

其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。

可选的，所述语音编辑接口，包括下述至少一项：

用于对语音数据进行剪辑的剪辑接口；

用于对语音数据的音频特征进行编辑处理的音频特征处理接口。

可选的，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

创建所述剪辑接口对应的剪辑界面；

基于所述语音交互接口显示所述剪辑界面；

其中，所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点。

可选的，所述编辑指令，包括：

针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令；

相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式实现：

确定所述第一可滑动标识在所述时间轴上的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴上的位置对应的目标终止时间点；

剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据，将处理后获得的语音数据作为所述目标语音数据。

创建所述音频特征处理接口对应的音频特征处理界面；

基于所述语音交互接口显示所述音频特征处理界面；

其中，所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据。

可选的，所述编辑指令，包括：

针对所述音频特征处理界面中音频特征标识的点击触控指令；

确定所述点击触控指令针对的音频特征标识对应的目标频率、目标波长和/或目标振幅；

按照所述目标频率、目标波长和/或目标振幅对所述初始语音数据进行音频特征变更处理，使其频率、波长和/或振幅与所述目标频率、目标波长和/或目标振幅相同，将音频特征变更处理后获得的语音数据作为所述目标语音数据。

创建所述剪辑接口对应的剪辑界面，以及所述音频特征处理接口对应的音频特征处理界面；

基于所述语音交互接口显示所述剪辑界面以及所述音频特征处理界面；

其中，所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点；

所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据。

可选的，所述编辑指令，包括：

针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令，和/或针对所述音频特征处理界面中音频特征标识的点击触控指令；

相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式中的至少一种实现：

确定所述第一可滑动标识在所述时间轴的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴的位置对应的目标终止时间点；剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据；

按照所述目标频率、目标波长和/或目标振幅针对待处理语音数据进行音频特征变更处理，使其频率、波长和/或振幅与所述目标频率、目标波长和/或目标振幅相同，将音频特征变更处理后获得的语音数据作为所述目标语音数据。所述待处理语音数据可为经剪辑后的语音数据，也可为所述初始语音数据。

可选的，所述语音交互接口，包括：

用于发送和接收语音数据的对话框；

其中，所述编辑触发指令用于响应所述第一交互对象针对所述对话框内的语音按钮所输入的拖拽触控动作，所述语音按钮被所述拖拽触控动作选中后跟随所述拖拽触控动作在所述对话框中进行移动。

可选的，所述在语音交互接口中接收针对初始语音数据的编辑触发指令，采用如下方式实现：

基于所述第一交互对象输入的拖拽触控动作创建触发编辑界面；

在所述对话框上层显示所述触发编辑界面；所述触发编辑界面设有所述语音编辑接口对应的语音编辑控件；

检测所述语音按钮是否移动至所述语音编辑控件的区域范围内，若是，执行所述基于所述编辑触发指令生成对应的语音编辑接口步骤。

可选的，所述根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据步骤后，执行如下操作：

通过所述对话框向所述第二交互对象发送所述目标语音数据。

本申请还提供一种语音编辑装置，包括：

编辑触发指令接收单元，用于在语音交互接口中接收针对初始语音数据的编辑触发指令；

语音编辑接口生成单元，用于基于所述编辑触发指令生成对应的语音编辑接口；

编辑指令接收单元，用于通过所述语音编辑接口接收编辑指令；

目标语音数据获得单元，用于根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；

可选的，所述语音编辑接口，包括下述至少一项：

用于对语音数据进行剪辑的剪辑接口，用于对语音数据的音频特征进行编辑处理的音频特征处理接口。

可选的，所述编辑指令，包括：

本申请还提供一种计算机可读存储介质，其上存储有指令，所述指令被处理器执行时实现如下步骤：

在语音交互接口中接收针对初始语音数据的编辑触发指令；

基于所述编辑触发指令生成对应的语音编辑接口；

通过所述语音编辑接口接收编辑指令；

与现有技术相比，本申请具有以下优点：

本申请提供的语音编辑方法，包括：在语音交互接口中接收针对初始语音数据的编辑触发指令；基于所述编辑触发指令生成对应的语音编辑接口；通过所述语音编辑接口接收编辑指令；根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。通过使用本方法，可使所述初始语音数据在发送前进行编辑，从而增加了语音交互过程的科学性和便利性。

附图说明

图1是本申请提供的一种语音编辑方法实施例的语音编辑方法的流程图；

图2-1是本申请提供的一种语音编辑方法实施例的编辑触发指令的生成示意图；

图2-2是本申请提供的一种语音编辑方法实施例的剪辑界面和音频特征处理界面的示意图；

图2-3是本申请提供的一种语音编辑方法实施例的编辑指令的输入示意图；

图3是本申请提供的一种语音编辑装置实施例的语音编辑装置的示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请提供一种语音编辑方法，本申请还提供一种语音编辑装置，以及一种计算机可读存储介质。以下分别结合本申请提供的实施例的附图逐一进行详细说明。

本申请提供的一种语音编辑方法实施例如下：

参照图1，其示出了本申请提供的一种语音编辑方法实施例的处理流程图，图2-1是本申请提供的一种语音编辑方法实施例的编辑触发指令的生成示意图，图2-2是本申请提供的一种语音编辑方法实施例的剪辑界面和音频特征处理界面的示意图，以及，图2-3是本申请提供的一种语音编辑方法实施例的编辑指令的输入示意图。如图1所示，所述语音编辑方法包括如下步骤：

步骤S101，在语音交互接口中接收针对初始语音数据的编辑触发指令。

本步骤的作用在于通过接收编辑触发指令，使语音交互界面进入可对待发送的语音数据进行编辑的待编辑状态，从而进入本方法。

本申请适用于语音交互场景中，其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。所述语音交互接口指的是可实现不同交互对象之间进行语音交互的平台界面，例如钉钉、微信等各聊天工具所对应的聊天界面。所述初始语音数据指的是所述语音交互接口中的某一交互对象所输入的原始语音数据，例如聊天场景中的某一方所输入的一段话音。该初始语音数据可通过所述语音交互接口发送至所述语音交互接口的其他交互对象。所述第一交互对象指的是在本申请的交互场景中，能够输入所述初始语音数据、并且能够对所述初始语音数据进行编辑和发送操作的交互对象；相应的，所述第二交互对象指的是在本申请的交互场景中，能够接收所述语音数据的交互对象。

所述编辑触发指令指的是因响应交互对象的预定操作动作所形成的用于触发对所述初始语音数据进行编辑的信息指令，通过所述编辑触发指令，可使所述初始语音数据进入到可被编辑的状态。

在本实施例中，所述语音交互接口为用于发送和接收语音数据的对话框；所述对话框内设有用于输入语音的语音按钮，所述编辑触发指令用于响应所述第一交互对象针对所述对话框内的语音按钮所输入的拖拽触控动作，所述语音按钮被所述第一交互对象所输入的拖拽触控动作选中后，可跟随所述拖拽触控动作在所述对话框中进行移动。

所述接收针对初始语音数据的编辑触发指令，该过程具有多种实现方式，只要能达到触发对所述初始语音数据进行编辑即可，例如，可在所述语音交互接口中直接设置用于触发编辑的按钮，对所述按钮进行点选，即可进入编辑界面。在本实施例中，接收针对语音交互接口中的初始语音数据输入的编辑触发指令的过程请参考图2-1，图2-1为所述编辑触发指令的生成示意图，如图2-1所示，该过程采用如下方式实现：

首先，基于所述第一交互对象输入的拖拽触控动作创建触发编辑界面。如图2-1中语音输入栏上方所显示的“手指上划编辑或取消”字样，所述第一交互对象在输入语音后，按照该提示字样针对所述语音输入栏进行“手指上划”的拖拽触控动作，即可对触发编辑界面启动导出程序，即创建触发编辑界面，所述第一交互对象输入的语音即为所述初始语音数据。需要说明的是，除了本实施例中的按提示信息进行拖拽触控的方式，还可通过语音提示、预设按键选择等其它方式实现所述触发编辑界面的创建，在此不再赘述。

其次，在所述对话框上层显示所述触发编辑界面；所述触发编辑界面设有所述语音编辑接口对应的语音编辑控件。如图2-1所示，所述语音编辑控件为具有一定区域范围的编辑标示图案，与该编辑标识图案相对应的，所述触发编辑界面上还设置有删除控件，用于对所述初始语音数据进行删除操作。

需要说明的是，除了在所述对话框上层显示所述触发编辑界面，还可在所述对话框的某一区域范围显示所述触发编辑界面，或者平行于所述对话框显示所述触发编辑界面，在此不作限定。

最后，检测所述语音按钮是否移动至所述语音编辑控件的区域范围内，若是，则执行本方法的后续的步骤。该检测过程实质为对所述第一交互对象的拖拽触控动作的响应。在上述过程实现在所述对话框上层显示所述触发编辑界面之后，所述第一交互对象按所述触发编辑界面的显示内容，对所述语音输入栏的语音按钮进行触控拖拽动作，使所述语音按钮移动至所述语音编辑控件的区域范围内。若上述检测结果为所述语音按钮移动至所述语音编辑控件的区域范围内，则意味着成功接收了所述编辑触发指令，从而进入本方法的后续环节。

步骤S102，基于所述编辑触发指令生成对应的语音编辑接口。

本步骤的作用在于根据上述步骤S101所接收的编辑触发指令生成相应的语音编辑接口，通过所述语音编辑接口可实现对所述初始语音数据进行编辑。

所述语音编辑接口指的是专用于对语音数据进行编辑的可编辑接口，该可编辑接口可根据操作需要预先进行设定，所述第一交互对象可通过该可编辑接口实现对所述初始语音数据的剪辑或者播放效果选取等操作。

本申请中，所述语音编辑接口至少包括以下两种语音编辑接口中的一种，所述两种语音编辑接口分别为：用于对语音数据进行剪辑的剪辑接口，以及用于对语音数据的音频特征进行编辑处理的音频特征处理接口。

相应的，所述基于所述编辑触发指令生成对应的语音编辑接口的过程可为以下三种模式中的一种：

模式一：所述语音编辑接口为剪辑接口，在该模式下，对所述初始语音数据进行编辑的过程仅为对语音数据进行剪辑，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

首先，创建所述剪辑接口对应的剪辑界面；所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点。

其次，基于所述语音交互接口显示所述剪辑界面，即，将所述剪辑界面显示在所述语音交互界面上。

模式二：所述语音编辑接口为音频特征处理接口，在该模式下，对所述初始语音数据进行编辑的过程仅为对所述语音数据的音频特征进行处理，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

首先，创建所述音频特征处理接口对应的音频特征处理界面；所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据。

其次，基于所述语音交互接口显示所述音频特征处理界面，即，将所述音频特征处理界面显示在所述语音交互界面上。

模式三：所述语音编辑接口为语音剪辑接口和音频特征处理接口，在本实施例中采用该种模式，该模式为本申请的优选模式，在该模式下，对所述初始语音数据进行编辑的过程可包括对所述语音数据的剪辑和音频特征处理过程，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

创建所述剪辑接口对应的剪辑界面，以及所述音频特征处理接口对应的音频特征处理界面。所述剪辑界面和所述音频特征处理界面请参考图2-2，图2-2为所述剪辑界面和所述音频特征处理界面的示意图。所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点，如图2-2所示，所述剪辑界面的时间轴为长条状，其前端和后端的箭头状标识分别为所述第一可滑动标识和第二可滑动标识。所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据的播放效果，如图2-2所示，所述音频特征处理界面设置有多个可点选模块，如电音、尖锐等模块，每个所述可点选模块为一个音频特征标识，其上标识有音频数据的目标播放效果，如电音效果、尖锐效果等，所述音频数据的目标播放效果为对所述初始音频数据的频率、波长和/或振幅进行变更，以使其达到所述目标播放效果所对应的目标频率、目标波长和/或目标振幅，从而使所述标识的目标播放效果得以实现。

基于所述语音交互接口显示所述剪辑界面以及所述音频特征处理界面，即如图2-2所示，将所述剪辑界面和所述音频特征处理界面一同显示至所述对话框上层。

步骤S103，通过所述语音编辑接口接收编辑指令。

本步骤用于接收针对所述初始语音数据的编辑指令，所述编辑指令通过上述步骤生成的语音编辑接口进行输入。

所述编辑指令指的是用于对所述第一交互对象按照所述显示的语音编辑接口、针对所述初始语音数据进行的编辑动作进行响应的指令。

本步骤中的编辑指令与上述步骤S102中所生成的语音编辑接口相对应，若所述语音编辑接口为剪辑接口，则所述编辑指令为：针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令；所述滑动触控指令响应于所述第一交互对象对所述时间轴上的第一可滑动标识和/或第二可滑动标识所进行的滑动触控动作。

若所述语音编辑接口为音频特征处理接口，则所述编辑指令为：针对所述音频特征处理界面中音频特征标识的点击触控指令；所述点击触控指令响应于所述第一交互对象对所述音频特征标识所进行的点击触控动作。

在本实施例中，如图2-3所示，图2-3为所述编辑指令的输入示意图，所述语音编辑接口为语音剪辑接口和音频特征处理接口，相应的，所述编辑指令可包括针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令，以及针对所述音频特征处理界面中音频特征标识的点击触控指令中的至少一种；因此，本实施例中，如图2-3所示，所述编辑指令可至少响应于下述两组动作中的一组，所述两组动作分别为：所述第一交互对象对所述时间轴上的第一可滑动标识和/或第二可滑动标识的滑动触控动作、以及对所述音频特征标识所进行的点击触控动作。当所述第一交互对象对所述时间轴上的前端和/或后端的箭头状标识实施滑动触控动作时，即可形成所述滑动触控指令；当所述第一交互对象对所述音频特征处理界面中的可点选模块实施点击选取动作时，即可形成所述点击触控指令。

步骤S104，根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据。

本步骤的作用在于根据上述步骤所生成的所述编辑指令对所述初始语音数据进行处理，以获得最终的目标语音数据。

由上述步骤可知，不同的语音编辑接口对应不同的编辑指令，对应的，不同的编辑指令对应不同的语音数据处理方法。当所述编辑指令为：针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令时，采用如下方式对所述初始语音数据进行处理：

确定所述第一可滑动标识在所述时间轴上的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴上的位置对应的目标终止时间点；所述目标起始时间点和所述目标终止时间点之间的语音数据为剪辑后的目标语音数据。

剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据，将所述剔除操作后剩余的语音数据作为所述目标语音数据。

当所述编辑指令为：针对所述音频特征处理界面中音频特征标识的点击触控指令时，采用如下方式对所述初始语音数据进行处理：

确定所述点击触控指令针对的音频特征标识对应的目标频率、目标波长和/或目标振幅。

在本实施例中，所述编辑指令至少包括针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令，以及针对所述音频特征处理界面中音频特征标识的点击触控指令中的一种指令，相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式中的至少一种实现：

确定所述第一可滑动标识在所述时间轴的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴的位置对应的目标起始时间点；剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据；剩余的所述目标起始时间点和所述目标终止时间点之间的语音数据的长度为所述目标语音数据的最终长度。

按照所述目标频率、目标波长和/或目标振幅针对待处理语音数据进行音频特征变更处理，使其频率、波长和/或振幅与所述目标频率、目标波长和/或目标振幅相同，使经音频特征变更处理后的语音数据的播放效果能够达到所述目标播放效果，如电音效果、尖锐效果等，将所述音频特征变更处理后获得的语音数据作为所述目标语音数据。所述待处理语音数据可为经剪辑后的语音数据，也可为所述初始语音数据。

需要说明的是，在所述步骤S101中，还可以在所述触发编辑界面设置两个控件，一个是剪辑接口对应的剪辑控件，另一个是所述音频特征处理接口对应的音频特征处理控件，所述接收针对语音交互接口中的初始语音数据输入的编辑触发指令，采用如下方式实现：

基于第一交互对象输入的拖拽触控动作创建触发编辑界面。

在所述对话框上层显示所述触发编辑界面；所述触发编辑界面设有所述剪辑接口对应的剪辑控件和/或所述音频特征处理接口对应的音频特征处理控件；

检测所述语音按钮是否移动至所述剪辑控件或者所述音频特征处理控件的区域范围内，若是，执行所述基于所述编辑触发指令生成对应的语音编辑接口步骤。

相应的，所述语音编辑接口可为剪辑接口，或者为音频特征处理接口；当上述检测结果为所述语音按钮移动至所述剪辑控件的区域范围内时，则生成剪辑接口；当上述检测结果为所述语音按钮移动至所述音频特征处理控件的区域范围内时，则生成音频特征处理接口。

相应的，所述剪辑接口对应的编辑指令为所述滑动触控指令，所述音频特征处理接口对应的编辑指令为点击触控指令。

需要说明的是，在上述方案中，所述初始语音数据是在接收编辑触发指令之前先输入的，即在所述第一交互对象输入初始语音数据后，才进行创建并显示触发编辑界面、接收编辑触发指令、生成对应的语音编辑接口、通过所述语音编辑接口接收编辑指令、并根据所述编辑指令对所述初始语音数据进行处理等操作。然而在实际应用中，所述初始语音数据的输入顺序不受上述方案的限制，即可在完成上述部分操作后输入所述初始语音数据。例如，可首先接收用户输入的编辑触发指令并生成音频特征处理界面，当用户通过所述音频特征处理界面选择目标播放效果以生成编辑指令后，用户再输入初始语音数据，然后根据所述编辑指令对所述初始语音数据进行处理，该方式对所述初始语音数据的处理效果无任何影响，同样可获得目标语音数据。

在本实施中，在经上述步骤获得所述目标语音数据之后，还需将所述目标语音数据通过所述对话框向所述第二交互对象进行发送，以完成对语音数据的交互过程。如图2-3所示，该发送过程可通过响应所述第一交互对象在所述语音编辑接口上对预设的发送按钮的点击动作而完成。

综上所述，使用本申请所提供的语音编辑方法，在语音交互场景中，可对输入的初始语音数据在发送前按预设的编辑方式进行编辑，本申请中主要的编辑方式为语音剪辑和音频特征处理，通过所述语音剪辑可改变所述初始语音数据的播放长度，通过所述音频特征处理可为音频数据选择合适的播放效果，该播放效果包括播放语境和播放背景等。通过使用本方法，可使语音数据的交互方式更加灵活多样，增加了语音交互过程的科学性和便利性。

本申请提供的一种语音编辑装置实施例如下：

在上述的实施例中，提供了一种语音编辑方法，与之相对应的，本申请还提供了一种语音编辑装置，下面结合附图进行说明。

参照附图3，其示出了本申请提供的一种语音编辑装置实施例的示意图。

由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。

如图3所示，本申请提供一种语音编辑装置，包括：

编辑触发指令接收单元301，用于在语音交互接口中接收针对初始语音数据的编辑触发指令；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互；

语音编辑接口生成单元302，用于基于所述编辑触发指令生成对应的语音编辑接口；

编辑指令接收单元303，用于通过所述语音编辑接口接收编辑指令；

目标语音数据获得单元304，用于根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据。

可选的，所述语音编辑接口，包括下述至少一项：

可选的，所述编辑指令，包括：

确定所述第一可滑动标识在所述时间轴的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴的位置对应的目标终止时间点；剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据。

本申请提供的一种计算机可读存储介质实施例如下：

在上述的实施例中，提供了一种语音编辑方法，此外，本申请还提供了一种用于实现所述语音编辑方法的计算机可读存储介质。本申请提供的所述计算机可读存储介质实施例描述得比较简单，相关的部分请参见上述提供的所述语音编辑方法实施例的对应说明即可。下述描述的实施例仅仅是示意性的。

本申请提供一种计算机可读存储介质，其上存储有指令，所述指令被处理器执行时实现以下步骤：

在语音交互接口中接收针对初始语音数据的编辑触发指令；

基于所述编辑触发指令生成对应的语音编辑接口；

通过所述语音编辑接口接收编辑指令；

可选的，所述语音编辑接口，包括下述至少一项：

创建所述剪辑接口对应的剪辑界面；

基于所述语音交互接口显示所述剪辑界面；

可选的，所述编辑指令，包括：

确定所述第一可滑动标识在所述时间轴的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴的位置对应的目标终止时间点；

创建所述音频特征处理接口对应的音频特征处理界面；

基于所述语音交互接口显示所述音频特征处理界面；

可选的，所述编辑指令，包括：

优选的，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

优选的，所述编辑指令，包括：

可选的，所述语音交互接口，包括：

用于发送和接收语音数据的对话框；

其中，所述编辑触发指令用于响应所述第一交互对象针对所述对话框设置的语音按钮输入的拖拽触控动作，所述语音按钮被所述拖拽触控动作选中后跟随所述拖拽触控动作在所述对话框中进行移动。

可选的，所述根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据指令执行后，执行如下操作：

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

在一个典型的配置中，计算设备包括一个或多个处理器、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims

1.一种语音编辑方法，其特征在于，包括：

在语音交互接口中接收针对初始语音数据的编辑触发指令；

基于所述编辑触发指令生成对应的语音编辑接口；

通过所述语音编辑接口接收编辑指令；

2.根据权利要求1所述的语音编辑方法，其特征在于，所述语音编辑接口，包括下述至少一项：

用于对语音数据进行剪辑的剪辑接口；

3.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

创建所述剪辑接口对应的剪辑界面；

基于所述语音交互接口显示所述剪辑界面；

4.根据权利要求3所述的语音编辑方法，其特征在于，所述编辑指令，包括：

5.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

创建所述音频特征处理接口对应的音频特征处理界面；

基于所述语音交互接口显示所述音频特征处理界面；

6.根据权利要求5所述的语音编辑方法，其特征在于，所述编辑指令，包括：

7.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

8.根据权利要求7所述的语音编辑方法，其特征在于，所述编辑指令，包括：

9.根据权利要求1至8任意一项所述的语音编辑方法，其特征在于，所述语音交互接口，包括：

用于发送和接收语音数据的对话框；

10.根据权利要求9所述的语音编辑方法，其特征在于，所述在语音交互接口中接收针对初始语音数据的编辑触发指令，采用如下方式实现：

11.根据权利要求10所述的语音编辑方法，其特征在于，所述根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据步骤后，执行如下操作：

12.一种语音编辑装置，其特征在于，包括：

13.根据权利要求12所述的语音编辑装置，其特征在于，所述语音编辑接口，包括下述至少一项：

14.根据权利要求13所述的语音编辑装置，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：

15.根据权利要求14所述的语音编辑装置，其特征在于，所述编辑指令，包括：

16.一种计算机可读存储介质，其特征在于，其上存储有指令，所述指令被处理器执行时实现如下步骤：

在语音交互接口中接收针对初始语音数据的编辑触发指令；

基于所述编辑触发指令生成对应的语音编辑接口；

通过所述语音编辑接口接收编辑指令；