WO2018040576A1

WO2018040576A1 - 一种音频剪辑方法、装置、终端及计算机存储介质

Info

Publication number: WO2018040576A1
Application number: PCT/CN2017/080702
Authority: WO
Inventors: 张海婷
Original assignee: 中兴通讯股份有限公司
Priority date: 2016-09-05
Filing date: 2017-04-17
Publication date: 2018-03-08
Also published as: CN107799132A

Abstract

一种音频剪辑方法、装置、终端及计算机存储介质，剪辑方法包括确定待剪辑音频对应的待调整剪辑点（S101）；获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点（S102）；通过最终剪辑点对待剪辑音频进行剪辑（S103）。

Description

一种音频剪辑方法、装置、终端及计算机存储介质

相关申请的交叉引用

本申请基于申请号为201610804873.7、申请日为2016年09月05日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及音频剪辑领域，尤其涉及一种音频剪辑方法、装置、终端及计算机存储介质。

背景技术

当前在进行音频剪辑时，是由用户直接在终端进行剪辑点的选择，然后根据该剪辑点进行音频剪辑，通过当前这种剪辑方式得到的剪辑后的音频往往不是用户希望得到的理想音频。

发明内容

本公开实施例期望提供一种音频剪辑方法、装置、终端及计算机存储介质。

本公开实施例提供一种音频剪辑方法，包括：

确定待剪辑音频对应的待调整剪辑点；

获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；

通过最终剪辑点对待剪辑音频进行剪辑。

本公开实施例还提供一种音频剪辑装置，包括：

待调整剪辑点确定模块，配置为确定待剪辑音频对应的待调整剪辑点；

剪辑点调整模块，配置为获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；

剪辑模块，配置为通过最终剪辑点对待剪辑音频进行剪辑。

本公开实施例还提供一种终端，包括：本公开实施例所述的音频剪辑装置。

本公开实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，计算机可执行指令用于执行本公开实施例所述的音频剪辑方法。

本公开实施例提供的音频剪辑方法、装置、终端及计算机存储介质，通过确定待剪辑音频对应的待调整剪辑点；获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；通过最终剪辑点对待剪辑音频进行剪辑，即可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整，得到最终剪辑点，根据该最终剪辑点对待剪辑音频进行剪辑，可以避免剪辑后的音频的起止位置存在不完整的语句、或存在静音时段等情况的发生，提高了音频剪辑的质量，使得最终剪辑得到的音频更加符合用户需求，提升了用户的体验。

附图说明

图1为本公开实施例一的音频剪辑方法流程图；

图2为本公开实施例一的音频剪辑点示意图；

图3为本公开实施例一的另一音频剪辑点示意图；

图4为本公开实施例二的对剪辑点进行一次调整的音频剪辑方法流程图；

图5为本公开实施例二的对剪辑点进行多次调整的音频剪辑方法流程图；

图6为本公开实施例二的另一种对剪辑点进行多次调整的音频剪辑方法流程图；

图7为本公开实施例三的音频剪辑装置示意图；

图8为本公开实施例三提供的终端示意图。

具体实施方式

下面通过具体实施方式结合附图对本公开实施例作进一步详细说明。

实施例一

本实施例提供了一种音频剪辑方法，请参见图1，具体包括：

步骤S101，确定待剪辑音频对应的待调整剪辑点；

步骤S102，获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；

步骤S103，通过最终剪辑点对待剪辑音频进行剪辑。

本实施例中的待剪辑音频对应的待调整剪辑点，具体可以是用户确定的待剪辑音频对应的初始剪辑点，也可以是对初始剪辑点进行调整后得到的调整后的剪辑点。对于步骤S101，确定待剪辑音频对应的待调整剪辑点，包括：接受用户对待剪辑音频的剪辑点的触发操作，确定该待调整剪辑点；或者接受用户输入的待调整剪辑点的位置信息，确定待调整剪辑点；也可以是自动识别调整后的剪辑点，若该调整后的剪辑点需要进行进一步调整，则将该剪辑点作为待调整剪辑点。另外，本实施例中的待调整剪辑点可以是待调整的剪辑起点，也可以是待调整的剪辑终点。

作为一种实施方式，本实施例中，获取所述待调整剪辑点对应的调整音频，包括：获取待调整剪辑点所在的预设区域内的音频；或获取待调整剪辑点所在的完整音频语句。为了使最终剪辑得到的音频更加符合用户的需求，可以对待调整剪辑点附近的音频进行分析，判断是否需要对该待调整剪辑点进行调整。该待调整剪辑点附近的音频具体可以是该待调整剪辑点所在的预设区域内的音频，请参见图2，若该待剪辑音频为A-B，其中S₀为其中一个待调整剪辑点，该待调整剪辑点所在的预设区域可以是该待调整剪辑点所在的C-D区域，其中，C-S₀小于A-S₀，S₀-D小于S₀-B；另外C-S₀和S₀-D可以相同，也可以不同，其可以根据需要具体设置。另外，本实施例中的待剪辑音频对应的调整音频也可以是该待调整剪辑点所在的完整音频语句；如可以在确定待调整剪辑点后，对该待剪辑音频进行语音分析，进行语句层面的切分，确定该待调整剪辑点对应的完整音频语句，将该完整音频语句作为该待调整剪辑点对应的调整音频。如图2所示，若待调整剪辑点为S₀，则经过语音分析后，其对应的完整音频语句可以是C₁-D₁。本实施例中，在进行完整音频语句切分时，由于语句的边界端点处常存在某些特征的明显变化，所以具体可以是通过检测音频的特征变化和结合静音时延来对语句进行划界，确定语句的边界端点；该音频特征具体可以是指音频能量等特征信息。

本实施例中，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点，包括：计算调整音频对应的评估值；将评估值与预设评估阈值进行比较，根据比较结果对待调整剪辑点进行调整，得到最终剪辑点。本实施例中根据待调整剪辑点对应的调整音频对该待调整剪辑点进行调整，具体可以是根据该调整音频对应的评估值与预设评估阈值的大小关系确定对该待调整剪辑点的调整方式。

本实施例中的计算调整音频对应的评估值包括：根据调整音频的特征值计算评估值，特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。可以根据该调整音频的切分比、音频信噪比、静音时延比、音强比等特征值中的至少一个计算该评估值。该切分比指待调整剪辑点所在调整音频以该待调整剪辑点为分割点，包含在裁剪音频中的部分占整个调整音频的比例，如图3所示，其中剪辑音频为A-B，该S₀为待调整剪辑点，其所在的调整音频为s-e，其中s-S₀间的时长为a，S₀-e间的时长为b，则切分比R₁＝b/(a+b)，该切分比R₁越大，该部分音频越应该被保存，即当待调整剪辑点是剪辑起点时，则可以将该部分音频的起点作为调整后的剪辑起点，当待调整剪辑点是剪辑终点时，则可以将该部分音频的终点作为调整后的剪辑终点；另外，其中一个极端情况是该待调整剪辑点正好处于两个调整音频中间，则该待调整剪辑点是剪辑起点时，其对应的调整语句可以是前一个调整音频语句，该待调整剪辑点是剪辑终点时，其对应的调整音频可以是后一个调整音频，因此切分比R₁满足：0≤R₁≤1。音频信噪比为是音频正常声音信号强度与噪声信号强度的比值，当信噪比高时，噪音比较小，此段音频更有可能被保留。本实施例中信噪比为了与其他因素相统一，可以取有用信号功率与全部音频功率的比值，该音频信噪比R₂＝P_有用/P_总1其中P_有用为有用信号功率，P_总1为全部音频功率，0＜R₂＜1。静音时延比具体是指当前调整音频两端静音时间长度的比例，如图3所示，如果L₁比L₂长很多，那么当前调整音频更有可能与裁剪音频是一个整体，更有可能被保留。同样为与其他因素相统一，静音时延比R₃满足：R₃＝((L₁+L₂)/(L₁+L₂)+1)/2，0＜R₃＜1。音强比具体为此调整音频与待剪辑音频整个部分的音强对比，两部分音频的音强越相近，此调整音频越有可能被保留。音强比计算公式为R₄＝1-(P-P_总2)/P，其中，P_总2为当前待剪辑音频的音强，P为调整音频的音强，0＜R₄＜1。本实施例中的调整音频可以是前述的待调整剪辑点对应的预设区域内的音频，也可以是待调整剪辑点所在的完整音频语句。

本实施例中根据上述调整音频的特征值计算评估值可以是根据上述特征值进行计算得到，该评估值R＝K₁R₁+K₂R₂+K₃R₃+K₄R₄+……+K_nR_n,，其中，K_n为各特征值对应的因素参数，其中K_n≥0，n为大于零的正整数，K_n可以相同，也可以不相同，可以通过调整K_n的大小来设定每个特征值所占的重要程度。本实施例中，在计算评估值时，可以从多个特征值中选择任意几项进行计算，可以将未选择的特征值对应的因素参数设置为0。该各项特征值取值越大评估值越大，此时该调整音频越可能被保留下来。需要理解的是，该调整音频的特征值除上述四种以外，也可以是其他类型的特征值，其可以根据需要具体设置，本实施例对此不作限定。在需要进行多次待调整剪辑点调整时，可以设置不同的评估值计算方式和不同的评估值阈值，决定对待调整剪辑点的调整方式。

作为一种实施方式，本实施例中当待调整剪辑点为待调整音频对应的剪辑起点时，所述根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点，包括：当剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时，将调整音频的起点作为调整后的剪辑起点；当剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将调整音频的终点作为调整后的剪辑起点。当待调整剪辑点为待调整音频对应的剪辑终点时，所述根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点，包括：当剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时，将调整音频的终点作为调整后的剪辑终点；当剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将调整音频的起点作为调整后的剪辑终点。当该待调整剪辑点为剪辑起点S₀，则其具体可以是，当R＞λ时，保留此调整音频，请参见图3，具体可以是将S₀调整到s处，将s作为剪辑起点；当R≤λ时，舍弃该调整音频，具体可以是将S₀调整到e处，将e作为剪辑起点，λ为该剪辑起点对应的预设评估值阈值；若该待调整剪辑点为剪辑终点E₀，当R＞λ时，保留此调整音频，则具体可以是将E₀调整到m处，将m作为剪辑终点；当R≤λ时，舍弃该调整音频，具体可以是将E₀调整到f处，将f作为剪辑终点，λ为该剪辑终点对应的预设评估值阈值。本实施例中的剪辑起点与剪辑终点对应的预设评估阈值可以是相同的，也可以是不相同的；即各待调整剪辑点的预设评估阈值可以根据需要设置具体设置，可以将其设置为相同值，也可以设置为不同值。

本实施例中，所述根据调整音频对待调整剪辑点进行调整，确定最终剪辑点，包括：根据待剪辑音频的长度，确定待调整剪辑点对应的调整次数，对待调整剪辑点根据调整次数进行调整，得到最终剪辑点；或获取对待调整剪辑点进行调整后的剪辑点对应的调整音频，对调整后的剪辑点进行调整，直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时，结束剪辑点调整，将前一次调整后的剪辑点作为最终剪辑点。将该待调整剪辑点进行调整得到最终剪辑点可以是对该待调整剪辑点进行N次调整，将经过N次调整后的剪辑点作为最终剪辑点，其中N为预设的调整次数。该预设调整次数可以是根据该待剪辑的音频的大小进行设置，对于时长短的待剪辑音频由于其剪辑点的定位相对比较准确，则该调整次数的取值可以相对较小，如可以是一次，或者两次；当该待剪辑音频的时长较长时，对剪辑点的定位相对不是很准确，可以相应的多进行几次调整，以使剪辑后得到的音频能更符合用户需求。另外，也可以根据待调整剪辑点的调整方向的判断来确定对该待调整剪辑点的调整，再对剪辑点进行调整时，若其当前得出的进行调整的方向与前次进行调整的方向一致，则对该剪辑点进行调整，若不一致，则结束本次调整，将前一次调整的剪辑点作为最终剪辑点。该调整方向是否一致，具体可以是指保留调整音频还是舍弃调整音频。本实施例中的待调整剪辑点具体可以是指最初确定的初始剪辑点。

本实施例提供的音频剪辑方法，还包括：当已调整的调整音频的时长与待剪辑音频的时长的比值达到预设调整比例阈值，则停止对剪辑点的调整，将前一次确定的剪辑点作为最终剪辑点；已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。若待剪辑音频的待调整剪辑点连续进行了多次调整，如向同一个方向进行了多次连续调整，则可以计算已经调整的调整音频的时长与该待剪辑音频的时长的比值，该比值具体为调整比例，若该调整比例达到预设调整比例阈值，则可以停止对该待剪辑音频的待调整剪辑点的调整，将前一次确定的剪辑点作为最终剪辑点；若其调整比例未达到预设调整比例阈值，则可以继续按照正常的调整方式对其待调整剪辑点进行调整。该剪辑点可以是剪辑起点，也可以是剪辑终点，已调整的调整音频可以包括剪辑起点对应的已调整的调整音频，也可以包括剪辑终点对应的已调整的调整音频。本实施中的调整比例的计算公式为：Q＝θ(T₁+…+T_P)/T，其中T为待调整音频的总时长，T_P为S_nE_n相比于S_n-1E_n-1调整的音频时长，p为大于零的任意正整数，θ为与音频总时长有关的参数。如果音频持续保留或者舍弃，则需要通过判断调整比例Q是否已经达到其对应的调整比例阈值Q_阈值，如果未达到则继续调整，如果达到，则停止对剪辑点的调整。

现有技术中通常是由用户经过预览后，在触摸屏上拖动剪裁位置确定剪辑点，然后直接根据该确定的剪辑点进行音频剪辑的方式，这种裁剪方式一般不能使得剪辑点所在的调整音频并不满足用户需求，如其所在的语句不是一句完整的语句，尤其是待剪辑音频时长较大时，这种误差更为明显。本实施例提供的音频剪辑方法，通过确定待剪辑音频对应的待调整剪辑点；获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；通过最终剪辑点对待剪辑音频进行剪辑，即相比于现有技术，可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整，得到最终剪辑点，根据该最终剪辑点对待剪辑音频进行剪辑，可以避免剪辑后的音频的起止位置存在不完整的语句、或存在静音时段等情况的发生，提高了音频剪辑的质量，使得最终剪辑得到的音频更加符合用户需求，提高了用户的体验。另外，本实施例提供的音频剪辑方法通过语音技术对待剪辑音频进行切分，进而根据切分得到的调整音频对剪辑点进行调整，即对剪辑点所在的语句进行切分分析，判断是要保留该部分语句还是舍弃该部分语句，通过这种方式使得剪辑得到的音频更加符合用户需求。

实施例二

本实施例提供一种音频剪辑方法，在确定剪辑点后，主要通过对剪辑点所在的音频语句进行分析，判断是否需要对该剪辑点进行调整，确定最终剪辑点，根据该最终剪辑点对待剪辑音频进行剪辑，得到需要的音频。

本实施例中，提供一种对初始剪辑点进行一次调整得到最终剪辑点的方法，具体可如图4所示，包括：

步骤S401，确定初始剪辑点。

本实施例中确定初始剪辑点可以是根据用户对剪辑界面上剪辑点的拖动操作确定最初的剪辑点，请参见图3，该初始剪辑点包括初始剪辑起点S₀和初始剪辑终点E₀。

步骤S402，对初始剪辑点对应的完整音频语句进行切分。

通过语音技术对待剪辑音频进行语音分析与切分，其具体是进行语句层面的切分，确定该初始剪辑点所在的完整音频语句，如图3所示，初始剪辑起点对应的完整音频语句可以为s-e，初始剪辑终点对应的完整音频语句可以为f-m。

步骤S403，判断评估值是否大于预设评估阈值，大于则跳转到步骤S404；否则跳转到步骤S405。

得到初始剪辑点所在的完整音频语句后，进行音频信息评估，判断是否保留该完整音频语句，具体是计算该初始剪辑点的评估值，将其评估值与其对应的预设评估阈值进行比较，确定是否将该完整音频语句保留到剪辑后的音频中。若其评估值大于预设评估阈值，则跳转到步骤S404；若其评估值小于等于预设评估阈值，则跳转到步骤S405。

步骤S404，保留该完整音频语句，跳转到步骤S406。

请参见图3，保留该完整音频语句具体包括：若保留初始剪辑起点对应的完整音频语句，则将S₀调整至s处；若保留初始剪辑终点对应的完整音频语句，则将E₀调整至m处。

步骤S405，舍弃该完整音频语句，跳转到步骤S406。

请参见图3，舍弃该完整音频语句具体包括：若舍弃初始剪辑起点对应的完整音频语句，则将S₀调整至e处；若保留初始剪辑起点对应的完整音频语句，则将E₀调整至f处。

步骤S406，根据最终剪辑点进行音频剪辑。

在确定最终剪辑点后，根据该最终剪辑点对待剪辑音频进行剪辑，本实施例中的剪辑点都包括剪辑起点和剪辑终点，即将最终剪辑起点与最终剪辑终点间的音频进行剪辑得到最终的剪辑后的音频。通过上述方式，得到的剪辑后的音频相对来说其音频语句的完整性较高，更符合用户的需求。

本实施例还提供一种对初始剪辑点进行多次调整进行音频剪辑的方法，请参见图5，具体包括：

步骤S501，确定剪辑点；

步骤S502，对剪辑点对应的完整音频语句进行切分；

步骤S503，判断评估值是否大于预设评估阈值；大于则跳转到步骤S504；否则跳转到步骤S505；

步骤S504，保留该完整音频语句，跳转到步骤S502；

步骤S505，舍弃该完整音频语句，跳转到步骤S506；

步骤S506，根据最终剪辑点进行音频剪辑。

本实施例中，若需要对初始剪辑点进行多次调整得到最终剪辑点，可以是在得到第一次调整后的剪辑点后获取该调整后的剪辑点对应的完整音频语句，判断是否需要对该调整后的剪辑点进行进一步调整，本实施例中的调整后的剪辑点包括至少一次调整后的剪辑点，其可以是重复进行该步骤S502至S504，直至判断需不需要对调整后的剪辑点进行调整时，确定最近一次调整的剪辑点作为调整后的剪辑点。本实施例中具体可以是在当存在舍弃待调整剪辑点对应的完整音频语句时，确定结束待调整剪辑点的调整。在确定最终剪辑点后，根据该最终剪辑点对待剪辑音频进行剪辑。本实施例中的剪辑点都包括剪辑起点和剪辑终点，其他部分的处理方式与只进行一次调整的方式都相同。通过上述方式，得到的剪辑后的音频相对来说其音频语句的完整性较高，更符合用户的需求。

另外，本实施例中，在进行每次剪辑点调整时，待调整剪辑点对应的评估值的计算方式可以是不相同的，即各剪辑点对应的用于进行预设评估阈值设置和其对应的评估值的计算的特征值可以选择不同值进行设置。如第一次调整时评估值的计算公式可以为前述的R＝K₁R₁+K₂R₂+K₃R₃+K₄R₄；第一次调整后，后续的待调整的剪辑点在最初确定的剪辑音频S₀E₀之外时，可以将切分比设置为零，则第二次调整时评估值的计算公式可以为R＝K(K₂R₂+K₃R₃+K₄R₄)，其中K为第二次调整时加入的调整参数，0＜K＜1。本实施例中第一次调整时评估值可以由前述的切分比、音频信噪比、静音时延比、音强比进行确定；作为一种实施方式，所述评估值可以为R＝(R₁+R₂+R₃+R₄)/4，即将K₁、K₂、K₃、K₄都设置为相同值1/4。设置当R≤0.5时，舍弃该完整音频语句，当R＞0.5时，保留该完整音频语句。在进行第二次调整时，评估值由音频信噪比、静音时延比和音强比进行确定，所述评估值可以为R＝0.9(R₂+R₃+R₄)/3，1/3为相同的因素参数，其中0.9为第二次调整时加入的调整参数。后续调整可以继续选择该第二次的评估值计算公式，也可以另外设置，直至R≤0.5时，舍弃该完整音频语句，结束调整。

另外，上述对初始剪辑点进行多次调整时，若每次调整的方向一致，如持续保留音频语句或持续舍弃音频语句，则可以通过已调整的音频的时长与待调整的音频的时长确定是否需要结束调整。调整比例计算公式为前述的：Q＝θ(T₁+…+T_P)/T，根据该调整比例对待调整剪辑点进行调整，进行音频剪辑的过程，具体如图6所示，包括：

步骤S601，确定剪辑点；

步骤S602，对剪辑点对应的完整音频语句进行切分；

步骤S603，判断是该完整音频语句的评估值是否大于预设评估阈值，大于跳转到步骤S604；否则跳转到步骤S605；

步骤S604，保留该完整音频语句，跳转到步骤S606；

步骤S605，舍弃该完整音频语句，跳转到步骤S606；

步骤S606，保留或舍弃与上一次是否相同，若相同，跳转到步骤S607；若不相同，则跳转到步骤S608；

步骤S607，调整比例是否为Q＞Q_阈值，若是，跳转到步骤S608；若否，则跳转到步骤S602；

步骤S608，根据最终剪辑点进行音频剪辑。

即本实施例中，相比于前述对剪辑点进行多次调整的方式，增加了对剪辑点调整方向的判断和对调整比例的判断，来确定是否需要结束剪辑点调整。如第一次调整的方向和第二次调整的方向一致，调整的时长分别为T₁和T₂，假设设置θ＝0.05，计算调整比例得到Q＝0.05(T₁+T₂)/T，若Q小于Q_阈值，则进行第三次剪辑点调整，直至Q大于Q_阈值，结束调整。该Q_阈值具体可以是1。

本实施例提供的对待剪辑音频的剪辑方式，可以只对该待剪辑音频进行一次剪辑，也可以进行多次剪辑，使得得到的剪辑后的音频的起止点处的音频语句尽量为完整的语句，对用户来说，可以提高用户的体验。

实施例三

本实施例提供一种音频剪辑装置，请参见图7，包括：待调整剪辑点确定模块71，剪辑点调整模块72和剪辑模块73，其中，所述待调整剪辑点确定模块71配置为确定待剪辑音频对应的待调整剪辑点；所述剪辑点调整模块72配置为获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；所述剪辑模块73配置为通过最终剪辑点对待剪辑音频进行剪辑。

本实施例中，所述待调整剪辑点确定模块71确定待剪辑音频对应的待调整剪辑点，具体可以是接受用户对待剪辑音频的剪辑点的触发操作，确定该待调整剪辑点；或者接受用户输入的待调整剪辑点的位置信息，确定待调整剪辑点；也可以是自动识别调整后的剪辑点，若该调整后的剪辑点需要进行进一步调整，则将该剪辑点作为待调整剪辑点。另外，本实施例中的待调整剪辑点可以是待调整的剪辑起点，也可以是待调整的剪辑终点。

本实施例中，所述剪辑点调整模块72配置为获取所述待调整剪辑点所在的预设区域内的音频；或获取所述待调整剪辑点所在的完整音频语句。所述剪辑点调整模块，配置为计算调整音频对应的评估值；将评估值与预设评估阈值进行比较，根据比较结果对待调整剪辑点进行调整，得到最终剪辑点。其中，所述剪辑点调整模块，配置为根据所述调整音频的特征值计算所述评估值，所述特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。

作为一种实施方式，所述剪辑点调整模块72，配置为当当所述待调整剪辑点为所述待调整音频对应的剪辑起点时，当所述剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时，将调整音频的起点作为调整后的剪辑起点；当所述剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将调整音频的终点作为调整后的剪辑起点。所述剪辑点调整模块72，还配置为当所述待调整剪辑点为所述待调整音频对应的剪辑终点时，当所述剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时，将调整音频的终点作为调整后的剪辑终点；当所述剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将调整音频的起点作为调整后的剪辑终点。

本实施例中，所述剪辑点调整模块72，配置为根据待剪辑音频的长度，确定待调整剪辑点对应的调整次数，对待调整剪辑点根据调整次数进行调整，得到最终剪辑点；或获取对待调整剪辑点进行调整后的剪辑点对应的调整音频，对调整后的剪辑点进行调整，直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时，结束剪辑点调整，将前一次调整后的剪辑点作为最终剪辑点。

作为一种实施方式，所述剪辑点调整模块72，还配置为当已调整的调整音频的时长与待剪辑音频的时长的比值达到预设调整比例阈值，则停止对剪辑点的调整，将前一次确定的剪辑点作为最终剪辑点；已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。若待剪辑音频的待调整剪辑点连续进行了多次调整，如向同一个方向进行了多次连续调整，则可以计算已经调整的调整音频的时长与该待剪辑音频的时长的比值，该比值具体为调整比例，若该调整比例达到预设调整比例阈值，则可以停止对该待剪辑音频的待调整剪辑点的调整，将前一次确定的剪辑点作为最终剪辑点；若其调整比例未达到预设调整比例阈值，则可以继续按照正常的调整方式对其待调整剪辑点进行调整。该剪辑点可以是剪辑起点，也可以是剪辑终点，已调整的调整音频可以包括剪辑起点对应的已调整的调整音频，也可以包括剪辑终点对应的已调整的调整音频。

本实施例中，所述剪辑模块73通过最终剪辑点对待剪辑音频进行剪辑，具体包括将最终剪辑起点与最终剪辑终点间的音频剪辑出来进行存储，作为最终得到的剪辑后的音频。

本公开实施例中，所述音频剪辑装置中的待调整剪辑点确定模块71，剪辑点调整模块72和剪辑模块73，在实际应用中均可由所述装置中的中央处理器(CPU，Central Processing Unit)、数字信号处理器(DSP，Digital Signal Processor)、微控制单元(MCU，Microcontroller Unit)或可编程门阵列(FPGA，Field－Programmable Gate Array)实现。

本实施例提供的音频剪辑装置，通过确定待剪辑音频对应的待调整剪辑点；获取待调整剪辑点对应的调整音频，根据调整音频对待调整剪辑点进行调整，确定最终剪辑点；通过最终剪辑点对待剪辑音频进行剪辑，即相比于现有技术，可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整，得到最终剪辑点，根据该最终剪辑点对待剪辑音频进行剪辑，可以避免剪辑后的音频的起止位置存在不完整的语句、或存在静音时段等情况的发生，提高了音频剪辑的质量，使得最终剪辑得到的音频更加符合用户需求，提高了用户的体验。

本实施例还提供一种终端，请参见图8，具体包括：前述的音频剪辑装置。本实施例提供的终端，可以通过上述音频剪辑装置实现对待剪辑音频的剪辑点的调整，剪辑得到更为合理的剪辑后的音频，使得该剪辑后的音频更加符合用户需求，提高用户的体验。另外，本实施例中，对待剪辑音频的剪辑点的调整，剪辑得到更为合理的剪辑后的音频的方法，不需要在终端上设置硬件配件，改变终端的结构，可以适用于所有的终端，且成本低，收效好。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本公开各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

工业实用性

本公开实施例的技术方案通过最终剪辑点对待剪辑音频进行剪辑，即可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整，得到最终剪辑点，根据该最终剪辑点对待剪辑音频进行剪辑，可以避免剪辑后的音频的起止位置存在不完整的语句、或存在静音时段等情况的发生，提高了音频剪辑的质量，使得最终剪辑得到的音频更加符合用户需求，提升了用户的体验。

Claims

一种音频剪辑方法，包括：

确定待剪辑音频对应的待调整剪辑点；

获取所述待调整剪辑点对应的调整音频，根据所述调整音频对所述待调整剪辑点进行调整，确定最终剪辑点；

通过所述最终剪辑点对所述待剪辑音频进行剪辑。
如权利要求1所述的音频剪辑方法，其中，获取所述待调整剪辑点对应的调整音频，包括：

获取所述待调整剪辑点所在的预设区域内的音频；或

获取所述待调整剪辑点所在的完整音频语句。
如权利要求1所述的音频剪辑方法，其中，所述根据所述调整音频对所述待调整剪辑点进行调整，确定最终剪辑点，包括：

计算所述调整音频对应的评估值；

将所述评估值与预设评估阈值进行比较，根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点。
如权利要求3所述的音频剪辑方法，其中，所述计算所述调整音频对应的评估值包括：

根据所述调整音频的特征值计算所述评估值，所述特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。
如权利要求3所述的音频剪辑方法，其中，当所述待调整剪辑点为所述待调整音频对应的剪辑起点时，所述根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点，包括：

当所述剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时，将所述调整音频的起点作为调整后的剪辑起点；

当所述剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将所述调整音频的终点作为调整后的剪辑起点。
如权利要求3所述的音频剪辑方法，其中，当所述待调整剪辑点为所述待调整音频对应的剪辑终点时，所述根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点，包括：

当所述剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时，将所述调整音频的终点作为调整后的剪辑终点；

当所述剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将所述调整音频的起点作为调整后的剪辑终点。
如权利要求1至6任一项所述的音频剪辑方法，其中，所述根据所述调整音频对所述待调整剪辑点进行调整，确定最终剪辑点，包括：

根据所述待剪辑音频的长度，确定所述待调整剪辑点对应的调整次数，对所述待调整剪辑点根据所述调整次数进行调整，得到所述最终剪辑点；或

获取对所述待调整剪辑点进行调整后的剪辑点对应的调整音频，对所述调整后的剪辑点进行调整，直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时，结束剪辑点调整，将前一次调整后的剪辑点作为最终剪辑点。
如权利要求7所述的音频剪辑方法，其中，所述方法还包括：当已调整的调整音频的时长与所述待剪辑音频的时长的比值达到预设调整比例阈值，则停止对剪辑点的调整，将前一次确定的剪辑点作为所述最终剪辑点；所述已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。
一种音频剪辑装置，包括：

待调整剪辑点确定模块，配置为确定待剪辑音频对应的待调整剪辑点；

剪辑点调整模块，配置为获取所述待调整剪辑点对应的调整音频，根据所述调整音频对所述待调整剪辑点进行调整，确定最终剪辑点；

剪辑模块，配置为通过所述最终剪辑点对所述待剪辑音频进行剪辑。
如权利要求9所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为获取所述待调整剪辑点所在的预设区域内的音频；或获取所述待调整剪辑点所在的完整音频语句。
如权利要求9所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为计算所述调整音频对应的评估值；将所述评估值与预设评估阈值进行比较，根据比较结果对所述待调整剪辑点进行调整，得到最终剪辑点。
如权利要求11所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为根据所述调整音频的特征值计算所述评估值，所述特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。
如权利要求11所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为当所述待调整剪辑点为所述待调整音频对应的剪辑起点时，当所述剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时，将所述调整音频的起点作为调整后的剪辑起点；当所述剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将所述调整音频的终点作为调整后的剪辑起点。
如权利要求11所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为当所述待调整剪辑点为所述待调整音频对应的剪辑终点时，当所述剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时，将所述调整音频的终点作为调整后的剪辑终点；当所述剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时，将所述调整音频的起点作为调整后的剪辑终点。
如权利要求9至14任一项所述的音频剪辑装置，其中，所述剪辑点调整模块，配置为根据所述待剪辑音频的长度，确定所述待调整剪辑点对应的调整次数，对所述待调整剪辑点根据所述调整次数进行调整，得到所述最终剪辑点；或获取对所述待调整剪辑点进行调整后的剪辑点对应的调整音频，对所述调整后的剪辑点进行调整，直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时，结束剪辑点调整，将前一次调整后的剪辑点作为最终剪辑点。
如权利要求15所述的音频剪辑装置，其中，所述剪辑点调整模块，还配置为当已调整的调整音频的时长与所述待剪辑音频的时长的比值达到预设调整比例阈值，则停止对剪辑点的调整，将前一次确定的剪辑点作为所述最终剪辑点；所述已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。
一种终端，包括：如权利要求9至16任一项所述的音频剪辑装置。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至8任一项所述的音频剪辑方法。