CN107799132A - 一种音频剪辑方法和装置,及终端 - Google Patents

一种音频剪辑方法和装置,及终端 Download PDF

Info

Publication number
CN107799132A
CN107799132A CN201610804873.7A CN201610804873A CN107799132A CN 107799132 A CN107799132 A CN 107799132A CN 201610804873 A CN201610804873 A CN 201610804873A CN 107799132 A CN107799132 A CN 107799132A
Authority
CN
China
Prior art keywords
audio
adjusted
adjustment
clip point
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610804873.7A
Other languages
English (en)
Inventor
张海婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610804873.7A priority Critical patent/CN107799132A/zh
Priority to PCT/CN2017/080702 priority patent/WO2018040576A1/zh
Publication of CN107799132A publication Critical patent/CN107799132A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

本发明实施例提供一种音频剪辑方法和装置,及终端,通过确定待剪辑音频对应的待调整剪辑点;获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;通过最终剪辑点对待剪辑音频进行剪辑,即可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整,得到最终剪辑点,根据该最终剪辑点对待剪辑音频进行剪辑,可以提高音频剪辑的质量,使得最终剪辑得到的音频更加符合用户需求,进一步的,提高了用户的体验。

Description

一种音频剪辑方法和装置,及终端
技术领域
本发明涉及音频剪辑领域,尤其涉及一种音频剪辑方法和装置,及终端。
背景技术
当前在进行音频剪辑时,是由用户直接在终端进行剪辑点的选择,然后根据该剪辑点进行音频剪辑,通过当前这种剪辑方式得到的剪辑后的音频并不是很理想,如剪辑后的音频的起止位置经常会存在不完整的语句,存在静音时段等情况,这种方式得到的音频往往不是用户理想的音频。
发明内容
本发明实施例提供的一种音频剪辑方法和装置,及终端,主要解决的技术问题是现有技术中对待剪辑音频进行剪辑的方式,得到的剪辑音频不符合用户需求的问题。
为解决上述技术问题,本发明实施例提供一种音频剪辑方法,包括:
确定待剪辑音频对应的待调整剪辑点;
获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;
通过最终剪辑点对待剪辑音频进行剪辑。
本发明实施例还提供一种音频剪辑装置,包括:
待调整剪辑点确定模块,用于确定待剪辑音频对应的待调整剪辑点;
剪辑点调整模块,用于获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;
剪辑模块,用于通过最终剪辑点对待剪辑音频进行剪辑。
本发明实施例还提供一种终端,包括:前述的音频剪辑装置。
本发明实施例还提供一种计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于执行前述任一项的音频剪辑方法。
本发明的有益效果是:
根据本发明实施例提供的音频剪辑方法和装置,及终端,以及计算机存储介质,通过确定待剪辑音频对应的待调整剪辑点;获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;通过最终剪辑点对待剪辑音频进行剪辑,即可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整,得到最终剪辑点,根据该最终剪辑点对待剪辑音频进行剪辑,可以提高音频剪辑的质量,使得最终剪辑得到的音频更加符合用户需求,进一步的,提高了用户的体验。
附图说明
图1为本发明实施例一的音频剪辑方法流程图;
图2为本发明实施例一的音频剪辑点示意图;
图3为本发明实施例一的另一音频剪辑点示意图;
图4为本发明实施例二的对剪辑点进行一次调整的音频剪辑方法流程图;
图5为本发明实施例二的对剪辑点进行多次调整的音频剪辑方法流程图;
图6为本发明实施例二的另一种对剪辑点进行多次调整的音频剪辑方法流程图;
图7为本发明实施例三的音频剪辑装置示意图;
图8为本发明实施例三提供的终端示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明实施例作进一步详细说明。
实施例一:
本实施例提供一种音频剪辑方法,请参见图1,具体包括:
步骤S101,确定待剪辑音频对应的待调整剪辑点;
步骤S102,获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;
步骤S103,通过最终剪辑点对待剪辑音频进行剪辑。
具体的,本实施例中的待剪辑音频对应的待调整剪辑点,具体可以是用户确定的待剪辑音频对应的初始剪辑点,也可以是对初始剪辑点进行调整后得到的调整后的剪辑点。对于步骤S101,确定待剪辑音频对应的待调整剪辑点,包括:接受用户对待剪辑音频的剪辑点的触发操作,确定该待调整剪辑点;或者接受用户输入的待调整剪辑点的位置信息,确定待调整剪辑点;也可以是自动识别调整后的剪辑点,若该调整后的剪辑点需要进行进一步调整,则将该剪辑点作为待调整剪辑点。另外,本实施例中的待调整剪辑点可以是待调整的剪辑起点,也可以是待调整的剪辑终点。
进一步的,本实施例中,待调整剪辑点对应的调整音频,包括:待调整剪辑点所在的预设区域内的音频;或待调整剪辑点所在的完整音频语句。具体的,为了使最终剪辑得到的音频更加符合用户的需求,可以对待调整剪辑点附近的音频进行分析,判断是否需要对该待调整剪辑点进行调整。该待调整剪辑点附近的音频具体可以是该待调整剪辑点所在的预设区域内的音频,请参见图2,若该待剪辑音频为A-B,其中S0为其中一个待调整剪辑点,该待调整剪辑点所在的预设区域可以是该待调整剪辑点所在的C-D区域,其中,C-S0小于A-S0,S0-D小于S0-B;另外C-S0和S0-D可以相同,也可以不同,其可以根据需要具体设置。另外,本实施例中的待剪辑音频对应的调整音频也可以是该待调整剪辑点所在的完整音频语句;如可以在确定待调整剪辑点后,对该待剪辑音频进行语音分析,进行语句层面的切分,确定该待调整剪辑点对应的完整音频语句,将该完整音频语句作为该待调整剪辑点对应的调整音频。如图2所示,若待调整剪辑点为S0,则经过语音分析后,其对应的完整音频语句可以是C1-D1。本实施例中,在进行完整音频语句切分时,由于语句的边界端点处常存在某些特征的明显变化,所以具体可以是通过检测音频的特征变化和结合静音时延来对语句进行划界,确定语句的边界端点;该音频特征具体可以是指音频能量等特征信息。
本实施例中,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点,包括:计算调整音频对应的评估值;将评估值与预设评估阈值进行比较,根据比较结果对待调整剪辑点进行调整,得到最终剪辑点。具体的,本实施例中根据待调整剪辑点对应的调整音频对该待调整剪辑点进行调整,具体可以是根据该调整音频对应的评估值与预设评估阈值的大小关系确定对该待调整剪辑点的调整方式。
本实施例中的计算调整音频对应的评估值包括:根据调整音频的特征值计算评估值,特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。具体的,可以根据该调整音频的切分比、音频信噪比、静音时延比、音强比等特征值中的至少一个计算该评估值。该切分比指待调整剪辑点所在调整音频以该待调整剪辑点为分割点,包含在裁剪音频中的部分占整个调整音频的比例,如图3所示,其中剪辑音频为A-B,该S0为待调整剪辑点,其所在的调整音频为s-e,其中s-S0间的时长为a,S0-e间的时长为b,则该切分比R1=b/(a+b),该切分比R1越大,该部分音频越应该被保存,即当待调整剪辑点是剪辑起点时,则可以将该部分音频的起点作为调整后的剪辑起点,当待调整剪辑点是剪辑终点时,则可以将该部分音频的终点作为调整后的剪辑终点;另外,其中一个极端情况是该待调整剪辑点正好处于两个调整音频中间,则该待调整剪辑点是剪辑起点时,其对应的调整语句可以是前一个调整音频语句,该待调整剪辑点是剪辑终点时,其对应的调整音频可以是后一个调整音频,因此0≤R1<1。音频信噪比为是音频正常声音信号强度与噪声信号强度的比值,当信噪比高时,噪音比较小,此段音频更有可能被保留。本实施例中信噪比为了与其他因素相统一,可以取有用信号功率与全部音频功率的比值,该音频信噪比R2=P有用/P总1,其中P有用为有用信号功率,P总1为全部音频功率,0<R2<1。静音时延比具体是指当前调整音频两端静音时间长度的比例,如图3所示,如果L1比L2长很多,那么当前调整音频更有可能与裁剪音频是一个整体,更有可能被保留。同样为与其他因素相统一,R3=((L1+L2)/(L1+L2)+1)/2,0<R3<1。音强比具体为此调整音频与待剪辑音频整个部分的音强对比,两部分音频的音强越相近,此调整音频越有可能被保留。音强比计算公式为R4=1-(P-P总2)/P,其中P总2为当前待剪辑音频的音强,P为调整音频的音强,0<R4<1。本实施例中的调整音频可以是前述的待调整剪辑点对应的预设区域内的音频,也可以是待调整剪辑点所在的完整音频语句。
本实施例中根据上述调整音频的特征值计算评估值可以是根据上述特征值进行计算得到,该评估值R=K1R1+K2R2+K3R3+K4R4+……+KnRn,该Kn为各特征值对应的因素参数,其中Kn≥0,n为大于零的正整数,Kn可以相同,也可以不相同,可以通过调整Kn的大小来设定每个特征值所占的重要程度。本实施例中,在计算评估值时,可以从多个特征值中选择任意几项进行计算,可以将未选择的特征值对应的因素参数设置为0。该各项特征值取值越大评估值越大,此时该调整音频越可能被保留下来。需要理解的是,该调整音频的特征值除上述四种以外,也可以是其他类型的特征值,其可以根据需要具体设置,本实施例对此不作限定。在需要进行多次待调整剪辑点调整时,可以设置不同的评估值计算方式和不同的评估值阈值,决定对待调整剪辑点的调整方式。
进一步的,本实施例中当待调整剪辑点为待调整音频对应的剪辑起点时,根据剪辑起点对应的调整音频对剪辑起点进行调整,得到调整后的剪辑起点,包括:当剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时,将调整音频的起点作为调整后的剪辑起点;当剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将调整音频的终点作为调整后的剪辑起点。当待调整剪辑点为待调整音频对应的剪辑终点时,根据剪辑终点对应的调整音频对剪辑终点进行调整,得到调整后的剪辑终点,包括:当剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时,将调整音频的终点作为调整后的剪辑终点;当剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将调整音频的起点作为调整后的剪辑终点。具体的,当该待调整剪辑点为剪辑起点S0,则其具体可以是,当R>λ时,保留此调整音频,请参见图3,具体可以是将S0调整到s处,将s作为剪辑起点;当R≤λ时,舍弃该调整音频,具体可以是将S0调整到e处,将e作为剪辑起点,λ为该剪辑起点对应的预设评估值阈值;若该待调整剪辑点为剪辑终点E0,当R>λ时,保留此调整音频,则具体可以是将E0调整到m处,将m作为剪辑终点;当R≤λ时,舍弃该调整音频,具体可以是将E0调整到f处,将f作为剪辑终点,λ为该剪辑终点对应的预设评估值阈值。本实施例中的剪辑起点与剪辑终点对应的预设评估阈值可以是相同的,也可以是不相同的;即各待调整剪辑点的预设评估阈值可以根据需要设置具体设置,可以将其设置为相同值,也可以设置为不同值。
本实施例中,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点,包括:根据待剪辑音频的长度,确定待调整剪辑点对应的调整次数,对待调整剪辑点根据调整次数进行调整,得到最终剪辑点;或获取对待调整剪辑点进行调整后的剪辑点对应的调整音频,对调整后的剪辑点进行调整,直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时,结束剪辑点调整,将前一次调整后的剪辑点作为最终剪辑点。具体的,将该待调整剪辑点进行调整得到最终剪辑点可以是对该待调整剪辑点进行N次调整,将经过N次调整后的剪辑点作为最终剪辑点,其中N为预设的调整次数。具体的,该预设调整次数可以是根据该待剪辑的音频的大小进行设置,对于时长短的待剪辑音频由于其剪辑点的定位相对比较准确,则该调整次数的取值可以相对较小,如可以是一次,或者两次;当该待剪辑音频的时长较长时,对剪辑点的定位相对不是很准确,可以相应的多进行几次调整,以使剪辑后得到的音频能更符合用户需求。另外,也可以根据待调整剪辑点的调整方向的判断来确定对该待调整剪辑点的调整,再对剪辑点进行调整时,若其当前得出的进行调整的方向与前次进行调整的方向一致,则对该剪辑点进行调整,若不一致,则结束本次调整,将前一次调整的剪辑点作为最终剪辑点。该调整方向是否一致,具体可以是指保留调整音频还是舍弃调整音频。本实施例中的待调整剪辑点具体可以是指最初确定的初始剪辑点。
进一步的,本实施例提供的音频剪辑方法,还包括:当已调整的调整音频的时长与待剪辑音频的时长的比值达到预设调整比例阈值,则停止对剪辑点的调整,将前一次确定的剪辑点作为最终剪辑点;已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。具体的,若待剪辑音频的待调整剪辑点连续进行了多次调整,如向同一个方向进行了多次连续调整,则可以计算已经调整的调整音频的时长与该待剪辑音频的时长的比值,该比值具体为调整比例,若该调整比例达到预设调整比例阈值,则可以停止对该待剪辑音频的待调整剪辑点的调整,将前一次确定的剪辑点作为最终剪辑点;若其调整比例未达到预设调整比例阈值,则可以继续按照正常的调整方式对其待调整剪辑点进行调整。该剪辑点可以是剪辑起点,也可以是剪辑终点,已调整的调整音频可以包括剪辑起点对应的已调整的调整音频,也可以包括剪辑终点对应的已调整的调整音频。本实施中的调整比例的计算公式为:Q=θ(T1+…+Tp)/T),其中T为待调整音频的总时长,Tp为SnEn相比于Sn-1En-1调整的音频时长,p为大于零的任意正整数,θ为与音频总时长有关的参数。如果音频持续保留或者舍弃,则需要通过判断调整比例Q是否已经达到其对应的调整比例阈值Q阈值,如果未达到则继续调整,如果达到,则停止对剪辑点的调整。
现有技术中通常是由用户经过预览后,在触摸屏上拖动剪裁位置确定剪辑点,然后直接根据该确定的剪辑点进行音频剪辑的方式,这种裁剪方式一般不能使得剪辑点所在的调整音频并不满足用户需求,如其所在的语句不是一句完整的语句,尤其是待剪辑音频时长较大时,这种误差更为明显。本实施例提供的音频剪辑方法,通过确定待剪辑音频对应的待调整剪辑点;获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;通过最终剪辑点对待剪辑音频进行剪辑,即相比于现有技术,可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整,得到最终剪辑点,根据该最终剪辑点对待剪辑音频进行剪辑,可以提高音频剪辑的质量,使得最终剪辑得到的音频更加符合用户需求,进一步的,提高了用户的体验。另外,本实施例提供的音频剪辑方法通过语音技术对待剪辑音频进行切分,进而根据切分得到的调整音频对剪辑点进行调整,即对剪辑点所在的语句进行切分分析,判断是要保留该部分语句还是舍弃该部分语句,通过这种方式使得剪辑得到的音频更加符合用户需求。
实施例二:
本实施例提供一种音频剪辑方法,在确定剪辑点后,主要通过对剪辑点所在的音频语句进行分析,判断是否需要对该剪辑点进行调整,确定最终剪辑点,根据该最终剪辑点对待剪辑音频进行剪辑,得到需要的音频。
本实施例中,提供一种对初始剪辑点进行一次调整得到最终剪辑点的方法,具体可如图4所示,包括:
步骤S401,确定初始剪辑点。
具体的,本实施例中确定初始剪辑点可以是根据用户对剪辑界面上剪辑点的拖动操作确定最初的剪辑点,请参见图3,该初始剪辑点包括初始剪辑起点S0和初始剪辑终点E0
步骤S402,对初始剪辑点对应的完整音频语句进行切分。
具体的,通过语音技术对待剪辑音频进行语音分析与切分,其具体是进行语句层面的切分,确定该初始剪辑点所在的完整音频语句,如图3所示,初始剪辑起点对应的完整音频语句可以为s-e,初始剪辑终点对应的完整音频语句可以为f-m。
步骤S403,判断评估值是否大于预设评估阈值,大于则跳转到步骤S404;否则跳转到步骤S405。
具体的,得到初始剪辑点所在的完整音频语句后,进行音频信息评估,判断是否保留该完整音频语句,具体是计算该初始剪辑点的评估值,将其评估值与其对应的预设评估阈值进行比较,确定是否将该完整音频语句保留到剪辑后的音频中。若其评估值大于预设评估阈值,则跳转到步骤S404;若其评估值小于等于预设评估阈值,则跳转到步骤S405。
步骤S404,保留该完整音频语句,跳转到步骤S406。
具体的,请参见图3,保留该完整音频语句具体包括:若保留初始剪辑起点对应的完整音频语句,则将S0调整至s处;若保留初始剪辑终点对应的完整音频语句,则将E0调整至m处。
步骤S405,舍弃该完整音频语句,跳转到步骤S406。
具体的,请参见图3,舍弃该完整音频语句具体包括:若舍弃初始剪辑起点对应的完整音频语句,则将S0调整至e处;若保留初始剪辑起点对应的完整音频语句,则将E0调整至f处。
步骤S406,根据最终剪辑点进行音频剪辑。
具体的,在确定最终剪辑点后,根据该最终剪辑点对待剪辑音频进行剪辑,本实施例中的剪辑点都包括剪辑起点和剪辑终点,即将最终剪辑起点与最终剪辑终点间的音频进行剪辑得到最终的剪辑后的音频。通过上述方式,得到的剪辑后的音频相对来说其音频语句的完整性较高,更符合用户的需求。
本实施例还提供一种对初始剪辑点进行多次调整进行音频剪辑的方法,请参见图5,具体包括:
步骤S501,确定剪辑点;
步骤S502,对剪辑点对应的完整音频语句进行切分;
步骤S503,判断评估值是否大于预设评估阈值;大于则跳转到步骤S504;否则跳转到步骤S505;
步骤S504,保留该完整音频语句,跳转到步骤S502;
步骤S505,舍弃该完整音频语句,跳转到步骤S506;
步骤S506,根据最终剪辑点进行音频剪辑。
具体的,本实施例中,若需要对初始剪辑点进行多次调整得到最终剪辑点,可以是在得到第一次调整后的剪辑点后获取该调整后的剪辑点对应的完整音频语句,判断是否需要对该调整后的剪辑点进行进一步调整,本实施例中的调整后的剪辑点包括至少一次调整后的剪辑点,其可以是重复进行该步骤S502至S504,直至判断需不需要对调整后的剪辑点进行调整时,确定最近一次调整的剪辑点作为调整后的剪辑点。本实施例中具体可以是在当存在舍弃待调整剪辑点对应的完整音频语句时,确定结束待调整剪辑点的调整。在确定最终剪辑点后,根据该最终剪辑点对待剪辑音频进行剪辑。本实施例中的剪辑点都包括剪辑起点和剪辑终点,其他部分的处理方式与只进行一次调整的方式都相同。通过上述方式,得到的剪辑后的音频相对来说其音频语句的完整性较高,更符合用户的需求。
另外,本实施例中,在进行每次剪辑点调整时,待调整剪辑点对应的评估值的计算方式可以是不相同的,即各剪辑点对应的用于进行预设评估阈值设置和其对应的评估值的计算的特征值可以选择不同值进行设置。如第一次调整时评估值的计算公式可以为前述的R=K1R1+K2R2+K3R3+K4R4;第一次调整后,后续的待调整的剪辑点在最初确定的剪辑音频S0E0之外时,可以将切分比设置为零,则第二次调整时评估值的计算公式可以为R=K(K2R2+K3R3+K4R4),其中K为第二次调整时加入的调整参数,0<K<1。具体的,本实施例中第一次调整时评估值可以由前述的切分比、音频信噪比、静音时延比、音强比进行确定,其具体计算公式可以为R=(R1+R2+R3+R4)/4,即将K1,K2,K3,K4都设置为相同值1/4。设置当R≤0.5时,舍弃该完整音频语句,当R>0.5时,保留该完整音频语句。在进行第二次调整时,评估值由音频信噪比、静音时延比和音强比进行确定,其具体计算公式可以是R=0.9(R2+R3+R4)/3),1/3为相同的因素参数,其中0.9为第二次调整时加入的调整参数。后续调整可以继续选择该第二次的评估值计算公式,也可以另外设置,直至R≤0.5时,舍弃该完整音频语句,结束调整。
另外,上述对初始剪辑点进行多次调整时,若每次调整的方向一致,如持续保留音频语句或持续舍弃音频语句,则可以进一步的通过已调整的音频的时长与待调整的音频的时长确定是否需要结束调整。调整比例计算公式为前述的:Q=θ(T1+…+Tp)/T),根据该调整比例对待调整剪辑点进行调整,进行音频剪辑的过程,具体如图6所示,包括:
步骤S601,确定剪辑点;
步骤S602,对剪辑点对应的完整音频语句进行切分;
步骤S603,判断是该完整音频语句的评估值是否大于预设评估阈值,大于跳转到步骤S604;否则跳转到步骤S605;
步骤S604,保留该完整音频语句,跳转到步骤S606;
步骤S605,舍弃该完整音频语句,跳转到步骤S606;
步骤S606,保留或舍弃与上一次是否相同,若相同,跳转到步骤S607;若不相同,则跳转到步骤S608;
步骤S607,调整比例是否为Q>Q阈值,若是,跳转到步骤S608;若否,则跳转到步骤S602;
步骤S608,根据最终剪辑点进行音频剪辑。
即本实施例中,相比于前述对剪辑点进行多次调整的方式,增加了对剪辑点调整方向的判断和对调整比例的判断,来确定是否需要结束剪辑点调整。如第一次调整的方向和第二次调整的方向一致,调整的时长分别为T1和T2,设置θ=0.05,计算调整比例得到Q=0.05(T1+T2)/T,若Q小于Q阈值,则进行第三次剪辑点调整,直至Q大于Q阈值,结束调整。该Q阈值具体可以是1。
本实施例提供的对待剪辑音频的剪辑方式,可以只对该待剪辑音频进行一次剪辑,也可以进行多次剪辑,使得得到的剪辑后的音频的起止点处的音频语句尽量为完整的语句,对用户来说,可以提高用户的体验。
实施例三:
本实施例提供一种音频剪辑装置,请参见图7,包括:待调整剪辑点确定模块71,剪辑点调整模块72和剪辑模块73,其中,待调整剪辑点确定模块71用于确定待剪辑音频对应的待调整剪辑点;剪辑点调整模块72用于获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;剪辑模块73用于通过最终剪辑点对待剪辑音频进行剪辑。
具体的,本实施例中的待调整剪辑点确定模块71确定待剪辑音频对应的待调整剪辑点,具体可以是接受用户对待剪辑音频的剪辑点的触发操作,确定该待调整剪辑点;或者接受用户输入的待调整剪辑点的位置信息,确定待调整剪辑点;也可以是自动识别调整后的剪辑点,若该调整后的剪辑点需要进行进一步调整,则将该剪辑点作为待调整剪辑点。另外,本实施例中的待调整剪辑点可以是待调整的剪辑起点,也可以是待调整的剪辑终点。
本实施例中,剪辑点调整模块72获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点,包括:将待调整剪辑点所在的预设区域内的音频作为待调整剪辑点对应的调整音频;或将待调整剪辑点所在的完整音频语句作为待调整剪辑点对应的调整音频。进一步的,剪辑点调整模块72根据调整音频对待调整剪辑点进行调整,确定最终剪辑点,包括:计算调整音频对应的评估值;将评估值与预设评估阈值进行比较,根据比较结果对待调整剪辑点进行调整,得到最终剪辑点。其中,计算调整音频对应的评估值包括:根据调整音频的特征值计算评估值,特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。
进一步的,本实施例中当待调整剪辑点为待调整音频对应的剪辑起点时,根据剪辑起点对应的调整音频对剪辑起点进行调整,得到调整后的剪辑起点,包括:当剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时,将调整音频的起点作为调整后的剪辑起点;当剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将调整音频的终点作为调整后的剪辑起点。当待调整剪辑点为待调整音频对应的剪辑终点时,根据剪辑终点对应的调整音频对剪辑终点进行调整,得到调整后的剪辑终点,包括:当剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时,将调整音频的终点作为调整后的剪辑终点;当剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将调整音频的起点作为调整后的剪辑终点。
本实施例中,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点,包括:根据待剪辑音频的长度,确定待调整剪辑点对应的调整次数,对待调整剪辑点根据调整次数进行调整,得到最终剪辑点;或获取对待调整剪辑点进行调整后的剪辑点对应的调整音频,对调整后的剪辑点进行调整,直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时,结束剪辑点调整,将前一次调整后的剪辑点作为最终剪辑点。
进一步的,本实施例提供的音频剪辑方法,还包括:当已调整的调整音频的时长与待剪辑音频的时长的比值达到预设调整比例阈值,则停止对剪辑点的调整,将前一次确定的剪辑点作为最终剪辑点;已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。具体的,若待剪辑音频的待调整剪辑点连续进行了多次调整,如向同一个方向进行了多次连续调整,则可以计算已经调整的调整音频的时长与该待剪辑音频的时长的比值,该比值具体为调整比例,若该调整比例达到预设调整比例阈值,则可以停止对该待剪辑音频的待调整剪辑点的调整,将前一次确定的剪辑点作为最终剪辑点;若其调整比例未达到预设调整比例阈值,则可以继续按照正常的调整方式对其待调整剪辑点进行调整。该剪辑点可以是剪辑起点,也可以是剪辑终点,已调整的调整音频可以包括剪辑起点对应的已调整的调整音频,也可以包括剪辑终点对应的已调整的调整音频。
剪辑模块73通过最终剪辑点对待剪辑音频进行剪辑,具体包括将最终剪辑起点与最终剪辑终点间的音频剪辑出来进行存储,作为最终得到的剪辑后的音频。
本实施例提供的音频剪辑装置,通过确定待剪辑音频对应的待调整剪辑点;获取待调整剪辑点对应的调整音频,根据调整音频对待调整剪辑点进行调整,确定最终剪辑点;通过最终剪辑点对待剪辑音频进行剪辑,即相比于现有技术,可以根据该待剪辑音频的待调整剪辑点对应的调整音频对该待调整剪辑点进行调整,得到最终剪辑点,根据该最终剪辑点对待剪辑音频进行剪辑,可以提高音频剪辑的质量,使得最终剪辑得到的音频更加符合用户需求,进一步的,提高了用户的体验。
本实施例还提供一种终端,请参见图8,具体包括:前述的音频剪辑装置。本实施例提供的终端,可以通过上述音频剪辑装置实现对待剪辑音频的剪辑点的调整,剪辑得到更为合理的剪辑后的音频,使得该剪辑后的音频更加符合用户需求,提高用户的体验。另外,本实施例中,对待剪辑音频的剪辑点的调整,剪辑得到更为合理的剪辑后的音频的方法,不需要在终端上设置硬件配件,改变终端的结构,可以适用于所有的终端,且成本低,收效好。
显然,本领域的技术人员应该明白,上述本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种音频剪辑方法,包括:
确定待剪辑音频对应的待调整剪辑点;
获取所述待调整剪辑点对应的调整音频,根据所述调整音频对所述待调整剪辑点进行调整,确定最终剪辑点;
通过所述最终剪辑点对所述待剪辑音频进行剪辑。
2.如权利要求1所述的音频剪辑方法,其特征在于,所述待调整剪辑点对应的调整音频,包括:
所述待调整剪辑点所在的预设区域内的音频;或
所述待调整剪辑点所在的完整音频语句。
3.如权利要求1所述的音频剪辑方法,其特征在于,根据所述调整音频对所述待调整剪辑点进行调整,确定最终剪辑点,包括:
计算所述调整音频对应的评估值;
将所述评估值与预设评估阈值进行比较,根据比较结果对所述待调整剪辑点进行调整,得到最终剪辑点。
4.如权利要求3所述的音频剪辑方法,其特征在于,计算所述调整音频对应的评估值包括:
根据所述调整音频的特征值计算所述评估值,所述特征值包括切分比、音频信噪比、静音时延比、音强比中的至少一个。
5.如权利要求3所述的音频剪辑方法,其特征在于,当所述待调整剪辑点为所述待调整音频对应的剪辑起点时,根据所述剪辑起点对应的调整音频对所述剪辑起点进行调整,得到调整后的剪辑起点,包括:
当所述剪辑起点对应的调整音频的评估值大于其对应的预设评估阈值时,将所述调整音频的起点作为调整后的剪辑起点;
当所述剪辑起点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将所述调整音频的终点作为调整后的剪辑起点。
6.如权利要求3所述的音频剪辑方法,其特征在于,当所述待调整剪辑点为所述待调整音频对应的剪辑终点时,根据所述剪辑终点对应的调整音频对所述剪辑终点进行调整,得到调整后的剪辑终点,包括:
当所述剪辑终点对应的调整音频的评估值大于其对应的预设评估阈值时,将所述调整音频的终点作为调整后的剪辑终点;
当所述剪辑终点对应的调整音频的评估值小于等于其对应的预设评估阈值时,将所述调整音频的起点作为调整后的剪辑终点。
7.如权利要求1-6任一项所述的音频剪辑方法,其特征在于,根据所述调整音频对所述待调整剪辑点进行调整,确定最终剪辑点,包括:
根据所述待剪辑音频的长度,确定所述待调整剪辑点对应的调整次数,对所述待调整剪辑点根据所述调整次数进行调整,得到所述最终剪辑点;或
获取对所述待调整剪辑点进行调整后的剪辑点对应的调整音频,对所述调整后的剪辑点进行调整,直至前一次调整后的剪辑点与本次待调整的剪辑点的调整方向不一致时,结束剪辑点调整,将前一次调整后的剪辑点作为最终剪辑点。
8.如权利要求7所述的音频剪辑方法,其特征在于,还包括:当已调整的调整音频的时长与所述待剪辑音频的时长的比值达到预设调整比例阈值,则停止对剪辑点的调整,将前一次确定的剪辑点作为所述最终剪辑点;所述已调整的调整音频包括剪辑起点对应的已调整的调整音频和/或剪辑终点对应的已调整的调整音频。
9.一种音频剪辑装置,包括:
待调整剪辑点确定模块,用于确定待剪辑音频对应的待调整剪辑点;
剪辑点调整模块,用于获取所述待调整剪辑点对应的调整音频,根据所述调整音频对所述待调整剪辑点进行调整,确定最终剪辑点;
剪辑模块,用于通过所述最终剪辑点对所述待剪辑音频进行剪辑。
10.一种终端,其特征在于,包括:如权利要求9所述的音频剪辑装置。
CN201610804873.7A 2016-09-05 2016-09-05 一种音频剪辑方法和装置,及终端 Pending CN107799132A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610804873.7A CN107799132A (zh) 2016-09-05 2016-09-05 一种音频剪辑方法和装置,及终端
PCT/CN2017/080702 WO2018040576A1 (zh) 2016-09-05 2017-04-17 一种音频剪辑方法、装置、终端及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610804873.7A CN107799132A (zh) 2016-09-05 2016-09-05 一种音频剪辑方法和装置,及终端

Publications (1)

Publication Number Publication Date
CN107799132A true CN107799132A (zh) 2018-03-13

Family

ID=61299941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610804873.7A Pending CN107799132A (zh) 2016-09-05 2016-09-05 一种音频剪辑方法和装置,及终端

Country Status (2)

Country Link
CN (1) CN107799132A (zh)
WO (1) WO2018040576A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2356732B (en) * 1999-11-26 2003-12-10 Sony Uk Ltd Editing of recorded material
US9852761B2 (en) * 2009-03-16 2017-12-26 Apple Inc. Device, method, and graphical user interface for editing an audio or video attachment in an electronic message
US9111579B2 (en) * 2011-11-14 2015-08-18 Apple Inc. Media editing with multi-camera media clips
CN104361897B (zh) * 2014-11-21 2017-09-29 杭州网易云音乐科技有限公司 一种制作铃音的方法及装置
CN105323371B (zh) * 2015-02-13 2018-11-30 维沃移动通信有限公司 音频的剪辑方法及移动终端

Also Published As

Publication number Publication date
WO2018040576A1 (zh) 2018-03-08

Similar Documents

Publication Publication Date Title
US9608588B2 (en) Dynamic range control with large look-ahead
US6360199B1 (en) Speech coding rate selector and speech coding apparatus
EP2168122B1 (en) Audio processing using auditory scene analysis and spectral skewness
EP2448204A1 (en) Method and device for clipping control
CN107977185A (zh) 音频输出控制方法和装置
SE519981C2 (sv) Kodning och avkodning av signaler från flera kanaler
EP2850612A1 (en) System for maintaining reversible dynamic range control information associated with parametric audio coders
CN107340945A (zh) 一种声音调整方法及装置、计算机装置和可读存储介质
US10642571B2 (en) Automatic audio ducking with real time feedback based on fast integration of signal levels
CN111627463A (zh) 语音vad尾点确定方法及装置、电子设备和计算机可读介质
US11074922B2 (en) Hybrid encoding method and apparatus for encoding speech or non-speech frames using different coding algorithms
CN109887521B (zh) 用于音频的动态母带处理方法及装置
CN107799132A (zh) 一种音频剪辑方法和装置,及终端
KR20190048248A (ko) 신호 분석 및 딥 러닝 기반의 오디오 음량 제어 방법 및 시스템
US8243955B2 (en) System for attenuating noise in an input signal
CN104700830A (zh) 一种语音端点检测方法及装置
CN113643686A (zh) 语音播报方法、装置、系统、设备和计算机可读介质
US9330674B2 (en) System and method for improving sound quality of voice signal in voice communication
CN114157254A (zh) 音频处理方法和音频处理装置
CN115394300B (zh) 语音交互方法、语音交互装置、车辆和可读存储介质
CN108630211A (zh) 使用全通滤波器的动态音频增强
EP4277114A1 (en) Method and control device for controlling asynchronous induction motor
WO2021177883A1 (en) Audio signal processing for adaptively adjusting a gain
KR100563016B1 (ko) 가변비트레이트음성전송시스템
JP3607775B2 (ja) 音声状態判別装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180313