CN111554329A - 音频剪辑方法、服务器及存储介质 - Google Patents
音频剪辑方法、服务器及存储介质 Download PDFInfo
- Publication number
- CN111554329A CN111554329A CN202010269401.2A CN202010269401A CN111554329A CN 111554329 A CN111554329 A CN 111554329A CN 202010269401 A CN202010269401 A CN 202010269401A CN 111554329 A CN111554329 A CN 111554329A
- Authority
- CN
- China
- Prior art keywords
- audio
- materials
- clipped
- file
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000000463 material Substances 0.000 claims abstract description 257
- 238000012545 processing Methods 0.000 claims description 21
- 230000001755 vocal effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 1
- 241000207840 Jasminum Species 0.000 description 8
- 235000010254 Jasminum officinale Nutrition 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
本发明实施例涉及音频技术领域,公开了一种音频剪辑方法、服务器及存储介质。本发明中在待剪辑音频文件中确定待剪辑音频片段;在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材;利用匹配的音频素材对待剪辑音频片段进行剪辑处理。音频素材预先存储至素材数据库,在需要对音频文件进行剪辑时直接调用音频素材对待剪辑音频片段进行剪辑,从而降低了剪辑的难度,有利于普及应用在日常生活中。
Description
技术领域
本发明实施例涉及音频技术领域,特别涉及一种音频剪辑方法、服务器及存储介质。
背景技术
随着移动终端技术的飞速发展,移动终端所能提供的功能变得越来越丰富,用户可以利用终端中的应用程序实现音频文件的获取及播放,比如用户通过录音功能获取音频文件,或者通过本地下载的方式等获取音频文件,所获取的音频文件可能由于环境因素或个人因素导致某个音频片段不符合用户的喜好,这时就需要对音频文件进行剪辑。通常可以通过调整音频文件的某段音轨片段的播放速度,音调频率或音色等,使音频文件所播放出的声音满足用户的喜好,从而实现对音频文件的修正。
发明人发现相关技术中至少存在如下问题:在对音频文件的音轨片段进行音色或音调的调整过程中,需要用户具有一定的音乐基础,否则很难按照用户的喜好对所播放的声音进行修正,音频文件的剪辑难度较大,难以进行普及。
发明内容
本发明实施方式的目的在于提供一种音频剪辑方法、服务器及存储介质,通过预先存储的音频素材直接对待剪辑片段进行替换,降低了剪辑的难度。
为解决上述技术问题,本发明的实施方式提供了一种音频剪辑方法,包括:在待剪辑音频文件中确定待剪辑音频片段;在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材;利用匹配的音频素材对待剪辑音频片段进行剪辑处理。
本发明的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行音频剪辑方法。
本发明的实施方式还提供了一种存储介质,存储有计算机程序,计算机程序被处理器执行时上述的音频剪辑方法。
本发明实施方式相对于现有技术而言,在确定待剪辑音频片段之后,在预存的多个音频素材中选取与待剪辑音频片段匹配的音频素材,并利用匹配的音频素材实现对待剪辑音频文件中的待剪辑片段的剪辑,从而实现了音频文件的剪辑。音频素材预先存储至素材数据库,在需要对音频文件进行剪辑时直接调用音频素材对待剪辑音频片段进行剪辑,从而降低了剪辑的难度,有利于普及应用在日常生活中。
另外,在待剪辑音频文件中确定待剪辑音频片段,包括:获取待剪辑音频文件中的人声音轨,并根据待剪辑音频文件获取人声音轨对应的文字;获取用户在文字中选取的关键字;从人声音轨中选取关键字对应的人声音轨片段作为待剪辑音频片段;在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材,包括:在预存的音频素材中选取与关键字相匹配的音频素材作为与待剪辑音频片段相匹配的音频素材。通过关键字获取音频文件中的待剪辑的片段,以及剪辑所需的音频素材,有利于进行更为精确的剪辑操作。
另外,在预存的音频素材中选取与关键字相匹配的音频素材,包括:根据待剪辑音频文件的文件名对预存的音频素材进行筛选;其中,预存的音频素材利用音频文件处理得到,且音频素材与音频文件的文件名对应存储;在筛选后的音频素材中选取与关键字相匹配的音频素材。利用音频文件的文件名对素材数据库中存储的大量音频素材进行初步筛选,将无用的音频素材排除,节省了音频素材的匹配时间。
另外,在获取用户在文字中选取的关键字之后,还包括:获取关键字在人声音轨的时间线中的起始时间和终止时间;在筛选后的音频素材中选取与关键字相匹配的音频素材,包括:根据关键字在人声音轨的时间线中的起始时间和终止时间,在筛选后的音频素材中选取匹配的音频素材;其中,音频素材中包括:音频片段,以及音频片段在对应的音频文件的时间线中的起始时间和终止时间。通过关键字在人声音轨时间线中的起始时间和终止时间确定相匹配的音频素材,从而更易于匹配到用户所需的音频素材,从而使剪辑后的音频文件更加符合用户的喜好。
另外,获取关键字在人声音轨的时间线中的起始时间和终止时间,包括:将待剪辑音频文件中的文字与人声音轨时间线对齐;获取关键字在人声音轨的时间线中的起始时间和终止时间,并将待剪辑音频文件处理为音频素材存储至素材数据库中。这样做便于在日后再次剪辑时,可以直接从素材数据库中调用关键字在人声音轨时间线中的起始时间和终止时间,提高剪辑效率。
另外,在将待剪辑音频文件处理为音频素材存储至素材数据库中之后,包括:获取与待剪辑音频文件的名称相同的其他音频文件;将其他音频文件处理为音频素材添加至素材数据库中。由于在剪辑时,可以利用与待剪辑音频文件名称相同但是不同版本的其他音频文件作为素材,所以可以将音频文件名称相同的多个不同版本的音频文件处理为音频素材共同存储至素材数据库中,在丰富素材数据库的同时,更有利于为用户提供所需的音频素材。
另外,在预存的音频素材中选取与关键字相匹配的音频素材,包括:根据关键字在人声音轨的时间线中对应的持续时间,在预存的音频素材中选取匹配的音频素材;其中,音频素材中包括:音频片段,以及音频片段在对应的音频文件的时间线中的持续时间。通过关键字在人声音轨的时间上对应的持续时间选取音频素材,所选取的音频素材与待剪辑片段所占用的音频帧数量相同,剪辑后的音频文件不存在空白或叠音片段,使剪辑效果更佳。
另外,利用匹配的音频素材对待剪辑音频片段进行剪辑处理,包括:利用匹配的音频素材替换待剪辑音频片段。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明实施例中音频剪辑方法的流程图;
图2是根据本发明实施例中终端的歌词界面的示意图;
图3是根据本发明实施例中将歌词时间线与人声音轨时间线对齐的示意图;
图4是根据本发明另一实施例中音频剪辑方法的流程图;
图5是根据本发明实施例中音频剪辑装置的结构示意图;
图6是根据本发明实施例中服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施例涉及一种音频剪辑方法,包括:在待剪辑音频文件中确定待剪辑音频片段;在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材;利用匹配的音频素材对待剪辑音频片段进行剪辑处理。通过预先存储的音频素材直接对待剪辑片段进行剪辑,降低了剪辑的难度。下面对本实施方式的音频剪辑方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
具体流程如图1所示,第一实施例涉及一种音频剪辑方法,包括:
步骤101,在待剪辑音频文件中确定待剪辑音频片段。
具体地说,待剪辑音频文件可以预先存储至服务器的数据库中,在终端检测到用户的选取操作之后,将选取的待剪辑音频文件信息反馈至服务器,以便服务器可以根据接收的待剪辑音频文件信息从数据库中获取待剪辑音频文件。另外,待剪辑音频文件还可以由用户通过终端上传至服务器,服务器从终端接收待剪辑音频文件。
所获取的待剪辑音频文件中至少包括两个音轨,一个是人声音轨,一个是背景音轨。在针对人声音轨进行剪辑时,可以从待剪辑音频文件中的人声音轨中选取待剪辑音频片段,同理也可以针对选取背景音轨的片段进行剪辑,从而可以更为有针对性的进行剪辑,提高剪辑效果。
在确定待剪辑音频片段时,可以由用户自主选择待剪辑音频片段,还可以由服务器自动对人声音轨进行识别,将发音错误的音频片段作为待剪辑片段。在用户自主选择待剪辑音频片段时,用户可以通过终端的应用选取待剪辑音频片段。例如,在终端的音乐APP的歌词界面选择一段歌词,从而确定待剪辑音频片段,或者在终端的音乐APP的播放界面选择一段播放时间,从而确定待剪辑音频片段。下面以通过歌词选择待剪辑音频片段为例进行说明,如图2所示,在待剪辑音频文件为歌曲文件时,用户通过终端的显示界面中的歌词界面可以看到歌曲文件的歌词,用户可以对显示的歌词中的任意若干字进行选取操作,所选取的若干字做对应的人声音轨则作为待剪辑音频片段。另外,在通过服务器对人声音轨进行识别从而确定待剪辑片段时,可以利用服务器识别出发音错误或者满足其他预设条件的人声音轨片段,例如,可以对用户自行录制的歌曲文件中的人声音轨进行解析,将用户的人声音轨与原唱的音轨进行比对,将音调频率相差较大的人声音轨片段作为待剪辑音频片段。从而可以准确的确定人声音轨中不完美的部分作为待剪辑音频片段。在通过服务器自动识别出待剪辑音频片段之后,还可以所识别出的待剪辑音频片段发送至用户终端,以供用户通过终端判定是否需要对待剪辑音频片段进行剪辑操作,使剪辑出的音频文件更加符合用户所需。
步骤102,在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材。
具体地说,在服务器确定了待剪辑音频片段之后,在预存的多个音频素材中选取与待剪辑音频片段匹配的音频素材,音频素材至少包括音频片段,该音频片段可以基于音频帧进行划分,也可以根据字进行划分。例如,可以将音频文件的200帧音频帧作为一个音频片段,也可以将音频文件的单个字或词语作为一个音频片段。音频片段可以预先存储至素材数据库中,素材数据库中的音频素材可以逐步进行添加,比如,先添加排行榜前200名的歌曲文件处理得到的音频素材,再根据用户的需求陆续添加素材数据库中的音频素材,从而提高素材数据库中的音轨素材的利用率。素材数据库中的音频素材通过预设规则以预设周期进行添加,添加音频素材的规则可以是,将访问量大于第一预设阈值的音频文件处理为音频素材进行添加;或者将用户好评比率大于第二预设阈值的音频文件处理为音频素材进行添加;或者将用户近期播放的音频文件处理为音频素材添加至素材数据库中,等等。添加的规则除上述基于用户习惯进行设置外,还可以基于素材数据库中现有的音频文件进行设置,如将与素材数据库中的音频素材具有相同音频文件名称的音频文件处理为音轨素材进行添加,例如,素材数据库中包括刘德华清唱版本的歌曲处理得到的音频素材,歌曲名称为“十七岁”,则在音乐平台中搜索歌曲名称为“十七岁”的其他版本的歌曲文件,并将搜索得到的歌曲文件处理为音频素材添加至素材数据库,如将粤语版本的“十七岁”歌曲文件,演唱会版本的“十七岁”歌曲文件或其他歌手翻唱版本的“十七岁”歌曲文件处理为音频素材添加至素材数据库中,从而利用不同版本的音频文件丰富素材数据库中音频素材的类型及数量,为用户提供多方面不同的剪辑素材,更有利于将待剪辑音频文件剪辑为用户心中的“完美”音频。
另外,除了对素材数据库中的音频素材进行添加之外,还可以对音频素材进行删减,如,将长时间未被用到的音频素材删除,从而节省音频素材所占用的内存空间,提高素材数据库中的音频素材的利用率。
在需要对待剪辑音频片段进行剪辑时,在实时更新的素材数据中选择与待剪辑音频片段相匹配的音频素材,在对音频素材进行匹配时,可以根据待剪辑音频片段包含的音频帧,选择音频帧数量相同的音频素材,也可以根据待剪辑音频片段对应的关键字,选择与关键字代表相同含义的音频素材,还可以根据待剪辑音频片段确定待剪辑音频文件的文件名称,选择与待剪辑音频文件的文件名称相同但是不同版本的其他音频文件,并利用这些不同版本的其他音频文件处理得到的与待剪辑音频片段相匹配的音频素材。
若所匹配的音频素材的数量大于一,则可以将匹配结果发送至终端,以便用户可以在多个匹配的音频素材中选择一个作为剪辑所需的音频素材。如图2所示,在终端音乐APP的歌词界面中所选择的关键字下方以提示框的形式进行显示,提示框中显示的每一个选项代表一个匹配的音频素材,用户在选定一个音频素材之后,终端将选择结果返回服务器,以便服务器在多个匹配的音频素材中确定一个音频素材,并利用所确定的音频素材对待剪辑音频片段进行替换。另外在为用户提供多个匹配的音频素材的同时,还可以为用户提供试听服务,用户在选中提示框中的某一选项后,可以对这一音频素材进行试听,从而便于用户进行选择。
步骤103,利用匹配的音频素材替换待剪辑音频片段。
具体地说,可以将音频文件中选择的待剪辑片段与其匹配的音频素材中的音频片段相替换,从而实现了对待剪辑音频文件的剪辑,达到了用其他音频文件的音频片段替换待剪辑音频文件的人声音轨片段的目的。另外,还可以将音频素材与待剪辑音频片段中的音轨片段进行合并,从而丰富待剪辑音频文件的播放效果,为用户提供多种剪辑方式。
本发明实施方式相对于现有技术而言,在确定待剪辑音频片段之后,在预存的多个音频素材中选取与待剪辑音频片段匹配的音频素材,并利用匹配的音频素材实现对待剪辑音频文件中的待剪辑片段的剪辑,从而实现了音频文件的剪辑。音频素材预先存储至素材数据库,在需要对音频文件进行剪辑时直接调用音频素材对待剪辑音频片段进行剪辑,从而降低了剪辑的难度,有利于普及应用在日常生活中。
本发明的第二实施例涉及一种音频剪辑方法。在本发明第二实施例中利用关键字在素材数据库中选取与待剪辑音频片段相匹配的音频素材。
如图4所示,在第二实施例中,包括:
步骤401,获取待剪辑音频文件中的人声音轨,并根据人声音轨获取对应的文字。
具体地说,在针对待剪辑音频文件中的人声音轨进行剪辑时,获取待剪辑音频文件中的人声音轨,获取的人声音轨具有对应的文字,例如,在待剪辑音频文件为歌曲文件时,人声音轨可以对应相应的歌词;在待剪辑音频文件为小说朗读文件时,人声音轨可以对应相应的小说内容,等等。在获取人声音轨之后,可以通过语音识别获取人声音轨对应的文字;还可以从数据库中直接获取人声音轨对应的文字,在确定待剪辑音频文件之后,通过待剪辑音频文件的文件名直接从数据库中查询得到待剪辑音频文件的人声音轨对应的文字。
步骤402,获取文字中的关键字。
具体地说,在确定了人声音轨的对应的文字之后,可以由用户在文字中选取关键字,也可以通过服务器自动识别,从而在文字中确定关键字。在由用户选取关键字时,服务器在获取待剪辑音频文件的人声音轨所对应的文字之后,将文字传输至用户终端,用户利用终端可以直观的看到这些文字,如图2所示,在待剪辑音频文件为歌曲文件时,用户通过终端的显示界面中的歌词界面可以看到歌曲文件的歌词,用户可以对显示的歌词中的任意若干字进行选取操作,所选取的若干个关键字即可作为关键字。在用户选择歌词中的关键字之后,终端的音乐APP将用户选择的文字转换为指令发送至服务器,服务器在接收到指令之后,根据所述指令确定待剪辑歌曲文件中的关键字,每首歌曲文件中可以选择一个或多个作为关键字,从而可以在待剪辑音频文件中分别确定一个或多个待剪辑音频片段,在此对于关键字选择的数量以及关键字的字数不做限制。
步骤403,将待剪辑音频文件中的文字与人声音轨时间线对齐。
步骤404,获取关键字在人声音轨时间线中的起始时间和终止时间,并将待剪辑音频文件处理为音频素材存储至素材数据库中。
具体地说,将待剪辑音频文件中的人声音轨对应的文字与人声音轨时间线进行对齐,如图3所示,可以得到待剪辑音频文件的任一字或词语在人声音轨时间线中的起始时间和终止时间,从而可以得到获取的关键字在人声音轨时间线中的起始时间和终止时间,并且将待剪辑音频文件处理为音频素材,即将待剪辑音频文件中每一个字在人声音轨时间线中的起始时间和终止时间存储至素材数据库中,丰富了素材数据库,在日后需要时便于直接从素材数据库中调用,避免对关键字对应的起始时间和终止时间进行重复处理。
在实际应用中,在确定待剪辑音频文件之后,可以先在素材数据库中查询是否存在待剪辑音频文件处理得到的音频素材,若存在,则直接从音频素材中获取关键字对应的人声音轨和关键字在人声音轨时间线的起始时间和终止时间。获取关键字对应的起始时间和终止时间方式如下,访问素材数据库,可以得知素材数据库中保存的音频素材对应的音频文件,以及音频文件的标识或音频文件名,根据标识或者音频文件名可以判定素材数据库中是否保存利用待剪辑音频文件处理得到的音频素材,由于在将音频文件处理为音频素材时,会将该音频文件的单个字在对应的人声音轨时间线中的起始时间和终止时间,且将任一个字对应的音频片段以及起始时间和终止时间均存储至素材数据库中作为音频素材,所以在素材数据库中存储有待剪辑音频文件处理的音频素材时,可以查询到待剪辑音频文件的任一个字对应的起始时间和终止时间,也就可以在用户选取关键字时直接从素材数据库中调用关键字在人声音轨时间线中的起始时间和终止时间,减少了获取所需的时间,提高了剪辑效率。
另外,素材数据库中存储的音频素材可以为单个字对应的音轨片段,单个字在人生音轨时间线中的起始时间和终止时间和持续时间等,在关键字中的字数为多个时,可以利用多个单个字的音频素材进行拼接,从而得到任意字数的关键字的起始时间和终止时间,减少了音频素材的种类,从而降低了音频素材的准备难度。
步骤405,在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材。
具体地说,在服务器确定了文字中的关键字之后,在预存的多个音频素材中选取与关键字匹配的音频素材,音频素材至少包括音频片段,该音频片段可以依据音频文件中单个字进行划分,也可以依据音频文件中每句话或每个词语进行划分,以歌曲文件为例,音频素材可以是每一首歌曲的歌词中单个字对应的人声音轨片段,如歌词“好一朵美丽的茉莉花”,可以将单个字“茉”“莉”“花”分别对应的人声音轨片段作为音频素材,也可以将词语“美丽”“茉莉花”分别对应的人声音轨片段作为音频素材,还可以将整句话“好一朵美丽的茉莉花”对应的人声音轨片段作为一个音频素材,同样可以将一段歌词对应的人声音轨片段作为一个音频素材。
在对素材数据库中的音频素材进行匹配,确定与待剪辑音频片段相匹配的音频素材时,可以根据上述确定的关键字,选取素材数据库中与该关键字相同的字对应的音频素材作为匹配的音配素材,还可以根据关键字在人声音轨时间线中的起始时间和终止时间对音频素材进行匹配,或者可以根据关键字在人声音轨时间线中的持续时间对音频素材进行匹配。关键字在人生音轨时间线上的起始时间和终止时间和持续时间的获取方式如图3所示,将人声音轨时间线和歌词时间线相对齐,假设“长亭外,古道边,芳草碧连天”这句歌词对应人声音轨时间线为:00:15至00:28,获取的关键字“天”在人声音轨时间线中的起始时间(T_v_n_start)为00:24,终止时间(T_v_n_end)为00:28,那么关键字“天”在人声音轨时间线中的持续时间为4秒。同理,素材数据库中的所有素材均包括音频片段,以及这段音频片段在对应的音频文件的时间轴中的起始时间和终止时间或者包含音频片段在对应的音频文件的时间轴中的持续时间,各个音频素材获取起始时间和终止时间和持续时间的方式与上述方式相同,并在获取后将音频素材与起始时间和终止时间对应存储,以便在对音频素材进行匹配时,方便查询到各个音频素材对应的起始时间和终止时间和持续时间。由于素材数据库中各个音频素材对应存储有起始时间和终止时间,或者对应存储有持续时间,所以可以直接将音频素材的起始时间和终止时间和持续时间与关键字的起始时间和终止时间和持续时间相比对,在两者相同时,完成匹配。例如,假设所确定的关键字为歌词“长亭外,古道边,芳草碧连天”中的“天”字,获取素材数据库中与关键字代表相同含义的音频素材,即在素材数据库中查询代表“天”字的音频素材,完成音频素材的匹配;或者在获取关键字相同的音频素材之后,再次比对关键字在人声音轨时间线中的起始时间和终止时间,选取在时间线上起始时间和终止时间相同的音频素材,同样还可以对持续时间进行比对,在对持续时间进行比对时,可以选取与关键字发音相似或发音完全不同的音频素材,只需保证音频素材的持续时间和关键字对应的持续时间相同,即可保证待剪辑音频片段与剪辑素材的音频帧相同,不会出现空帧或者重复帧的情况,保证了剪辑过程不会出现错误导致剪辑失败的同时,利用不同的发音替换原有的人生音轨片段,增加了音频文件剪辑过程的娱乐性。
另外,在对素材数据库中的音频素材进行匹配之前,还可以根据音频文件的文件名称对音频素材进行初步的筛选,从而减少了所需匹配的素材数量。由于素材数据库中的音频素材均是利用现有的音频文件处理得到的,所以每个音频素材与其处理所用到的音频文件具有一定的对应关系,也就与这一音频文件的文件名称具有对应关系,将这一对应关系在素材数据库中进行存储,从而方便利用文件名称对音频素材进行查询。以“茉莉花”这首歌曲为例,若待剪辑音频文件的文件名称为“茉莉花”,则在素材数据库中查询文件名称同为“茉莉花”的音频素材,所查询到的音频素材可能是与待剪辑音频文件名称相同,但是不同版本或者不同演唱者所演唱的歌曲“茉莉花”处理得到的音频素材。将这些音频素材作为初步筛选后的音频素材并从中选出与待剪辑音频片段相匹配的音频素材。
步骤406,利用匹配的音频素材替换待剪辑音频片段。
在本实施例中,利用关键字在素材数据库中选取与待剪辑音频片段相匹配的音频素材,有利于进行更为精确的剪辑操作。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施例涉及一种音频剪辑装置,如图5所示,包括:确定模块51,匹配模块52,剪辑模块53;获取模块51用于在待剪辑音频文件中确定待剪辑音频片段;匹配模块52用于在预存的音频素材中选取与待剪辑音频片段相匹配的音频素材;剪辑模块53用于利用匹配的音频素材对待剪辑音频片段进行剪辑处理。
不难发现,本实施方式为与第一实施例相对应的装置实施例,本实施例可与第一实施例互相配合实施。第一实施例中提到的相关技术细节在本实施例中依然有效,为了减少重复,这里不再赘述。相应地,本实施例中提到的相关技术细节也可应用在第一实施例中。
值得一提的是,本实施例中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第四实施例涉及一种服务器,如图6所示,包括至少一个处理器601;以及,与至少一个处理器601通信连接的存储器602;其中,存储器602存储有可被至少一个处理器601执行的指令,指令被至少一个处理器601执行,以使至少一个处理器601能够执行上述音频剪辑方法。
其中,存储器602和处理器601采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器601和存储器602的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器601。
处理器601负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器602可以被用于存储处理器601在执行操作时所使用的数据。
本发明第五实施例涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种音频剪辑方法,其特征在于,包括:
在待剪辑音频文件中确定待剪辑音频片段;
在预存的音频素材中选取与所述待剪辑音频片段相匹配的音频素材;
利用所述匹配的音频素材对所述待剪辑音频片段进行剪辑处理。
2.根据权利要求1所述的音频剪辑方法,其特征在于,所述在待剪辑音频文件中确定待剪辑音频片段,包括:
获取待剪辑音频文件中的人声音轨,并根据所述待剪辑音频文件获取所述人声音轨对应的文字;
获取用户在所述文字中选取的关键字;
从所述人声音轨中选取所述关键字对应的人声音轨片段作为待剪辑音频片段;
所述在预存的音频素材中选取与所述待剪辑音频片段相匹配的音频素材,包括:
在预存的音频素材中选取与所述关键字相匹配的音频素材作为与所述待剪辑音频片段相匹配的音频素材。
3.根据权利要求2所述的音频剪辑方法,其特征在于,所述在预存的音频素材中选取与所述关键字相匹配的音频素材,包括:
根据所述待剪辑音频文件的文件名对所述预存的音频素材进行筛选;
其中,所述预存的音频素材利用音频文件处理得到,且所述音频素材与所述音频文件的文件名对应存储;
在所述筛选后的音频素材中选取与所述关键字相匹配的音频素材。
4.根据权利要求3所述的音频剪辑方法,其特征在于,在所述获取用户在所述文字中选取的关键字之后,还包括:
获取所述关键字在所述人声音轨的时间线中的起始时间和终止时间;
所述在所述筛选后的音频素材中选取与所述关键字相匹配的音频素材,包括:
根据所述关键字在人声音轨的时间线中的起始时间和终止时间,在所述筛选后的音频素材中选取所述匹配的音频素材;
其中,所述音频素材中包括:音频片段,以及所述音频片段在对应的音频文件的时间线中的起始时间和终止时间。
5.根据权利要求4所述的音频剪辑方法,其特征在于,所述获取所述关键字在所述人声音轨的时间线中的起始时间和终止时间,包括:
将所述待剪辑音频文件的所述文字与所述人声音轨的时间线对齐;
获取所述关键字在所述人声音轨的时间线中的起始时间和终止时间,并将所述待剪辑音频文件处理为音频素材存储至素材数据库中。
6.根据权利要求5所述的音频剪辑方法,其特征在于,在所述将所述待剪辑音频文件处理为音频素材存储至素材数据库中之后,包括:
获取与所述待剪辑音频文件的名称相同的其他音频文件;
将所述其他音频文件处理为音频素材添加至所述素材数据库中。
7.根据权利要求2所述的音频剪辑方法,其特征在于,所述在预存的音频素材中选取与所述关键字相匹配的音频素材,包括:
根据所述关键字在人声音轨的时间线中对应的持续时间,在所述预存的音频素材中选取所述匹配的音频素材;
其中,所述音频素材中包括:音频片段,以及所述音频片段在对应的音频文件的时间线中的持续时间。
8.根据权利要求1所述的音频剪辑方法,其特征在于,所述利用所述匹配的音频素材对所述待剪辑音频片段进行剪辑处理,包括:
利用所述匹配的音频素材替换所述待剪辑音频片段。
9.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的音频剪辑方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的音频剪辑方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269401.2A CN111554329A (zh) | 2020-04-08 | 2020-04-08 | 音频剪辑方法、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269401.2A CN111554329A (zh) | 2020-04-08 | 2020-04-08 | 音频剪辑方法、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111554329A true CN111554329A (zh) | 2020-08-18 |
Family
ID=72007357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010269401.2A Pending CN111554329A (zh) | 2020-04-08 | 2020-04-08 | 音频剪辑方法、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111554329A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113473222A (zh) * | 2021-05-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
WO2023217003A1 (zh) * | 2022-05-07 | 2023-11-16 | 北京字跳网络技术有限公司 | 音频处理方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1493029A (zh) * | 2001-02-23 | 2004-04-28 | ���ٲ� | 搜索和记录媒体信号的方法和装置 |
CN102650993A (zh) * | 2011-02-25 | 2012-08-29 | 北大方正集团有限公司 | 音视频文件的索引建立和检索方法、装置及系统 |
CN104050217A (zh) * | 2013-03-15 | 2014-09-17 | 国际商业机器公司 | 媒体内容替换方法和系统 |
CN105810211A (zh) * | 2015-07-13 | 2016-07-27 | 维沃移动通信有限公司 | 一种音频数据的处理方法及终端 |
CN106971749A (zh) * | 2017-03-30 | 2017-07-21 | 联想(北京)有限公司 | 音频处理方法及电子设备 |
CN103561264B (zh) * | 2013-11-07 | 2017-08-04 | 北京大学 | 一种基于云计算的媒体解码方法及解码器 |
CN108022604A (zh) * | 2017-11-28 | 2018-05-11 | 北京小唱科技有限公司 | 补录音频内容的方法和装置 |
CN108337558A (zh) * | 2017-12-26 | 2018-07-27 | 努比亚技术有限公司 | 音视频剪辑方法及终端 |
CN108449629A (zh) * | 2018-03-31 | 2018-08-24 | 湖南广播电视台广播传媒中心 | 一种音频的语音与文字同步方法及剪辑方法和剪辑系统 |
-
2020
- 2020-04-08 CN CN202010269401.2A patent/CN111554329A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1493029A (zh) * | 2001-02-23 | 2004-04-28 | ���ٲ� | 搜索和记录媒体信号的方法和装置 |
CN102650993A (zh) * | 2011-02-25 | 2012-08-29 | 北大方正集团有限公司 | 音视频文件的索引建立和检索方法、装置及系统 |
CN104050217A (zh) * | 2013-03-15 | 2014-09-17 | 国际商业机器公司 | 媒体内容替换方法和系统 |
CN103561264B (zh) * | 2013-11-07 | 2017-08-04 | 北京大学 | 一种基于云计算的媒体解码方法及解码器 |
CN105810211A (zh) * | 2015-07-13 | 2016-07-27 | 维沃移动通信有限公司 | 一种音频数据的处理方法及终端 |
CN106971749A (zh) * | 2017-03-30 | 2017-07-21 | 联想(北京)有限公司 | 音频处理方法及电子设备 |
CN108022604A (zh) * | 2017-11-28 | 2018-05-11 | 北京小唱科技有限公司 | 补录音频内容的方法和装置 |
CN108337558A (zh) * | 2017-12-26 | 2018-07-27 | 努比亚技术有限公司 | 音视频剪辑方法及终端 |
CN108449629A (zh) * | 2018-03-31 | 2018-08-24 | 湖南广播电视台广播传媒中心 | 一种音频的语音与文字同步方法及剪辑方法和剪辑系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113473222A (zh) * | 2021-05-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
CN113473222B (zh) * | 2021-05-25 | 2023-10-10 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
WO2023217003A1 (zh) * | 2022-05-07 | 2023-11-16 | 北京字跳网络技术有限公司 | 音频处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100495536C (zh) | 利用语音识别访问和检索媒体文件的系统和方法 | |
US20040128141A1 (en) | System and program for reproducing information | |
JP2820236B2 (ja) | カラオケシステムおよびカラオケ装置 | |
CN105006234B (zh) | 一种k歌处理方法及装置 | |
CN101996627B (zh) | 语音处理装置、语音处理方法和程序 | |
US11580941B2 (en) | Music compilation systems and related methods | |
US7685225B2 (en) | Content acquisition apparatus, content acquisition method and content acquisition program | |
CN103597543A (zh) | 语义音轨混合器 | |
CN104471512A (zh) | 内容定制化 | |
US20050160089A1 (en) | Information extracting system and music extracting system | |
US20030028377A1 (en) | Method and device for synthesizing and distributing voice types for voice-enabled devices | |
CN111554329A (zh) | 音频剪辑方法、服务器及存储介质 | |
CN104412320A (zh) | 使用音频波形数据的自动演奏技术 | |
US7663048B2 (en) | Content distributing server, content distributing method, and content distributing program | |
CN110942765B (zh) | 一种构建语料库的方法、设备、服务器和存储介质 | |
KR20060052357A (ko) | 기록매체, 기록장치, 기록방법, 데이터 검색장치, 데이터검색방법 및 데이터 생성장치 | |
JP5986387B2 (ja) | 情報処理プログラム、情報処理装置、歌詞表示方法、及び通信システム | |
US20040193649A1 (en) | Method and apparatus for searching recommended music in the internet, and a computer-readable medium encoded with a plurality of processor-executable instruction sequences for searching recommended music in the internet | |
KR100687683B1 (ko) | 연주 제어 데이터 생성 장치, 연주 제어 데이터 생성 방법, 및 그 방법을 실행하기 위한 프로그램을 저장하는 기억 매체 | |
CN101925897B (zh) | 建议用于与内容数据项同步再现的伴奏乐曲的方法 | |
JP2007058481A (ja) | 再生装置、及び楽曲情報提供方法 | |
CN114974184A (zh) | 音频制作方法、装置、终端设备及可读存储介质 | |
JP2004062769A (ja) | コンテンツ出力装置 | |
CN109710797B (zh) | 音频文件的推送方法、装置、电子装置和存储介质 | |
CN113516963A (zh) | 音频数据的生成方法、装置、服务器和智能音箱 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200818 |
|
RJ01 | Rejection of invention patent application after publication |