CN108269597B - 一种音频工作站管理方法和系统 - Google Patents

一种音频工作站管理方法和系统 Download PDF

Info

Publication number
CN108269597B
CN108269597B CN201810360087.1A CN201810360087A CN108269597B CN 108269597 B CN108269597 B CN 108269597B CN 201810360087 A CN201810360087 A CN 201810360087A CN 108269597 B CN108269597 B CN 108269597B
Authority
CN
China
Prior art keywords
time length
dubbing
audio
sound
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810360087.1A
Other languages
English (en)
Other versions
CN108269597A (zh
Inventor
屈振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Haitai Rongzhi Acoustics Technology Co.,Ltd.
Original Assignee
Hangzhou Hex Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hex Electronics Co Ltd filed Critical Hangzhou Hex Electronics Co Ltd
Priority to CN201810360087.1A priority Critical patent/CN108269597B/zh
Publication of CN108269597A publication Critical patent/CN108269597A/zh
Application granted granted Critical
Publication of CN108269597B publication Critical patent/CN108269597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明涉及音频剪辑制作技术领域,公开了一种音频工作站管理方法和系统,包括以下步骤,获取声音录制请求并开始录制;获取当前原始视频中原始音的原音时长;获取配音人员的配音音频并基于配音音频得出配音音频时长;判断原音时长与配音音频时长的时长差是否小于第一预设时长;若是,则基于配音人员的配音音频在剪辑生成后期音;若否,则删除配音音频并在第二预设时长后开始下一次声音的录制;若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。

Description

一种音频工作站管理方法和系统
技术领域
本发明涉及音频剪辑制作技术领域,具体涉及一种音频工作站管理方法和系统。
背景技术
现在是一个数码时代,为追求优良的音质很多人做出了不懈地努力。随着数码时代的来临,数字信号比模拟信号优越已成为共识。
在电视剧和综艺节目的后期处理过程中,在现场拍摄过程中,视频中可能会携带有杂音,通常需要对拍摄到的视频中的部分声音进行后期的配音,现有的配音过程是配音人员在房间内进行声音的录制,音频剪辑人员对配音人员的声音进行剪辑处理,但是在配音过程中,配音人员所发出声音的时长可能与视频中原始音的时长不同,此时需要剪辑人员将配音人员所配的音频进行删除,并重新开始录制声音,剪辑人员的工作量大。
发明内容
针对现有技术存在的剪辑人员工作量大的问题,本发明的目的在于提供一种音频工作站管理方法,具有减少剪辑人员工作量的效果。
为实现上述目的,本发明提供了如下技术方案:
一种音频工作站管理方法,包括以下步骤,
获取声音录制请求并开始录制;
获取当前原始视频中原始音的原音时长;
获取配音人员的配音音频并基于配音音频得出配音音频时长;
判断原音时长与配音音频时长的时长差是否小于第一预设时长;
若是,则基于配音人员的配音音频在剪辑生成后期音;
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制。
通过采用上述技术方案,音频剪辑人员发出声音录制请求,并开始录制。在实际音频剪辑过程中,可分别对每一个人的声音进行分离,从而对每一个人进行单独录音。通过对原始视频中原始音的音量的判断,从而获得原音时长。配音人员发出声音,声音录制设备对配音人员的声音进行记录,通过对音量的判断,从而得出配音音频时长。在实际录制过程中,配音的音频与原音时长之间会有差距,通过第一预设时长来对误差进行处理。在误差范围内,将配音音频进行剪辑,从而获得后期音。若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。
本发明的进一步设置为:还包括在原音时长与配音音频时长的时长差小于第一预设时长时执行的以下步骤,
获取原始视频中原始音的开始时间并播放后期音。
通过采用上述技术方案,通过将后期音在原始音开始时间进行播放,从而自动对准播放时间,若是有误差,通过音频剪辑人员的调整,即可调整音频播放时间。
本发明的进一步设置为:还包括在获取当前视频中原始音的原音时长后执行的以下步骤,
基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。
通过采用上述技术方案,通过在原音时长的基础上加上缓冲时间,从而获得声音录制时长,从而自动停止配音人员的声音的录制。减少音频剪辑人员的工作量。
本发明的进一步设置为:还包括在开始录制后执行的以下步骤,
获取原始视频中的第一口型视频;
获取配音人员的第二口型视频;
对比第一口型视频和第二口型视频;
若不相同,则发出报警;
若相同,则停止执行。
通过采用上述技术方案,在部分视频中,原视频中人的面部在视频播放过程中一直在视频中。通获取第一口型视频和第二口型视频并对比,从而对配音人员的声音中的词语与原视频中的声音中的词语进行对比,在不相同时,发出报警。提示音频剪辑人员。
本发明的进一步设置为:获取原始视频中的第一口型视频具体包括以下步骤,
获取原始视频中人脸面部信息;
获取剪辑人员的选择指令;
基于选择指令获取原始视频中对应人员的第一口型视频。
通过采用上述技术方案,在原视频中,可能会有多个人员的出现,通过剪辑人员的选择指令,从而读取单个人的第一口型视频。减少了口型的读取量。
针对现有技术存在的剪辑人员工作量大的问题,本发明的目的在于提供一种音频工作站管理系统,具有减少剪辑人员工作量的效果。
为实现上述目的,本发明提供了如下技术方案:
一种音频工作站管理系统,包括以下模块,
开始模块,用于获取声音录制请求并开始录制;
原始音获取模块,获取当前原始视频中原始音的原音时长;
配音获取模块,获取配音人员的配音音频并基于配音音频得出配音音频时长;
判断模块,判断原音时长与配音音频时长的时长差是否小于第一预设时长;
若是,则基于配音人员的配音音频在剪辑生成后期音;
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制。
通过采用上述技术方案,音频剪辑人员发出声音录制请求,并开始录制。在实际音频剪辑过程中,可分别对每一个人的声音进行分离,从而对每一个人进行单独录音。通过对原始视频中原始音的音量的判断,从而获得原音时长。配音人员发出声音,声音录制设备对配音人员的声音进行记录,通过对音量的判断,从而得出配音音频时长。在实际录制过程中,配音的音频与原音时长之间会有差距,通过第一预设时长来对误差进行处理。在误差范围内,将配音音频进行剪辑,从而获得后期音。若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。
本发明的进一步设置为:还包括在判断模块中原音时长与配音音频时长的时长差小于第一预设时长时执行的以下模块,
匹配模块,获取原始视频中原始音的开始时间并播放后期音。
通过采用上述技术方案,通过将后期音在原始音开始时间进行播放,从而自动对准播放时间,若是有误差,通过音频剪辑人员的调整,即可调整音频播放时间。
本发明的进一步设置为:还包括在原始音获取模块后执行的以下模块,
定时停止模块,基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。
通过采用上述技术方案,通过在原音时长的基础上加上缓冲时间,从而获得声音录制时长,从而自动停止配音人员的声音的录制。减少音频剪辑人员的工作量。
本发明的进一步设置为:还包括在开始模块后执行的以下模块,
第一视频获取模块,用于获取原始视频中的第一口型视频;
第二视频获取模块,用于获取配音人员的第二口型视频;
对比模块,对比第一口型视频和第二口型视频;
若不相同,则发出报警;
若相同,则停止执行。
通过采用上述技术方案,在部分视频中,原视频中人的面部在视频播放过程中一直在视频中。通获取第一口型视频和第二口型视频并对比,从而对配音人员的声音中的词语与原视频中的声音中的词语进行对比,在不相同时,发出报警。提示音频剪辑人员。
本发明的进一步设置为:第一视频获取模块具体包括的以下模块,
面部信息获取模块,获取原始视频中人脸面部信息;
选择模块,获取剪辑人员的选择指令;
输出模块,基于选择指令获取原始视频中对应人员的第一口型视频。
通过采用上述技术方案,在原视频中,可能会有多个人员的出现,通过剪辑人员的选择指令,从而读取单个人的第一口型视频。减少了口型的读取量。
本发明具有以下优点:
1、若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。
2、通过将后期音在原始音开始时间进行播放,从而自动对准播放时间,减少音频剪辑人员的工作量。
3、通过在原音时长的基础上加上缓冲时间,从而获得声音录制时长,从而自动停止配音人员的声音的录制。减少音频剪辑人员的工作量。
4、对配音人员的声音中的词语与原视频中的声音中的词语进行对比,在不相同时,发出报警。提示音频剪辑人员。
附图说明
图1为音频工作站管理方法的流程图;
图2为音频工作站管理系统的部分结构图;
图3为第一视频获取模块、第二视频获取模块和对比模块的结构图。
具体实施方式
参照附图对本发明做进一步说明。
实施例1,一种音频工作站管理方法,如图1所示:包括以下步骤,
获取声音录制请求并开始录制。音频剪辑人员发出声音录制请求,并开始录制。
获取当前原始视频中原始音的原音时长。在实际音频剪辑过程中,可分别对每一个人的声音进行分离,从而对每一个人进行单独录音。通过对原始视频中原始音的音量的判断,从而获得原音时长。
基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。通过在原音时长的基础上加上缓冲时间,从而获得声音录制时长,从而自动停止配音人员的声音的录制。
获取配音人员的配音音频并基于配音音频得出配音音频时长。配音人员发出声音,声音录制设备对配音人员的声音进行记录,通过对音量的判断,从而得出配音音频时长。
判断原音时长与配音音频时长的时长差是否小于第一预设时长。在实际录制过程中,配音的音频与原音时长之间会有差距,通过第一预设时长来对误差进行处理。
若是,则基于配音人员的配音音频在剪辑生成后期音;获取原始视频中原始音的开始时间并播放后期音。在误差范围内,将配音音频进行剪辑,从而获得后期音。通过将后期音在原始音开始时间进行播放,从而自动对准播放时间,若是有误差,通过音频剪辑人员的调整,即可调整音频播放时间。
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制。若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。
该方法还包括在开始录制后执行的以下步骤:
获取原始视频中人脸面部信息。
获取剪辑人员的选择指令。在一些配音过程中,视频中会有很多人脸信息,在获得多个人脸信息后,音频剪辑人员发出选择指令,选择对应的人脸。
基于选择指令获取原始视频中对应人员的第一口型视频。
获取配音人员的第二口型视频。通过在配音录制设备端录制配音人员的第二口型视频。
对比第一口型视频和第二口型视频。
若不相同,则发出报警。
若相同,则停止执行。若是不相同,配音人员的声音与原始音不同。则提示音频剪辑人员,方便音频剪辑人员工作。
实施例2,一种音频工作站管理系统,如图2所示:包括开始模块、原始音获取模块、定时停止模块、配音获取模块、判断模块、匹配模块。
开始模块,用于获取声音录制请求并开始录制。音频剪辑人员发出声音录制请求,并开始录制。
原始音获取模块,获取当前原始视频中原始音的原音时长。在实际音频剪辑过程中,可分别对每一个人的声音进行分离,从而对每一个人进行单独录音。通过对原始视频中原始音的音量的判断,从而获得原音时长。
定时停止模块,基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。通过在原音时长的基础上加上缓冲时间,从而获得声音录制时长,从而自动停止配音人员的声音的录制。
配音获取模块,获取配音人员的配音音频并基于配音音频得出配音音频时长。配音人员发出声音,声音录制设备对配音人员的声音进行记录,通过对音量的判断,从而得出配音音频时长。
判断模块,判断原音时长与配音音频时长的时长差是否小于第一预设时长。在实际录制过程中,配音的音频与原音时长之间会有差距,通过第一预设时长来对误差进行处理。
若是,则基于配音人员的配音音频在剪辑生成后期音并执行匹配模块。匹配模块,获取原始视频中原始音的开始时间并播放后期音。在误差范围内,将配音音频进行剪辑,从而获得后期音。通过将后期音在原始音开始时间进行播放,从而自动对准播放时间,若是有误差,通过音频剪辑人员的调整,即可调整音频播放时间。
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制。若是原音时长与配音音频时长的时长差大于预设值,则删除配音音频,并开始下一次录制,减少了音频剪辑人员的工作量。
如图3所示:该系统还包括在开始模块后执行的第一视频获取模块、第二视频获取模块、对比模块。
第一视频获取模块,第一视频获取模块具体包括面部信息获取模块、选择模块、输出模块。
面部信息获取模块,获取原始视频中人脸面部信息。
选择模块,获取剪辑人员的选择指令。在一些配音过程中,视频中会有很多人脸信息,在获得多个人脸信息后,音频剪辑人员发出选择指令,选择对应的人脸。
输出模块,基于选择指令获取原始视频中对应人员的第一口型视频。
第二视频获取模块,用于获取配音人员的第二口型视频。通过在配音录制设备端录制配音人员的第二口型视频。
对比模块,对比第一口型视频和第二口型视频。
若不相同,则发出报警。
若相同,则停止执行。若是不相同,配音人员的声音与原始音不同。则提示音频剪辑人员,方便音频剪辑人员工作。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种音频工作站管理方法,其特征是:包括以下步骤,
获取声音录制请求并开始录制;
获取当前原始视频中原始音的原音时长;
获取配音人员的配音音频并基于配音音频得出配音音频时长;
判断原音时长与配音音频时长的时长差是否小于第一预设时长;
若是,则基于配音人员的配音音频在剪辑生成后期音;
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制;
还包括在开始录制后执行的以下步骤,
获取原始视频中的第一口型视频;
获取配音人员的第二口型视频;
对比第一口型视频和第二口型视频;
若不相同,则发出报警;
若相同,则停止执行。
2.根据权利要求1所述的一种音频工作站管理方法,其特征是:还包括在原音时长与配音音频时长的时长差小于第一预设时长时执行的以下步骤,
获取原始视频中原始音的开始时间并播放后期音。
3.根据权利要求1所述的一种音频工作站管理方法,其特征是:还包括在获取当前视频中原始音的原音时长后执行的以下步骤,
基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。
4.根据权利要求1所述的一种音频工作站管理方法,其特征是:获取原始视频中的第一口型视频具体包括以下步骤,
获取原始视频中人脸面部信息;
获取剪辑人员的选择指令;
基于选择指令获取原始视频中对应人员的第一口型视频。
5.一种音频工作站管理系统,其特征是:包括以下模块,
开始模块,用于获取声音录制请求并开始录制;
原始音获取模块,获取当前原始视频中原始音的原音时长;
配音获取模块,获取配音人员的配音音频并基于配音音频得出配音音频时长;
判断模块,判断原音时长与配音音频时长的时长差是否小于第一预设时长;
若是,则基于配音人员的配音音频在剪辑生成后期音;
若否,则删除配音音频并在第二预设时长后开始下一次声音的录制;
还包括在开始模块后执行的以下模块,
第一视频获取模块,用于获取原始视频中的第一口型视频;
第二视频获取模块,用于获取配音人员的第二口型视频;
对比模块,对比第一口型视频和第二口型视频;
若不相同,则发出报警;
若相同,则停止执行。
6.根据权利要求5所述的一种音频工作站管理系统,其特征是:还包括在判断模块中原音时长与配音音频时长的时长差小于第一预设时长时执行的以下模块,
匹配模块,获取原始视频中原始音的开始时间并播放后期音。
7.根据权利要求5所述的一种音频工作站管理系统,其特征是:还包括在原始音获取模块后执行的以下模块,
定时停止模块,基于原音时长生成声音录制时长并基于声音录制时长定时关闭录制。
8.根据权利要求5所述的一种音频工作站管理系统,其特征是:第一视频获取模块具体包括的以下模块,
面部信息获取模块,获取原始视频中人脸面部信息;
选择模块,获取剪辑人员的选择指令;
输出模块,基于选择指令获取原始视频中对应人员的第一口型视频。
CN201810360087.1A 2018-04-20 2018-04-20 一种音频工作站管理方法和系统 Active CN108269597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810360087.1A CN108269597B (zh) 2018-04-20 2018-04-20 一种音频工作站管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810360087.1A CN108269597B (zh) 2018-04-20 2018-04-20 一种音频工作站管理方法和系统

Publications (2)

Publication Number Publication Date
CN108269597A CN108269597A (zh) 2018-07-10
CN108269597B true CN108269597B (zh) 2019-12-20

Family

ID=62778407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810360087.1A Active CN108269597B (zh) 2018-04-20 2018-04-20 一种音频工作站管理方法和系统

Country Status (1)

Country Link
CN (1) CN108269597B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587543B (zh) * 2018-12-27 2021-04-02 秒针信息技术有限公司 音频同步方法和装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1825911A (zh) * 2006-04-03 2006-08-30 北京和声创景音频技术有限公司 影视剧配音系统及其配音制作方法
CN1889068A (zh) * 2005-06-30 2007-01-03 腾讯科技(深圳)有限公司 一种实现音频和视频同步的方法
CN101640057A (zh) * 2009-05-31 2010-02-03 北京中星微电子有限公司 一种音视频匹配方法及装置
CN106060424A (zh) * 2016-06-14 2016-10-26 徐文波 视频配音方法和装置
CN107272318A (zh) * 2010-10-12 2017-10-20 罗盘互动有限公司 借助智能电话和音频水印的多种语言同步电影配音

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937570A (zh) * 2009-10-11 2011-01-05 上海本略信息科技有限公司 基于语音和文字识别的动漫口形自动匹配实现方法
CN102467750A (zh) * 2010-11-15 2012-05-23 赵兴平 名人动画方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889068A (zh) * 2005-06-30 2007-01-03 腾讯科技(深圳)有限公司 一种实现音频和视频同步的方法
CN1825911A (zh) * 2006-04-03 2006-08-30 北京和声创景音频技术有限公司 影视剧配音系统及其配音制作方法
CN101640057A (zh) * 2009-05-31 2010-02-03 北京中星微电子有限公司 一种音视频匹配方法及装置
CN107272318A (zh) * 2010-10-12 2017-10-20 罗盘互动有限公司 借助智能电话和音频水印的多种语言同步电影配音
CN106060424A (zh) * 2016-06-14 2016-10-26 徐文波 视频配音方法和装置

Also Published As

Publication number Publication date
CN108269597A (zh) 2018-07-10

Similar Documents

Publication Publication Date Title
CN105611404B (zh) 一种根据视频应用场景自动调节音频音量的方法及装置
US8185387B1 (en) Automatic gain control
US9269399B2 (en) Capture, syncing and playback of audio data and image data
CN108712624A (zh) 基于文字记录的录像存档装置及方法
CN100459685C (zh) 信息处理设备、成像设备及信息处理方法
CN102387292B (zh) 运动图像处理装置、运动图像再现装置、运动图像处理方法及运动图像再现方法
KR20070020252A (ko) 메시지를 수정하기 위한 방법 및 시스템
CN109274900A (zh) 一种视频配音方法
US11871084B2 (en) Systems and methods for displaying subjects of a video portion of content
US6625387B1 (en) Gated silence removal during video trick modes
WO2020215454A1 (zh) 一种屏幕录制的方法、客户端和终端设备
US8311657B2 (en) Method and apparatus for efficiently accounting for the temporal nature of audio processing
CN108269597B (zh) 一种音频工作站管理方法和系统
US8391669B2 (en) Video processing apparatus and video processing method
US9438945B1 (en) Method for continuously playing video clips without regeneration
JP4965371B2 (ja) 音声再生装置
CN109587543B (zh) 音频同步方法和装置及存储介质
CN111193864A (zh) 一种具有辅助拍摄功能的自动拍摄系统
WO2019140651A1 (zh) 视频处理方法及设备
JP6485238B2 (ja) タギング装置、タギングシステム、タギング方法及びプログラム
JP4742912B2 (ja) 画像音声記録装置、画像音声記録方法および画像音声記録制御プログラム
CN106792090B (zh) 一种智能视频播放的方法及装置
CN109905615B (zh) 一种音频播放和视频摄录的全自动协作方法
CN107562737B (zh) 一种用于翻译的视频分割方法及其系统
CN102110459A (zh) 一种播放终端及其多媒体文件的播放方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Room 206, building 6, UN commune, 135 Liuhe Road, Xihu District, Hangzhou City, Zhejiang Province, 310012

Patentee after: Zhejiang Haitai Rongzhi Acoustics Technology Co.,Ltd.

Address before: Room 206, building 6, UN commune, 135 Liuhe Road, Xihu District, Hangzhou City, Zhejiang Province, 310012

Patentee before: HANGZHOU HITECH ELECTRONIC CO.,LTD.