CN114554246A - 一种基于ugc模式的医疗科普视频制作方法及系统 - Google Patents
一种基于ugc模式的医疗科普视频制作方法及系统 Download PDFInfo
- Publication number
- CN114554246A CN114554246A CN202210166992.XA CN202210166992A CN114554246A CN 114554246 A CN114554246 A CN 114554246A CN 202210166992 A CN202210166992 A CN 202210166992A CN 114554246 A CN114554246 A CN 114554246A
- Authority
- CN
- China
- Prior art keywords
- video
- question
- ugc
- audio
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 33
- 201000010099 disease Diseases 0.000 claims abstract description 31
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 22
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 22
- 230000009467 reduction Effects 0.000 claims abstract description 18
- 230000001360 synchronised effect Effects 0.000 claims abstract description 16
- 230000007704 transition Effects 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims description 22
- 239000000872 buffer Substances 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 6
- 239000012536 storage buffer Substances 0.000 claims description 6
- 238000012552 review Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims 1
- 238000012805 post-processing Methods 0.000 abstract description 6
- 238000005520 cutting process Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
- H04N21/43072—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8547—Content authoring involving timestamps for synchronizing content
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供了一种基于UGC模式的医疗科普视频制作方法及系统,该方法包括:基于互联网的各类疾病问题进行汇总,建立UGC题库,医生基于UGC题库进行选题配置;建立拍摄模板,医生根据拍摄模板进行拍摄;将拍摄的视频文件进行音频标准化和音频降噪处理;对拍摄视频进行扒词处理并进行字幕与画面比对审核;字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;对剪辑并审核后的视频做片头片尾和水印合成;导出成片,并对成片进行最后审核后上传。本发明基于UGC模式,创新了一种更加简单直观的剪辑方式和视频后期处理模式,在不借助其他设备情况下,实现视频标准化创作。
Description
技术领域
本发明涉及视频制作技术领域,特别是涉及一种基于UGC模式的医疗科普视频制作方法及系统。
背景技术
相比于PGC(专业生产内容)模式的内容产出效率低下、过程漫长的特点,UGC(用户生产内容)模式可以通过广泛发动平台用户,按照平台内容产出要求,利用平台内容生产工具,快速的同时进行大量满足要求的内容产出工作,大大缩短内容生产时间。
目前,市场上广泛使用的UGC工具对内容后期处理方式存在巨大差异,如在短视频制作领域,使用UGC工具时对于拍摄后视频自动化处理上,视频制作者若是直接利用UGC工具完成拍摄,则工具只是提供了一种模板拍摄和自动剪辑工具来制作短视频,技术路线是为待拍摄目标设置拍摄模板和剪辑规则,再搭配其他动效完成制作过程;但作者如要追求个人作品的独特性,提升视频精彩程度,则需要通过其他设备完成拍摄并在平台以外设备上完成视频精剪后上传平台进行发布,而借助第三方设备进行剪辑,剪辑也是基于时间轴的方式,这同样会提升视频制作的门槛,增加后期处理难度。上述所提及的UGC模式主要被应用在泛娱乐、消费行业,在医疗健康行业内并无采用UGC模式向医生和科普专业人士提供科普视频自动化生产的工具;同时所提及的UGC工具除能提供一种模板拍摄和自动剪辑功能外,无法同时进行诸如:自动生成字幕、自动添加水印、音频标准化、音频降噪、自动合成片头片尾的功能。技术路线整体功能较为单一,成片可能存在音频标准不统一、噪声问题,且需后期手动添加字幕、片头片尾,增加了工作量。
科普领域,视频作者多为医生和科普专业人士,他们并非专业视频创作者,不具备专业的视频拍摄、剪辑以及后期处理的能力。用户对自我创作的视频质量要求越来越高与多数用户并不具备视频处理专业技能之间存在矛盾对立,所以需要一种能承接从视频拍摄到后期自动化处理的视频制作技术。
发明内容
本发明的目的是提供一种基于UGC模式的医疗科普视频制作方法及系统,基于UGC模式,创新了一种更加简单直观的剪辑方式和视频后期处理模式,在不借助其他设备情况下,实现视频标准化创作。
为实现上述目的,本发明提供了如下方案:
一种基于UGC模式的医疗科普视频制作方法,包括如下步骤:
S1,基于互联网的各类疾病问题进行汇总,建立UGC题库,医生基于UGC题库进行选题配置;
S2,基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板,医生根据拍摄模板进行拍摄;
S3,在拍摄过程中,同步将拍摄的视频文件进行音频标准化和音频降噪处理;
S4,对拍摄视频进行扒词处理并进行字幕与画面比对审核;
S5,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;
S6,对剪辑并审核后的视频做片头片尾和水印合成;
S7,导出成片,并对成片进行最后审核后上传。
进一步的,所述步骤S1中,基于互联网的各类疾病问题进行汇总,建立UGC题库,具体包括:
根据疾病问题固有的属性设置UGC题库表,包括科室、相关疾病、关键词、锁定开始时间、锁定截止时间、锁定的医生id的字段;
对各类疾病问题进行整理,包括数据内容、归类科室、打疾病标签、设置问题关键词处理,将整理后的疾病问题根据数据字段匹配导入到UGC题库中,其中UGC题库中,设置医生表包括医院、科室、擅长疾病字段。
进一步的,所述步骤S1中,医生基于UGC题库进行选题配置,具体包括:
根据医生的科室、擅长疾病来筛选过滤出问题数据作为可选列表;
医生在可选列表中跳过某个题目后,那跳过的题目将不在该医生的可选列表中展示;
医生在可选列表中选中问题后,则将该问题的绑定医生设置成该医生,这个问题就从所有医生与该问题有关的问题列表中剔除;
选中问题后,对该问题设置一个过期时间,时间截止日期内其他医生都无法绑定和回答该问题,问题截止日之后,如果问题没有被回答,则将问题的绑定id清空,截止时间也置空,该问题则会重新回到可选列表中;如果截止日之前,问题被回答,回答的内容会添加到回答表中进行审核,审核不通过,截止时间内,可重新回答该问题,如果截止时间后还没有重新回答,则该问题也会被系统释放,重新进到题库资源中供其他医生选题回答;回答的内容审核通过后,问题则被永久记录在该医生的回答列表之下,不再出现在UGC题库中。
进一步的,所述步骤S2还包括:
对已经拍摄结束的视频续拍问题,将后续多段视频与第一段视频重写整合编码,生成新文件。
进一步的,所述步骤S3中,同步将拍摄的视频文件进行音频标准化和音频降噪处理,具体包括:
对拍摄的视频文件按照预设的帧率、码率同时抽取一个音频对象和一个无音频的视频对象进行保存;
对音频对象进行解码得到音频帧数据,采样音频5帧噪音强度取平均值,作为估计出来的噪音样本,将完整音频频谱减去噪音样本的差值,得到降噪音频;
获取降噪音频的峰值响度,将峰值响度调整到特定大小,其他音频做对应的增减调整,再次处理响度过低的音频同样调整到特定大小后封装导出,最后将无音频的视频对象与降噪音量标准化后的音频对象合成为一个新文件。
进一步的,所述步骤S4中,对拍摄视频进行扒词处理并进行字幕与画面比对审核,具体包括:
基于拍摄视频,通过语音转文字后,对文字进行审核同时标记好字幕换行,生成字幕文本;
根据自有设计的字幕样式和字幕动画表现方式,对时间戳字幕文件进行调整校对,对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标;
对字幕文本统一设置字体、字号、颜色及字间距,对选定的关键字单独设置字号、颜色及字间距;
同时根据选定的关键字动画效果计算出在每行字幕起始点到结束点时间内字符坐标的移动轨迹,通过改变关键字的坐标、字号大小、旋转角度来实现关键字动画效果,对所有字幕行处理之后生成ass字幕文件并保存,然后把字幕ass文件和视频文件合成为一个硬字幕视频文件。
进一步的,所述对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标,具体包括:
以画布左上角为起点坐标X轴:0;Y轴:0;
Y轴坐标位置固定数值;
计算每个字的X轴坐标=字距画布左边距离+(字的宽/2);
根据Y轴坐标以及计算得到的每个字的X轴坐标,得到每个字坐标。
进一步的,所述步骤S5中,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核,具体包括:
基于整理后的字幕,解码视频文件并进行音视频分离得到画面帧数据、音频帧数据以及画面帧和音频帧的同步表;
获取音频中每个音节的起始时刻、终止时刻以及底噪或静音区,并构建文字与音频中音节的同步时间戳;
在剪辑窗口剪辑文字或者音频,再依据同步时间戳,同步剪辑画面帧数据、音频帧数据或者同步剪辑画面帧数据和文字;
将剪辑后的画面帧数据、音频帧数据以及文字进行封装导出,最后将视频和字幕再次合成后的视频重新上传。
本发明还提供了一种基于UGC模式的医疗科普视频制作系统,应用于上述的基于UGC模式的医疗科普视频制作方法,包括:
选题配置管理模块,用于基于互联网的各类疾病问题进行汇总,建立UGC题库,并供医生基于UGC题库进行选题配置;
模板拍摄模块,用于基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板;
音频处理模块,用于将拍摄的视频文件进行音频标准化和音频降噪处理;
字幕生成模块,用于对拍摄视频进行扒词处理并进行字幕与画面比对审核;
自动剪辑模块,用于将字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;
片头片尾和水印合成模块,用于对剪辑并审核后的视频做片头片尾和水印合成;
审核导出模块,用于导出成片,并对成片进行最后审核后上传。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于UGC模式的医疗科普视频制作方法及系统,医疗健康科普视频从选题配置管理、拍摄到后期解决音频标准化、音频降噪等问题,以及自动剪辑、自动生成字幕、自动添加水印、自动合成片头片尾到导出并上传成片的全流程、一体化生产系统,系统模块之间衔接紧密,配合连贯;本发明在医疗科普视频创作领域首创UGC模式自动化视频生产方法,极大的提升了该领域内容生产效率,更好的进行科普知识的推广,降低人工跟拍成本,方便医生根据自己的时间自行拍摄科普视频。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于UGC模式的医疗科普视频制作方法的流程示意图;
图2为本发明基于UGC模式的医疗科普视频制作系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于UGC模式的医疗科普视频制作方法,基于UGC模式,创新了一种更加简单直观的剪辑方式和视频后期处理模式,在不借助其他设备情况下,实现视频标准化创作。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的基于UGC模式的医疗科普视频制作方法,包括如下步骤:
S1,基于互联网的各类疾病问题进行汇总,建立UGC题库,医生基于UGC题库进行选题配置;
S2,基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板,医生根据拍摄模板进行拍摄;对已经拍摄结束的视频续拍问题,会把后续多段视频与第一段视频重写整合编码,生成新文件,提高拍摄效率;预拍摄视频参数可自由配置,提升视频事件内容完整性,兼容不同型号智能终端设备,根据系统指定最佳美颜模板生成规范化视频素材;
S3,在拍摄过程中,同步将拍摄的视频文件进行音频标准化和音频降噪处理;
S4,对拍摄视频进行扒词处理并进行字幕与画面比对审核;
S5,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;
S6,对剪辑并审核后的视频做片头片尾和水印合成;
S7,导出成片,并对成片进行最后审核后上传。
其中,所述步骤S1中,基于互联网的各类疾病问题进行汇总,建立UGC题库,具体包括:
根据疾病问题固有的属性设置UGC题库表,包括科室、相关疾病、关键词、锁定开始时间、锁定截止时间、锁定的医生id的字段;
对各类疾病问题进行整理,包括数据内容、归类科室、打疾病标签、设置问题关键词处理,将整理后的疾病问题根据数据字段匹配导入到UGC题库中,其中UGC题库中,设置医生表包括医院、科室、擅长疾病字段。
所述步骤S1中,医生基于UGC题库进行选题配置,具体包括:
根据医生的科室、擅长疾病来筛选过滤出问题数据作为可选列表;
医生在可选列表中跳过某个题目后,那跳过的题目将不在该医生的可选列表中展示;
医生在可选列表中选中问题后,则将该问题的绑定医生设置成该医生,这个问题就从所有医生与该问题有关的问题列表中剔除;
选中问题后,对该问题设置一个过期时间,时间截止日期内其他医生都无法绑定和回答该问题,问题截止日之后,如果问题没有被回答,则将问题的绑定id清空,截止时间也置空,该问题则会重新回到可选列表中;如果截止日之前,问题被回答,回答的内容会添加到回答表中进行审核,审核不通过,截止时间内,可重新回答该问题,如果截止时间后还没有重新回答,则该问题也会被系统释放,重新进到题库资源中供其他医生选题回答;回答的内容审核通过后,问题则被永久记录在该医生的回答列表之下,不再出现在UGC题库中。
其中,所述步骤S3中,同步将拍摄的视频文件进行音频标准化和音频降噪处理,具体包括:
对拍摄的视频文件按照预设的帧率、码率同时抽取一个音频对象和一个无音频的视频对象进行保存;
对音频对象进行解码得到音频帧数据,采样音频5帧噪音强度取平均值,作为估计出来的噪音样本,将完整音频频谱减去噪音样本的差值,得到降噪音频;
获取降噪音频的峰值响度,将峰值响度调整到特定大小(削峰),其他音频做对应的增减调整,再次处理响度过低的音频同样调整到特定大小(填谷)后封装导出,最后将无音频的视频对象与降噪音量标准化后的音频对象合成为一个新文件。
所述步骤S4中,对拍摄视频进行扒词处理并进行字幕与画面比对审核,具体包括:
基于拍摄视频,通过语音转文字后,对文字进行审核同时标记好字幕换行,生成字幕文本;
根据自有设计的字幕样式和字幕动画表现方式,对时间戳字幕文件进行调整校对,对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标;
对字幕文本统一设置字体、字号、颜色及字间距,对选定的关键字单独设置字号、颜色及字间距;
同时根据选定的关键字动画效果计算出在每行字幕起始点到结束点时间内字符坐标的移动轨迹,通过改变关键字的坐标、字号大小、旋转角度来实现关键字动画效果,对所有字幕行处理之后生成ass字幕文件并保存,然后把字幕ass文件和视频文件合成为一个硬字幕视频文件。
其中,所述对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标,具体包括:
以画布左上角为起点坐标X轴:0;Y轴:0;
Y轴坐标位置固定数值;
计算每个字的X轴坐标=字距画布左边距离+(字的宽/2);
根据Y轴坐标以及计算得到的每个字的X轴坐标,得到每个字坐标。
此外,还可以通过在字幕文字下叠字并加大叠字字号、改变叠字颜色的方式实现多层描边效果。
其中,所述步骤S5中,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核,具体包括:
基于整理后的字幕,解码视频文件并进行音视频分离得到画面帧数据、音频帧数据以及画面帧和音频帧的同步表;
获取音频中每个音节的起始时刻、终止时刻以及底噪或静音区,并构建文字与音频中音节的同步时间戳;
在剪辑窗口剪辑文字或者音频,再依据同步时间戳,同步剪辑画面帧数据、音频帧数据或者同步剪辑画面帧数据和文字;
将剪辑后的画面帧数据、音频帧数据以及文字进行封装导出,最后将视频和字幕再次合成后的视频重新上传。
视频合成方案为:对每段视频进行编码,保证每个视频编码统一,拿到视频文件得视频流,然后拿到音频文件的音频流,根据时间戳一帧一帧的封装成一个新的视频文件;
视频合成先决条件:
视频:视频画面大小一致视频SAR、DAR一致视频帧率一致
音频:采样率一致时间长度和视频保持一致(如不一致,需要用静默音频填充)。
所述步骤S6中,首先给720×720的正方形的贴纸增加一个1440×1440的透明画布(因为由于贴纸旋转,最长边会发生变化,最长边最大值是正方形的对角线,约等于边长的1.414倍,为了方便计算,透明画布设计为2倍),并移动贴纸至画布中心位置,此时贴纸中心发生偏移。通过用户端传来的数据做反向偏移,从而将贴纸定位至视频中的准确位置。
动画:由设计人员提前设计出几种贴纸的运动轨迹,
时间:根据用户终端传来的数据,获知贴纸的显示时间,沿着时间轴将所用素材按照显示时间嵌入成组的帧中;
声音音效合成处理:抽取视频中的音效,根据贴纸显示的时间,将贴纸的声音特效混合入原视频中的音效,实现在贴纸出现的时刻有特效声音的播放。
如图2所示,本发明还提供了一种基于UGC模式的医疗科普视频制作系统,应用于上述的基于UGC模式的医疗科普视频制作方法,包括:
选题配置管理模块,用于基于互联网的各类疾病问题进行汇总,建立UGC题库,并供医生基于UGC题库进行选题配置;
模板拍摄模块,用于基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板;
音频处理模块,用于将拍摄的视频文件进行音频标准化和音频降噪处理;
字幕生成模块,用于对拍摄视频进行扒词处理并进行字幕与画面比对审核;
自动剪辑模块,用于将字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;
片头片尾和水印合成模块,用于对剪辑并审核后的视频做片头片尾和水印合成;
审核导出模块,用于导出成片,并对成片进行最后审核后上传。
所述系统还包括服务端,医生通过用户终端完成医疗科普视频拍摄,用户终端与服务端的管理服务器建立通信,根据负载均衡原则选择视频服务器并指定合成服务器,所述视频服务器接收用户视频,将所述用户视频汇总到所述合成服务器,根据用户设置的参数合成所述用户视频,将合成后的合成视频回传到视频服务器,将所述合成视频转发给用户终端。
用户端可以基于Canvas绘制视频关键帧呈现绘制画布,可向画布中添加贴纸效果,涉及前端开发技术领域:
1.根据不同终端设备屏幕分辨率,按照视频16:9的比例设置视频画布的尺寸;
2.基于Canvas组件,利用视频的暂停/播放交互事件,获取当前视频的播放时间,将视频的关键帧动态地输出到画布,完成视频画布的初始化;
3.参照demo视频中的字幕大小、位置,根据HTML的元素的定位属性,按等比例渲染到视频画布中,保证了贴纸元素最后在成品视频中的定位一致。
4.利用Canvas中贴纸元素的2D定位属性(HTML5标准中Canvas上各个元素的定位属性),将元素的与视频左边缘距离、与视频上边缘距离、宽度信息、高度信息、旋转角度及系统提供随机的动画效果,传递给系统接口。
本发明提供的基于UGC模式的医疗科普视频制作方法及系统,医疗健康科普视频从选题配置管理、拍摄到后期解决音频标准化、音频降噪等问题,以及自动剪辑、自动生成字幕、自动添加水印、自动合成片头片尾到导出并上传成片的全流程、一体化生产系统,系统模块之间衔接紧密,配合连贯;本发明在医疗科普视频创作领域首创UGC模式自动化视频生产方法,极大的提升了该领域内容生产效率,更好的进行科普知识的推广,降低人工跟拍成本,方便医生根据自己的时间自行拍摄科普视频。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种基于UGC模式的医疗科普视频制作方法,其特征在于,包括以下步骤:
S1,基于互联网的各类疾病问题进行汇总,建立UGC题库,医生基于UGC题库进行选题配置;
S2,基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板,医生根据拍摄模板进行拍摄;
S3,在拍摄过程中,同步将拍摄的视频文件进行音频标准化和音频降噪处理;
S4,对拍摄视频进行扒词处理并进行字幕与画面比对审核;
S5,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核;
S6,对剪辑并审核后的视频做片头片尾和水印合成;
S7,导出成片,并对成片进行最后审核后上传。
2.根据权利要求1所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S1中,基于互联网的各类疾病问题进行汇总,建立UGC题库,具体包括:
根据疾病问题固有的属性设置UGC题库表,包括科室、相关疾病、关键词、锁定开始时间、锁定截止时间、锁定的医生id的字段;
对各类疾病问题进行整理,包括数据内容、归类科室、打疾病标签、设置问题关键词处理,将整理后的疾病问题根据数据字段匹配导入到UGC题库中,其中UGC题库中,设置医生表包括医院、科室、擅长疾病字段。
3.根据权利要求2所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S1中,医生基于UGC题库进行选题配置,具体包括:
根据医生的科室、擅长疾病来筛选过滤出问题数据作为可选列表;
医生在可选列表中跳过某个题目后,那跳过的题目将不在该医生的可选列表中展示;
医生在可选列表中选中问题后,则将该问题的绑定医生设置成该医生,这个问题就从所有医生与该问题有关的问题列表中剔除;
选中问题后,对该问题设置一个过期时间,时间截止日期内其他医生都无法绑定和回答该问题,问题截止日之后,如果问题没有被回答,则将问题的绑定id清空,截止时间也置空,该问题则会重新回到可选列表中;如果截止日之前,问题被回答,回答的内容会添加到回答表中进行审核,审核不通过,截止时间内,可重新回答该问题,如果截止时间后还没有重新回答,则该问题也会被系统释放,重新进到题库资源中供其他医生选题回答;回答的内容审核通过后,问题则被永久记录在该医生的回答列表之下,不再出现在UGC题库中。
4.根据权利要求1所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S2还包括:
对已经拍摄结束的视频续拍问题,将后续多段视频与第一段视频重写整合编码,生成新文件。
5.根据权利要求1所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S3中,同步将拍摄的视频文件进行音频标准化和音频降噪处理,具体包括:
对拍摄的视频文件按照预设的帧率、码率同时抽取一个音频对象和一个无音频的视频对象进行保存;
对音频对象进行解码得到音频帧数据,采样音频5帧噪音强度取平均值,作为估计出来的噪音样本,将完整音频频谱减去噪音样本的差值,得到降噪音频;
获取降噪音频的峰值响度,将峰值响度调整到特定大小,其他音频做对应的增减调整,再次处理响度过低的音频同样调整到特定大小后封装导出,最后将无音频的视频对象与降噪音量标准化后的音频对象合成为一个新文件。
6.根据权利要求1所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S4中,对拍摄视频进行扒词处理并进行字幕与画面比对审核,具体包括:
基于拍摄视频,通过语音转文字后,对文字进行审核同时标记好字幕换行,生成字幕文本;
根据自有设计的字幕样式和字幕动画表现方式,对时间戳字幕文件进行调整校对,对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标;
对字幕文本统一设置字体、字号、颜色及字间距,对选定的关键字单独设置字号、颜色及字间距;
同时根据选定的关键字动画效果计算出在每行字幕起始点到结束点时间内字符坐标的移动轨迹,通过改变关键字的坐标、字号大小、旋转角度来实现关键字动画效果,对所有字幕行处理之后生成ass字幕文件并保存,然后把字幕ass文件和视频文件合成为一个硬字幕视频文件。
7.根据权利要求6所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述对每行字幕进行时间微调,并根据每行字幕的字数和关键字计算出每个字坐标,具体包括:
以画布左上角为起点坐标X轴:0;Y轴:0;
Y轴坐标位置固定数值;
计算每个字的X轴坐标=字距画布左边距离+(字的宽/2);
根据Y轴坐标以及计算得到的每个字的X轴坐标,得到每个字坐标。
8.根据权利要求1所述的基于UGC模式的医疗科普视频制作方法,其特征在于,所述步骤S5中,字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核,具体包括:
基于整理后的字幕,解码视频文件并进行音视频分离得到画面帧数据、音频帧数据以及画面帧和音频帧的同步表;
获取音频中每个音节的起始时刻、终止时刻以及底噪或静音区,并构建文字与音频中音节的同步时间戳;
在剪辑窗口剪辑文字或者音频,再依据同步时间戳,同步剪辑画面帧数据、音频帧数据或者同步剪辑画面帧数据和文字;
将剪辑后的画面帧数据、音频帧数据以及文字进行封装导出,最后将视频和字幕再次合成后的视频重新上传。
9.一种基于UGC模式的医疗科普视频制作系统,应用于权利要求1-8任一所述的基于UGC模式的医疗科普视频制作方法,其特征在于,包括:
选题配置管理模块,用于基于互联网的各类疾病问题进行汇总,建立UGC题库,并供医生基于UGC题库进行选题配置;
模板拍摄模块,用于基于智能终端拍摄设备,固定人型框调用系统API录制,输出数据暂存缓冲区,利用智能美化特效技术,重编码缓冲数据,生成有效数据到目标路径,最后释放缓冲区,建立拍摄模板;
音频处理模块,用于将拍摄的视频文件进行音频标准化和音频降噪处理;
字幕生成模块,用于对拍摄视频进行扒词处理并进行字幕与画面比对审核;
自动剪辑模块,用于将字幕添加至视频进行合成,将合成后视频上传智能剪辑云平台,根据需要进行转场剪辑,对剪辑后视频再次进行声画同步审核。
片头片尾和水印合成模块,用于对剪辑并审核后的视频做片头片尾和水印合成;
审核导出模块,用于导出成片,并对成片进行最后审核后上传。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210166992.XA CN114554246B (zh) | 2022-02-23 | 一种基于ugc模式的医疗科普视频制作方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210166992.XA CN114554246B (zh) | 2022-02-23 | 一种基于ugc模式的医疗科普视频制作方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114554246A true CN114554246A (zh) | 2022-05-27 |
CN114554246B CN114554246B (zh) | 2024-05-31 |
Family
ID=
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109257547A (zh) * | 2018-09-21 | 2019-01-22 | 南京邮电大学 | 中文在线音视频的字幕生成方法 |
CN109559830A (zh) * | 2018-09-30 | 2019-04-02 | 西南医科大学附属医院 | 基于医学标准问题库的智能检验咨询系统及其实现方法 |
CN109729288A (zh) * | 2018-12-17 | 2019-05-07 | 广州城市职业学院 | 一种短视频生成装置及方法 |
CN109889882A (zh) * | 2019-01-24 | 2019-06-14 | 北京亿幕信息技术有限公司 | 一种视频剪辑合成方法和系统 |
CN110300274A (zh) * | 2018-03-21 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 视频文件的录制方法、装置及存储介质 |
CN110336959A (zh) * | 2019-07-17 | 2019-10-15 | 合肥海拔网络科技有限公司 | 一种原创视频自动化处理方法 |
CN111048215A (zh) * | 2019-12-13 | 2020-04-21 | 北京纵横无双科技有限公司 | 一种基于crm的医疗视频制作方法及系统 |
CN113518242A (zh) * | 2021-09-15 | 2021-10-19 | 秒影工场(北京)科技有限公司 | 基于模板拍摄和自动剪辑的短视频制作方法及装置 |
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110300274A (zh) * | 2018-03-21 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 视频文件的录制方法、装置及存储介质 |
CN109257547A (zh) * | 2018-09-21 | 2019-01-22 | 南京邮电大学 | 中文在线音视频的字幕生成方法 |
CN109559830A (zh) * | 2018-09-30 | 2019-04-02 | 西南医科大学附属医院 | 基于医学标准问题库的智能检验咨询系统及其实现方法 |
CN109729288A (zh) * | 2018-12-17 | 2019-05-07 | 广州城市职业学院 | 一种短视频生成装置及方法 |
CN109889882A (zh) * | 2019-01-24 | 2019-06-14 | 北京亿幕信息技术有限公司 | 一种视频剪辑合成方法和系统 |
CN110336959A (zh) * | 2019-07-17 | 2019-10-15 | 合肥海拔网络科技有限公司 | 一种原创视频自动化处理方法 |
CN111048215A (zh) * | 2019-12-13 | 2020-04-21 | 北京纵横无双科技有限公司 | 一种基于crm的医疗视频制作方法及系统 |
CN113518242A (zh) * | 2021-09-15 | 2021-10-19 | 秒影工场(北京)科技有限公司 | 基于模板拍摄和自动剪辑的短视频制作方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990350B2 (en) | Videos associated with cells in spreadsheets | |
Li et al. | Fundamentals of multimedia | |
US7362946B1 (en) | Automated visual image editing system | |
CN1152335C (zh) | 用于创建多媒体文件的创作设备和创作方法 | |
DE602004001896T2 (de) | Gerät und Verfahren zur Umwandlung von Multimedia-Inhalten | |
US8275814B2 (en) | Method and apparatus for encoding/decoding signal | |
JP2003179849A (ja) | ビデオコラージュの作成方法および装置、ビデオコラージュ、ビデオコラージュ・ユーザ・インタフェース、ビデオコラージュ作成プログラム | |
US20180226101A1 (en) | Methods and systems for interactive multimedia creation | |
WO2018120819A1 (zh) | 一种演示文稿的制作方法和装置 | |
CN107402985A (zh) | 视频特效输出控制方法、装置及计算机可读存储介质 | |
CN111930289B (zh) | 一种处理图片和文本的方法和系统 | |
WO2018120820A1 (zh) | 一种演示文稿的制作方法和装置 | |
CN106790558B (zh) | 一种影片多版本整合存储和提取系统 | |
Matthews et al. | VideoScheme: a programmable video editing systems for automation and media recognition | |
JP2001024610A (ja) | 自動番組制作装置および自動番組制作プログラムを記録した記録媒体 | |
JP2003109022A (ja) | 図書製作システムと図書製作方法 | |
CN114554246A (zh) | 一种基于ugc模式的医疗科普视频制作方法及系统 | |
CN114554246B (zh) | 一种基于ugc模式的医疗科普视频制作方法及系统 | |
JP2020129189A (ja) | 動画編集サーバおよびプログラム | |
Hazel et al. | Transcription linking software: integrating the ephemeral and the fixed in interaction research | |
CN111918146B (zh) | 一种视频合成方法和系统 | |
KR20010035099A (ko) | 장면 전환 자동 검출을 이용한 스트리밍 하이퍼비디오시스템 및 그 제어 방법 | |
KR20060030179A (ko) | 전자 만화 및 그 제작방법 | |
CN115250372A (zh) | 视频处理方法、装置、设备及计算机可读存储介质 | |
JP2007519068A (ja) | 変換技術を用いて意味記述を生成するコンピュータによる計算方法及びコンピュータシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |