CN102348071A - 一种实现节目的字幕制作方法及系统 - Google Patents

一种实现节目的字幕制作方法及系统 Download PDF

Info

Publication number
CN102348071A
CN102348071A CN2011101479096A CN201110147909A CN102348071A CN 102348071 A CN102348071 A CN 102348071A CN 2011101479096 A CN2011101479096 A CN 2011101479096A CN 201110147909 A CN201110147909 A CN 201110147909A CN 102348071 A CN102348071 A CN 102348071A
Authority
CN
China
Prior art keywords
libretto
captions
user
sentence
little
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101479096A
Other languages
English (en)
Other versions
CN102348071B (zh
Inventor
余军
罗天
尚峰
王继正
黄奇志
罗檑
盖璐斯
黄海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Media &entertainment Group Co ltd
Shanghai Media Tech Co ltd
Chengdu Sobey Digital Technology Co Ltd
Original Assignee
SHANGHAI MEDIA GROUP Inc
Chengdu Sobey Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI MEDIA GROUP Inc, Chengdu Sobey Digital Technology Co Ltd filed Critical SHANGHAI MEDIA GROUP Inc
Priority to CN 201110147909 priority Critical patent/CN102348071B/zh
Publication of CN102348071A publication Critical patent/CN102348071A/zh
Application granted granted Critical
Publication of CN102348071B publication Critical patent/CN102348071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Circuits (AREA)

Abstract

本发明披露了一种实现节目的字幕制作方法及系统,涉及支持字幕离线制作的一工具平台,该方法包括:用户创建节目的字幕工程项目后,从素材资源管理器选择要进行字幕制作的视音频素材对象到时间线上;该工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,将生成的字幕文件归档字幕工程项目后保存到素材资源管理器。本发明的系统可部署在桌面办公站点或PC客户端中,字幕制作操作过程中无需连接节目生产网,而字幕制作的成果可通过专用网络或移动介质方式导入生产网。本发明提高了字幕制作效率,降低的节目部门使用后期制作设备的成本。

Description

一种实现节目的字幕制作方法及系统
技术领域
本发明涉及广播电视节目制作系统及方法,尤其涉及实现节目的字幕制作方法及系统。
背景技术
到目前为止,现有的生产网节目制作站点的字幕听写及同期字幕制作环节都是通过非线性编辑软件或字幕机进行的。
通过非线性编辑软件进行字幕听写及同期字幕制作,在后期制作流程中常会用到两种方式,一种方式是:节目制作人员利用录像机和监视器音箱等观看声音画面,然后同步地将同期字幕信息输入到文本文件中,通过非线性编辑后期制作环节将该文本文件引入一字幕模块,并在画面播放的过程中记录时码信息,即拍唱词;另一种方式则是:将需要加入唱词的视音频素材上载到节目制作系统,当对视音频素材完成节目时间线粗剪时,便开始通过字幕模块一边编写唱词一边上字幕,然后再进行细节调整。上述这两种制作方式的弊端是在其前期的字幕听写过程中操作不是很方便,效率较低,而且上字幕操作对后期制作设备资源的占用比例比较大,故相应的业务部门制作成本比较高。
通过在字幕机中进行字幕听写及同期字幕制作,并非是在后期制作环节中完成,而是在后期制作完成后通过专用的字幕机完成。这种方式由于不能在后期制作环节中完成,故其主要弊端是增加了额外的制作环节,因而延长了制作周期;另外,同期字幕操作对设备资源的占用比例比较大,当制作发生错误调整也不是很方便,制作效率也较低,且会对画面质量造成二次损失。
在节目后期制作过程中,比较大的一个工作量便体现在字幕听写环节上,往往一期节目唱词句数要数千句左右。对于工作量如此巨大的制作环节,非常需要针对以往的种种弊端加以改进,通过实现字幕听写的自动化,方便地进行操作,并提高工作效率及降低制作成本。
发明内容
本发明所要解决的技术问题是提供一种实现节目的字幕制作方法及系统,能够提高字幕听写的工作效率。
为了解决上述技术问题,本发明提供了一种实现节目的字幕制作方法,涉及支持字幕离线制作的一工具平台,该方法包括:
用户创建节目的字幕工程项目后,从素材资源管理器选择要进行字幕制作的视音频素材对象到时间线上;
该工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,将生成的字幕文件归档字幕工程项目后保存到素材资源管理器。
进一步地,该工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择字幕制作模式为自动断句模式,并在有唱词内容的情况下导入本地保存的唱词文本文件;
工具平台至少根据用户操作自动断句键自动对视音频素材中的音频波形进行断句操作,并在有唱词内容的情况下依据导入的唱词文本文件分布唱词句;
用户在无唱词内容的情况下通过对唱词编辑键和试播键的操作逐句编辑及试播编辑的唱词,直至完成所有唱词句的录制。
进一步地,在用户选择字幕制作模式为自动断句模式和工具平台自动进行断句操作之间,还包括:用户在断句参数设置界面设置相应的参数值,包括语速方案、停顿时间间隔、语音段时间间隔、基音频率阈值以及能量阈值中的一种或多种;
工具平台在用户导入唱词文本文件后,或在无唱词内容的情况下,除了根据自动断句键的操作外,还根据用户设置的参数值对音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作。
进一步地,该方法还包括:
用户将工具平台自动分布的唱词或用户手动编辑的唱词进行手动调节,包括选中及拖动所述唱词句,调整唱词句的入点时码和/或出点的时码位置。
进一步地,该工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择字幕制作模式为拍唱词模式,并导入或录入全部唱词内容,根据所述视音频素材设置和调整唱词的入点和/或出点的时码位置。
进一步地,用户根据视音频素材设置和调整唱词的入点和/或出点的时码位置,具体包括:
用户将准备好的唱词内容导入工具平台,或直接在工具平台的编辑窗口中录入唱词内容;
用户针对视音频素材的前后内容敲击两次双时码设置键,分别设置字幕的入点和出点的时码位置,或者敲击单时码设置键设置字幕的入点时码位置。
进一步地,该方法还包括:
当用户需对部分唱词内容进行修改和调整,则再次进入拍唱词模式,对唱词句进行修改后选中,点击双时码设置键或单时码设置键对修改的唱词句进行时码位置的调整;
当出现唱词句重叠时,根据用户设置平移或覆盖后面的唱词句。
进一步地,工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择字幕制作模式为听写模式,工具平台自动播放视音频素材;
对于常规录入,用户设置唱词的入点和/或出点的时码位置,并逐一在新增的唱词编辑行内写入听到的唱词句,直至完成所有唱词句的听写;
对于快速录入,用户设置唱词的入点和/或出点的时码位置,通过专用键盘快速输入听到的所有唱词句。
进一步地,
常规录入具体包括:
用户选择常规录入按钮,进入常规录入方式;在耳听视音频素材播放时用手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置;在用户新增唱词编辑行后进入唱词编辑而停止播放,用户直接在该编辑行中输入听到的唱词句;直至完成对所有唱词句的听写;
快速录入具体包括:
用户选择快速录入按钮,进入快速录入方式;在耳听视音频素材播放的过程中,用手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置,并通过专用键盘快速录入听到的所有唱词句。
进一步地,工具平台将生成的字幕文件归档字幕工程项目后保存到素材资源管理器,具体包括:
将生成的字幕文件导出并归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后,保存到素材资源管理器;
字幕文件中至少包括B类字幕,即在制作域基于相应的视音频节目的工程文件的时间线产生并保持完好的对应关系,被打包成独立的字幕工程文件,附属于相应的节目工程保存及传输。
为了解决上述技术问题,本发明提供了一种实现节目的字幕制作的平台系统,包括依次连接的字幕工程创建模块、字幕加工素材选择模块、字幕制作模块以及字幕工程文件归档模块,其中:
字幕工程创建模块,用于根据用户的请求创建节目的字幕工程项目;
字幕加工素材选择模块,用于基于创建的字幕工程项目及用户的操作,从素材资源管理器选择要进行字幕制作的视音频素材对象到时间线上;
字幕制作模块,用于根据用户选择的字幕制作模式进行相应模式的字幕制作,并输出生成的字幕文件;
字幕工程文件归档模块,用于将字幕制作模块输出的字幕文件归档到字幕工程创建模块创建的相应的字幕工程项目中,保存到素材资源管理器。
进一步地,字幕制作模块具体包括字幕制作模式选择单元,还包括自动断句操作单元、拍唱词操作单元以及唱词听写操作单元中的一种或多种,其中:
字幕制作模式选择单元,用于根据用户选择的自动断句模式调用自动断句操作单元,或根据用户选择的拍唱词模式调用拍唱词操作单元,或根据用户选择的听写模式调用听写操作单元;
自动断句操作单元,用于在字幕制作模式选择单元的调用下,对视音频素材中的音频波形进行断句操作,并依据导入的唱词文本文件分布唱词句;或根据用户操作的唱词编辑键和试播键逐句编辑及试播唱词,直至完成所有唱词句的录制;
拍唱词操作单元,用于在字幕制作模式选择单元的调用下,根据用户的操作导入或录入全部唱词,根据视音频素材设置和调整唱词的入点和/或出点的时码位置;
听写操作单元,用于在字幕制作模式选择单元的调用下,自动播放视音频素材,根据用户的操作设置唱词的入点和/或出点的时码位置,记录用户输入的唱词内容。
进一步地,
自动断句操作单元还提供设置断句参数界面,用于设置包括语速方案、停顿时间间隔、语音段时间间隔、基音频率阈值以及能量阈值中的一种或多种断句参数值;根据用户设置的所述断句参数值对所述音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作;
拍唱词操作单元在用户直接导入的所述唱词内容或在编辑窗口中录入唱词内容后,根据用户对视音频素材的前后内容敲击两次双时码记录设置键,分别记录用户设置的字幕的入点和出点的时码位置,或者根据用户对视音频素材的内容敲击单时码设置键,记录用户设置的字幕的入点时码位置;
听写操作单元根据用户的选择进入常规录入方式,在用户用手敲击两次双时码设置键或敲击单时码设置键时,记录用户设置的唱词句的入点和/或出点的时码位置;在用户新增唱词编辑行后停止所述播放,记录用户直接在该编辑行中输入的唱词句;或者,根据用户的选择进入快速录入方式,在用户手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置,并记录用户通过专用键盘快速录入听到的所有唱词句。
进一步地,
自动断句操作单元还根据用户选中及拖动的通过自动分布的唱词句或通过手动编辑的唱词句,记录用户针对唱词句调整的入点时码和/或出点时码的位置;
拍唱词操作单元在用户对所述唱词句进行修改并通过点击双时码设置键或单时码设置键对修改的唱词句进行时码位置的调整时,记录用户修改的唱词句及调整的时码位置;根据用户针对出现的唱词句重叠进行的设置平移或覆盖后面的唱词句。
进一步地,
字幕工程文件归档模块将字幕制作模块生成的字幕文件导出并归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后,保存到素材资源管理器;导出及归档的所述字幕文件至少包括B类字幕,即在制作域基于相应的视音频节目的工程文件的时间线产生并保持完好的对应关系,被打包成独立的字幕工程文件。
本发明提供的实现节目的字幕制作方法及系统,支持文本导入边看视频边听写字幕的方式、自动拍唱词、自动断句以及配置专用键盘实时地进行字幕听写的诸多功能;听写完毕的字幕可以绑定相应的元数据保存成非线性编辑字幕轨道数据,当在非编软件中拖拽素材时该字幕轨道数据自动上线,或在非编软件中直接导入听写字幕轨道,使得字幕细节调整及字幕特技编辑可在非性编辑中继续进行。本发明的字幕制作系统可部署在桌面办公站点或PC客户端中,字幕制作操作过程中无需连接节目生产网,而成果则可通过专用网络或移动介质方式导入生产网。本发明通过对同期字幕制作方式的改进,提高了字幕制作效率,降低的节目部门使用后期制作设备的成本。
附图说明
图1为本发明的实现节目的字幕制作方法实施例的流程图;
图2为图1所示方法实施例中自动断句模式下的参数设置界面实施例;
图3为图1所示方法实施例中依据选择的字幕制作模式进行相应操作实施例的流程图;
图4为本发明的实现节目的字幕制作系统实施例的结构框图。
具体实施方式
以下结合附图和优选实施例对本发明的技术方案进行详细地阐述。以下例举的实施例仅用于说明和解释本发明,而不构成对本发明技术方案的限制。
如图1所示,是本发明提供的实现节目的字幕制作方法实施例的流程,包括如下步骤:
100:创建节目的字幕工程项目;
在本发明的字幕制作工具平台上创建一字幕工程项目,该平台支持节目的字幕离线制作功能,需指明相关的素材资源管理器。
200:从素材资源管理器选择要添加字幕的视音频素材到时间线上;
通过上述字幕制作工具平台,从素材资源管理器上拖拽要进行字幕制作的视音频素材对象到时间线上。
300:根据选择的字幕制作模式进行相应的操作,将生成的字幕文件保存到素材资源管理器。
通过上述字幕制作工具平台可选择以下三种字幕听写模式中的任意一种:
(1)自动断句模式
自动断句模式是针对视音频素材中音频的波形图通过语音识别来判断应该断句位置。
为了达到自动断句的精确性,字幕制作工具平台具有自动断句参数设置功能,其设置界面如图2所示,可以设置停顿时间间隔、每段语音的时间间隔(即语音段时间间隔)、基音频率阈值以及能量阈值等参数值,主要用于在音频的波形图比较紧密的情况下能够根据设置的参数值精确断句。
自动断句的语速方案默认有三种方案:一般语速(标准语速方案)、较快语速以及较慢语速;自动断句模式又分为两种方式,有字幕内容和无字幕内容两种方式。
(2)拍唱词模式
拍唱词模式是预先将准备好的唱词内容导入,或者预先在在编辑窗口中录入唱词内容,针对视音频素材设置和记录每句唱词的时码入点和/或出点,从而实现拍唱词功能。
(3)听写模式
听写模式是一边播放视音频素材,一边通过添加的唱词编辑行录入从播放的视音频素材中听到的唱词内容,从而实现字幕听写功能。
生成的字幕文件中包括以下字幕类别中的任意一种:
A类字幕,可以直接合成在视音频素材的视频图像上并打包;
B类字幕,在制作域可以打包成独立的字幕工程文件,附属于节目工程保存及传输,在播出域完成与视音频节目图像的叠加播出;不论是在制作域或是在播出域,此字幕工程文件基于视音频节目工程文件的时间线产生,并与其保持完好的对应关系;该类字幕是本发明的字幕制作方法所特别支持的的一种字幕类别。
C类字幕,与B类字幕类似,但能进一步细分成不同版本的唱词层,可以按照不同的需要被调用,为将来互动式点播提供基础。
至于本发明的字幕制作工具平台如何根据选择的模式行相应的字幕听写操作,其实施例流程如图3所示,包括如下步骤:
301:选择自动断句模式,设置断句参数;根据是否有唱词内容分别进入步骤302、304执行;
选择字幕制作工具平台上的自动断句模式;
为了达到自动断句的精确性,可进入图2所示的断句参数设置界面设置相应的参数值,包括语速方案、停顿时间间隔、语音段时间间隔、基音频率阈值以及能量阈值中的一种或多种。
302:若有唱词内容,则导入本地保存的唱词文本文件;
用户选择所述字幕制作模式为自动断句模式,并在有唱词内容的情况下导入本地保存的唱词文本文件;
303:根据自动断句键和设置的断句参数通过语音识别技术对视音频素材进行断句操作,并辅以手调分布的唱词;执行步骤305;
在上述字幕制作工具平台上,当用户点按自动断句操作界面上的[自动断句]按钮或相应的快捷键,平台系统便根据设置的断句参数值针对视音频素材中的音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作,并在有唱词内容的情况下依据唱词文本文件分布唱词句。
平台系统在断句后可提供手动调整功能,用户针对已经分布好的唱词进行手调,包括选择唱词句、拖动选择的唱词句调整其位置,或者调整该唱词句的入、出点时码。
304:若无唱词内容,则根据自动断句键和设置的断句参数对视音频素材通过语音识别进行断句,通过唱词编辑键和试播键逐句编辑及试播唱词,直至完成所有唱词句的录制;
在上述字幕制作工具平台上,当用户点按自动断句操作界面上的[自动断句]按钮或相应的快捷键,平台系统便根据设置的断句参数值针对视音频素材中的音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作,注意此时断句后的唱词内容尚是空的,待用户手动编辑;
此后,用户按下[Ctrl+Home]键进入第一句唱词编辑行录入唱词内容;
在录入唱词后按下[B]键进入唱词播放状态,然后按下[TAB]键则重新进入唱词编辑状态;可反复使用[B]和[TAB]实现唱词的音频播放与唱词编辑状态的切换。
完成第一句唱词编辑后,按[Enter]键后便进入下一句唱词的编辑和播放,以此类推,通过以上同样的操作逐句进行唱词的编辑和播放,直至完成所有唱词的录制。
同样,用户可以对手动编辑的唱词进行手调,包括选择唱词句、拖动选择的唱词句调整其位置,或者调整该唱词句的入、出点时码。
305:将生成的字幕文件导出和/或与相应的视音频素材绑定后,保存到素材资源管理器,结束流程;
上述平台系统将自动断句生成的字幕文件导出归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后保存到素材资源管理器。
以上步骤是实现自动断句模式的字幕制作操作步骤。
311:选择拍唱词模式,导入或录入全部唱词,根据视音频素材设置和调整唱词的时码入/出点位置;
在上述字幕制作工具平台上,点按[拍唱词模式]按钮或相应的快捷键进入拍唱词模式,使得平台系统进入拍唱词模式;将准备好的唱词内容导入平台,或直接在平台的编辑窗口中录入唱词内容,针对据视音频素材前后敲击两次双时码设置键(譬如空格键),分别设置字幕的入、出点时码位置,敲击单时码设置键(譬如[Enter]键)则只设置字幕的入点时码位置。
拍唱词完成后,部分唱词内容可能需要被进一步修改和调整,可点击[拍唱词模式]按钮再次进入拍唱词模式,对唱词句进行修改,选中内容修改后的唱词句,点击空格键或[Enter]键则可进行时码位置的调整。
312:当出现唱词重叠现象时,根据设置平移或覆盖后面的唱词;
唱词修改完成后退出拍唱词模式时,如果出现唱词有重叠现象,则可根据设置重新平移或覆盖后面的唱词,以消除唱词重叠。
313:将生成的字幕文件导出,和/或与视音频素材绑定后,保存到素材资源管理器,结束流程;
上述平台系统将拍唱词生成的字幕文件导出归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后保存到素材资源管理器。
以上步骤是实现拍唱词模式的字幕制作操作步骤。
321:选择听写模式,自动进行视音频素材播放;对于常规录入和快速录入,可分别执行步骤322和323;
在上述字幕制作工具平台上,点击[听写模式]按钮便进入唱词听写模式,平台系统将自动对选择的视音频素材进行播放。
322:对于常规录入,设置唱词时码的入/出点位置,并逐一在新增的唱词编辑行内写入听到的唱词,直至完成所有唱词的听写,执行步骤324;
选择[常规录入]按钮,进入常规录入方式;在听视音频素材播放时敲击两次双时码设置键(譬如空格键)或敲击单时码设置键(如[Enter]键)设置唱词的入点和/或出点的时码位置;在新增唱词编辑行后进入唱词编辑而停止播放,可直接在该编辑行中输入听到的唱词内容;重复以上操作,便可完成对所有唱词内容的听写。
323:对于快速录入,设置唱词时码的入/出点位置,通过专用键盘快速输入所有听到的唱词;
选择[快速录入]按钮,进入快速录入方式;在听视音频素材播放的过程中,敲击两次空格键或[Enter]键设置唱词的入、出点时码位置,并通过专用键盘快速录入唱词内容。
324:将生成的字幕文件导出,和/或与视音频素材绑定后,保存到素材资源管理器,结束流程。
上述平台系统将听写唱词生成的字幕文件导出归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后保存到素材资源管理器。
以上步骤是实现听写模式的字幕制作操作步骤。
本发明根据上述方法实施例,相应地还提供了实现节目的字幕制作系统实施例,即前已述及的字幕制作工具平台系统,其结构如图4所示,包括依次连接的字幕工程创建模块、字幕加工素材选择模块、字幕制作模块以及字幕工程文件归档模块,其中:
字幕工程创建模块,用于根据用户的请求创建节目的字幕工程项目;
字幕加工素材选择模块,用于基于创建的字幕工程项目及用户的操作,从素材资源管理器选择要添加字幕的视音频素材到时间线上;
字幕制作模块,用于根据用户选择的字幕制作模式进行相应的操作,并输出生成的字幕文件;
字幕工程文件归档模块,用于将字幕制作模块输出的字幕文件归档到字幕工程创建模块创建的相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后保存到素材资源管理器。
在上述字幕制作系统实施例中,字幕制作模块进一步包括字幕制作模式选择单元,还包括自动断句操作单元、拍唱词操作单元以及唱词听写操作单元中的一种或多种;其中:
字幕制作模式选择单元,用于根据用户选择的自动断句模式调用自动断句操作单元,或根据用户选择的拍唱词模式调用拍唱词操作单元,或根据用户选择的听写模式调用听写操作单元;
自动断句操作单元,用于在字幕制作模式选择单元的调用下对视音频素材中的音频波形进行断句操作,并依据导入的唱词文本文件分布唱词句;或根据用户操作的唱词编辑键和试播键逐句编辑及试播唱词,直至完成所有唱词句的录制;
拍唱词操作单元,用于在字幕制作模式选择单元的调用下进入拍唱词模式,根据用户的操作导入或录入全部唱词,根据视音频素材设置和调整唱词的入/出点时码位置;在退出拍唱词模式时,根据用户的操作设置重新平移或覆盖后面的唱词;
听写操作单元,用于在字幕制作模式选择单元的调用下,根据用户的选择进入拍唱词常规录入或快速录入模式,并自动播放视音频素材;在常规录入方式下根据用户的操作设置唱词的入、出点时码位置,并新增唱词编辑行后停止播放视音频素材,并记录用户在每一编辑行中输入的唱词内容;在快速录入方式下根据用户的操作设置唱词的入/出点时码位置,并记录用户通过专用键盘快速输入所有的唱词。
对于本领域的专业人员来说,在了解了本发明内容和原理后,能够在不背离本发明的原理和范围的情况下,根据本发明的方法进行形式和细节上的各种修正和改变,但是这些基于本发明的修正和改变仍在本发明的权利要求保护范围之内。

Claims (15)

1.一种实现节目的字幕制作方法,涉及支持字幕离线制作的一工具平台,该方法包括:
用户创建节目的字幕工程项目后,从素材资源管理器选择要进行字幕制作的视音频素材对象到时间线上;
所述工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,将生成的字幕文件归档所述字幕工程项目后保存到所述素材资源管理器。
2.按照权利要求1所述的方法,其特征在于,所述工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择所述字幕制作模式为自动断句模式,并在有唱词内容的情况下导入本地保存的唱词文本文件;
所述工具平台至少根据用户操作自动断句键自动对所述视音频素材中的音频波形进行断句操作,并在有唱词内容的情况下依据导入的唱词文本文件分布唱词句;
用户在无唱词内容的情况下通过对唱词编辑键和试播键的操作逐句编辑及试播编辑的唱词,直至完成所有唱词句的录制。
3.按照权利要求2所述的方法,其特征在于,在用户选择所述字幕制作模式为自动断句模式和所述工具平台自动进行断句操作之间,还包括:用户在断句参数设置界面设置相应的参数值,包括语速方案、停顿时间间隔、语音段时间间隔、基音频率阈值以及能量阈值中的一种或多种;
所述工具平台在用户导入所述唱词文本文件后,或在无唱词内容的情况下,除了根据所述自动断句键的操作外,还根据用户设置的所述参数值对所述音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作。
4.按照权利要求3所述的方法,其特征在于,还包括:
用户将所述工具平台自动分布的唱词或用户手动编辑的唱词进行手动调节,包括选中及拖动所述唱词句,调整所述唱词句的入点时码和/或出点的时码位置。
5.按照权利要求1所述的方法,其特征在于,所述工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择所述字幕制作模式为拍唱词模式,并导入或录入全部唱词内容,根据所述视音频素材设置和调整所述唱词的入点和/或出点的时码位置。
6.按照权利要求5所述的方法,其特征在于,用户根据所述视音频素材设置和调整所述唱词的入点和/或出点的时码位置,具体包括:
用户将准备好的所述唱词内容导入所述工具平台,或直接在所述工具平台的编辑窗口中录入所述唱词内容;
用户针对视音频素材的前后内容敲击两次双时码设置键,分别设置字幕的入点和出点的时码位置,或者敲击单时码设置键设置字幕的入点时码位置。
7.按照权利要求6所述的方法,其特征在于,还包括:
当用户需对部分唱词内容进行修改和调整,则再次进入拍唱词模式,对唱词句进行修改后选中,点击所述双时码设置键或所述单时码设置键对修改的唱词句进行时码位置的调整;
当出现唱词句重叠时,根据用户设置平移或覆盖后面的唱词句。
8.按照权利要求1所述的方法,其特征在于,所述工具平台根据选择的字幕制作模式自动进行相应模式的字幕制作,具体包括:
用户选择所述字幕制作模式为听写模式,所述工具平台自动播放所述视音频素材;
对于常规录入,用户设置唱词的入点和/或出点的时码位置,并逐一在新增的唱词编辑行内写入听到的唱词句,直至完成所有唱词句的听写;
对于快速录入,用户设置唱词的入点和/或出点的时码位置,通过专用键盘快速输入听到的所有唱词句。
9.按照权利要求8所述的方法,其特征在于,
所述常规录入具体包括:
用户选择常规录入按钮,进入常规录入方式;在耳听视音频素材播放时用手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置;在用户新增唱词编辑行后进入唱词编辑而停止播放,用户直接在该编辑行中输入听到的唱词句;直至完成对所有唱词句的听写;
所述快速录入具体包括:
用户选择快速录入按钮,进入快速录入方式;在耳听视音频素材播放的过程中,用手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置,并通过专用键盘快速录入听到的所有唱词句。
10.按照权利要求1所述的方法,其特征在于,所述工具平台将生成的字幕文件归档所述字幕工程项目后保存到所述素材资源管理器,具体包括:
将生成的所述字幕文件导出并归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后,保存到所述素材资源管理器;
所述字幕文件中至少包括B类字幕,即在制作域基于相应的视音频节目的工程文件的时间线产生并保持完好的对应关系,被打包成独立的字幕工程文件,附属于相应的节目工程保存及传输。
11.一种实现节目的字幕制作的平台系统,包括依次连接的字幕工程创建模块、字幕加工素材选择模块、字幕制作模块以及字幕工程文件归档模块,其中:
字幕工程创建模块,用于根据用户的请求创建节目的字幕工程项目;
字幕加工素材选择模块,用于基于创建的字幕工程项目及用户的操作,从素材资源管理器选择要进行字幕制作的视音频素材对象到时间线上;
字幕制作模块,用于根据用户选择的字幕制作模式进行相应模式的字幕制作,并输出生成的字幕文件;
字幕工程文件归档模块,用于将字幕制作模块输出的字幕文件归档到字幕工程创建模块创建的相应的字幕工程项目中,保存到所述素材资源管理器。
12.按照权利要求11所述的平台系统,其特征在于,所述字幕制作模块具体包括字幕制作模式选择单元,还包括自动断句操作单元、拍唱词操作单元以及唱词听写操作单元中的一种或多种,其中:
字幕制作模式选择单元,用于根据用户选择的自动断句模式调用自动断句操作单元,或根据用户选择的拍唱词模式调用拍唱词操作单元,或根据用户选择的听写模式调用听写操作单元;
自动断句操作单元,用于在字幕制作模式选择单元的调用下,对所述视音频素材中的音频波形进行断句操作,并依据导入的唱词文本文件分布唱词句;或根据用户操作的唱词编辑键和试播键逐句编辑及试播唱词,直至完成所有唱词句的录制;
拍唱词操作单元,用于在字幕制作模式选择单元的调用下,根据用户的操作导入或录入全部唱词,根据视音频素材设置和调整唱词的入点和/或出点的时码位置;
听写操作单元,用于在字幕制作模式选择单元的调用下,自动播放视音频素材,根据用户的操作设置唱词的入点和/或出点的时码位置,记录用户输入的唱词内容。
13.按照权利要求12所述的平台系统,其特征在于,
所述自动断句操作单元还提供设置断句参数界面,用于设置包括语速方案、停顿时间间隔、语音段时间间隔、基音频率阈值以及能量阈值中的一种或多种断句参数值;根据用户设置的所述断句参数值对所述音频波形进行一般语速、稍慢语速以及稍快语速中任意一种断句操作;
所述拍唱词操作单元在用户直接导入的所述唱词内容或在编辑窗口中录入所述唱词内容后,根据用户对视音频素材的前后内容敲击两次双时码记录设置键,分别记录用户设置的字幕的入点和出点的时码位置,或者根据用户对视音频素材的内容敲击单时码设置键,记录用户设置的字幕的入点时码位置;
所述听写操作单元根据用户的选择进入常规录入方式,在用户用手敲击两次双时码设置键或敲击单时码设置键时,记录用户设置的唱词句的入点和/或出点的时码位置;在用户新增唱词编辑行后停止所述播放,记录用户直接在该编辑行中输入的唱词句;或者,根据用户的选择进入快速录入方式,在用户手敲击两次双时码设置键或敲击单时码设置键设置唱词句的入点和/或出点的时码位置,并记录用户通过专用键盘快速录入听到的所有唱词句。
14.按照权利要求13所述的平台系统,其特征在于,
所述自动断句操作单元还根据用户选中及拖动的通过自动分布的唱词句或通过手动编辑的唱词句,记录用户针对所述唱词句调整的入点时码和/或出点时码的位置;
所述拍唱词操作单元在用户对所述唱词句进行修改并通过点击所述双时码设置键或所述单时码设置键对修改的唱词句进行时码位置的调整时,记录所述用户修改的唱词句及调整的所述时码位置;根据用户针对出现的唱词句重叠进行的设置平移或覆盖后面的唱词句。
15.按照权利要求11至14任一项所述的平台系统,其特征在于,
所述字幕工程文件归档模块将所述字幕制作模块生成的所述字幕文件导出并归档到相应节目的字幕工程项目中,和/或将导出的字幕文件与相应的视音频素材绑定后,保存到所述素材资源管理器;导出及归档的所述字幕文件至少包括B类字幕,即在制作域基于相应的视音频节目的工程文件的时间线产生并保持完好的对应关系,被打包成独立的字幕工程文件。
CN 201110147909 2011-06-02 2011-06-02 一种实现节目的字幕制作方法及系统 Active CN102348071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110147909 CN102348071B (zh) 2011-06-02 2011-06-02 一种实现节目的字幕制作方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110147909 CN102348071B (zh) 2011-06-02 2011-06-02 一种实现节目的字幕制作方法及系统

Publications (2)

Publication Number Publication Date
CN102348071A true CN102348071A (zh) 2012-02-08
CN102348071B CN102348071B (zh) 2013-06-19

Family

ID=45546314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110147909 Active CN102348071B (zh) 2011-06-02 2011-06-02 一种实现节目的字幕制作方法及系统

Country Status (1)

Country Link
CN (1) CN102348071B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103423959A (zh) * 2012-05-03 2013-12-04 合肥美菱股份有限公司 一种通过语音管理冰箱的方法
CN107027067A (zh) * 2015-06-23 2017-08-08 讯飞智元信息科技有限公司 获取mv视频资源中字幕信息的方法及系统
CN110781649A (zh) * 2019-10-30 2020-02-11 中央电视台 一种字幕编辑方法、装置及计算机存储介质、电子设备
CN111901538A (zh) * 2020-07-23 2020-11-06 北京字节跳动网络技术有限公司 一种字幕生成方法、装置、设备及存储介质
CN113259767A (zh) * 2021-06-15 2021-08-13 北京新片场传媒股份有限公司 一种缩放音视频数据的方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1417798A (zh) * 2002-12-02 2003-05-14 北京贝尔科技发展有限公司 非线性编辑系统中字幕使用方法
CN1770262A (zh) * 2004-11-01 2006-05-10 英业达股份有限公司 语音显示系统及方法
US20080043996A1 (en) * 2006-08-07 2008-02-21 Dolph Blaine H Systems And Arrangements For Controlling Audio Levels Based On User Selectable Parameters
CN101540847A (zh) * 2008-03-21 2009-09-23 株式会社康巴思 字幕制作系统及字幕制作方法
CN102082916A (zh) * 2009-11-26 2011-06-01 新奥特(北京)视频技术有限公司 一种具有时码记录功能的字幕播控机

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1417798A (zh) * 2002-12-02 2003-05-14 北京贝尔科技发展有限公司 非线性编辑系统中字幕使用方法
CN1770262A (zh) * 2004-11-01 2006-05-10 英业达股份有限公司 语音显示系统及方法
US20080043996A1 (en) * 2006-08-07 2008-02-21 Dolph Blaine H Systems And Arrangements For Controlling Audio Levels Based On User Selectable Parameters
CN101540847A (zh) * 2008-03-21 2009-09-23 株式会社康巴思 字幕制作系统及字幕制作方法
CN102082916A (zh) * 2009-11-26 2011-06-01 新奥特(北京)视频技术有限公司 一种具有时码记录功能的字幕播控机

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103423959A (zh) * 2012-05-03 2013-12-04 合肥美菱股份有限公司 一种通过语音管理冰箱的方法
CN107027067A (zh) * 2015-06-23 2017-08-08 讯飞智元信息科技有限公司 获取mv视频资源中字幕信息的方法及系统
CN107027067B (zh) * 2015-06-23 2020-02-07 讯飞智元信息科技有限公司 获取mv视频资源中字幕信息的方法及系统
CN110781649A (zh) * 2019-10-30 2020-02-11 中央电视台 一种字幕编辑方法、装置及计算机存储介质、电子设备
CN110781649B (zh) * 2019-10-30 2023-09-15 中央电视台 一种字幕编辑方法、装置及计算机存储介质、电子设备
CN111901538A (zh) * 2020-07-23 2020-11-06 北京字节跳动网络技术有限公司 一种字幕生成方法、装置、设备及存储介质
WO2022017459A1 (zh) * 2020-07-23 2022-01-27 北京字节跳动网络技术有限公司 字幕生成方法、装置、设备及存储介质
CN111901538B (zh) * 2020-07-23 2023-02-17 北京字节跳动网络技术有限公司 一种字幕生成方法、装置、设备及存储介质
US11837234B2 (en) 2020-07-23 2023-12-05 Beijing Bytedance Network Technology Co., Ltd. Subtitle generation method and apparatus, and device and storage medium
CN113259767A (zh) * 2021-06-15 2021-08-13 北京新片场传媒股份有限公司 一种缩放音视频数据的方法、装置及电子设备
CN113259767B (zh) * 2021-06-15 2021-09-17 北京新片场传媒股份有限公司 一种缩放音视频数据的方法、装置及电子设备

Also Published As

Publication number Publication date
CN102348071B (zh) 2013-06-19

Similar Documents

Publication Publication Date Title
US7869892B2 (en) Audio file editing system and method
US9870796B2 (en) Editing video using a corresponding synchronized written transcript by selection from a text viewer
US9420394B2 (en) Panning presets
US9183887B2 (en) Interactive multimedia apparatus
CN1152335C (zh) 用于创建多媒体文件的创作设备和创作方法
CN102348071B (zh) 一种实现节目的字幕制作方法及系统
US8392004B2 (en) Automatic audio adjustment
JPH11162107A (ja) デジタルビデオ情報及びオーディオ情報を編集するためのシステム
MXPA05007300A (es) Metodo para crear y tener acceso a un menu para contenido de audio sin usar un dispositivo de representacion visual.
US20150098018A1 (en) Techniques for live-writing and editing closed captions
Audacity Audacity
CN103324513B (zh) 程序注释方法和装置
JP2013009218A (ja) 編集装置及び方法、並びにプログラム
WO2022093976A1 (en) Text-driven editor for audio and video editing
JPH0421055A (ja) 計算機ベース・音声/可視表示の発生と表示のシステム及び方法
US9477674B2 (en) Merging and splitting of media composition files
CN103718243A (zh) 增强的媒体录制和回放
JP2003037806A (ja) ノンリニア編集方法、ノンリニア編集装置、プログラム及びそのプログラムを格納した記録媒体
JP2005129971A (ja) 半自動型字幕番組制作システム
JP4124416B2 (ja) 半自動型字幕番組制作システム
JP3841815B2 (ja) 映像デ―タ編集方法
Nahmani Logic Pro X 10.3-Apple Pro Training Series: Professional Music Production
JP3906922B2 (ja) 編集システム
JP2000083194A (ja) 映像デ―タ編集方法
CN102768843A (zh) 一种用户可配置的编目的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHANGHAI MEDIA + ENTERTAIMENT GROUP CO., LTD.

Free format text: FORMER OWNER: SHANGHAI ORIENTAL MEDIA GROUP CO., LTD.

Effective date: 20150508

Owner name: SHANGHAI SMT MEDIA TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SHANGHAI MEDIA + ENTERTAIMENT GROUP CO., LTD.

Effective date: 20150508

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 200041 JING AN, SHANGHAI TO: 200223 SONGJIANG, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20150508

Address after: 200223 Shanghai City, Songjiang Caohejing Songjiang District hi tech park Xinzhuan Highway No. 518 building 23 Room 502 -39

Patentee after: SHANGHAI MEDIA TECH CO.,LTD.

Patentee after: Chengdu Sobey Digital Technology Co.,Ltd.

Address before: 200041 Weihai Road, Shanghai, No. 298, No.

Patentee before: SHANGHAI MEDIA &ENTERTAINMENT GROUP Co.,Ltd.

Patentee before: Chengdu Sobey Digital Technology Co.,Ltd.

Effective date of registration: 20150508

Address after: 200041 Weihai Road, Shanghai, No. 298, No.

Patentee after: SHANGHAI MEDIA &ENTERTAINMENT GROUP Co.,Ltd.

Patentee after: Chengdu Sobey Digital Technology Co.,Ltd.

Address before: 200041 Weihai Road, Shanghai, No. 298, No.

Patentee before: Shanghai Oriental Media Group Ltd.

Patentee before: Chengdu Sobey Digital Technology Co.,Ltd.