CN113973229B - 一种处理视频中口误的在线剪辑方法 - Google Patents
一种处理视频中口误的在线剪辑方法 Download PDFInfo
- Publication number
- CN113973229B CN113973229B CN202110919101.9A CN202110919101A CN113973229B CN 113973229 B CN113973229 B CN 113973229B CN 202110919101 A CN202110919101 A CN 202110919101A CN 113973229 B CN113973229 B CN 113973229B
- Authority
- CN
- China
- Prior art keywords
- file
- subfiles
- voice
- video
- stream file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 title claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims 1
- 241000220317 Rosa Species 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000010753 nasal discharge Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Circuits (AREA)
Abstract
本发明属于在线视频编辑领域,尤其是涉及一种处理视频中口误的在线剪辑方法。一种处理视频中口误的在线剪辑方法,其中包括步骤:将每段文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对语音子文件进行修改或删除后生成新音频流文件;根据被标记的语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;将新音频流文件和新视频纯画面流文件合并成新执行文件。通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化程度。
Description
技术领域
本发明属于在线视频编辑领域,尤其是涉及一种处理视频中口误的在线剪辑方法。
背景技术
目前视频剪辑中,对于口误的处理,基本上还是依托于线下人工剪辑,一般使用Adobe Premiere,After Effects等软件,这些软件都提供了根据音频段裁切视频段的功能对视频口误进行处理。在此过程中需要将视频从头到尾观看一遍,确定口误点进行处理,非常耗时。
同时市场上也有一些视频在线剪辑的平台,比如腾讯的腾讯云剪、美摄科技的云剪辑平台,这些平台的操作性比较简单,能快速对视频的图像层进行素材叠加,从而达到视频剪辑的要求,但功能上不支持口误处理,剪辑人员需要线下先对视频预先处理。所以我们需要设计一直能在线编辑处理口误的在线剪辑方法。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种处理视频中口误的在线剪辑方法,可以在线进行口误处理,过程中不需要视频剪辑人员再从头检测口误。
为实现上述目的,本发明提供了如下技术方案:
一种处理视频中口误的在线剪辑方法,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记;
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件;
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件。
作为本技术方案的优选,所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息;
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名;
S2.3,获取所述语音子文件内声音频率变化信息,根据所述匹配句式模型获得所述语音子文件的句式类型信息;
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名。
作为本技术方案的优选,所述预设分段特征参数包括声音停顿时长、每个发音的音频数值。
作为本技术方案的优选,所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件。
作为本技术方案的优选,所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件;
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件。
作为本技术方案的优选,所述S3.2中当对比结果为不相同时,且不同率小于5%时:
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本。
作为本技术方案的优选,所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。
作为本技术方案的优选,所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。
作为本技术方案的优选,根据时间顺序对所述视频画面流子文件进行命名。
作为本技术方案的优选,所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。
通过实施上述技术方案,本发明具有如下的优点:
本发明通过语音识别从被执行文件中获得语音子文件,通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化程度。
附图说明
图1为本发明一种处理视频中口误的在线剪辑方法的流程图;
图2为本发明述S2中具体的流程图;
图3为本发明中S3的具体流程图;
图4为本发明中S3的判断逻辑图;
图5为本发明中标准字幕子文件的获取方法的流程图;
图6为本发明中S4的具体流程图。
具体实施方式
以下结合具体的实施例和实验数据对本发明做进一步的说明。应理解,本发明的实施例只用于说明本发明而非限制本发明,在不脱离本发明技术思想的情况下,根据本领域普通技术知识和惯用手段,做出的各种替换和变更,均应包括在本发明的范围内。
实施例
如图1-6所示,一种处理视频中口误的在线剪辑方法,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记。
在实际操作时,将被执行文件(这里的所述被执行文件为包含音频和画面的原始视频文件)先被分解成音频流文件和视频画面流文件。接下来将音频流文件通过预设分句特征参数进行分句,将整段的视频细分为每段包含一个完整句子的语音子文件,获得语音子文件中的文本内容,生成文字识别子文本,并按时间顺序进行命名。
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件。
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件。
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件。
本发明通过语音识别从被执行文件中获得语音子文件,通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化。
所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息。
一般在朗读文段时,在完成一句完整的句子后会有短暂停顿,在0.8秒至1.1秒之间。标点符号的停顿规律一般是:句号、问号、感叹号、省略号停顿略长于分号、破折号、连接号;分号、破折号、连接号的停顿时间又长于逗号、冒号;逗号、冒号的停顿时间又长于顿号、间隔号。另外,在作品上的段落之间,停顿的时间要比一般的句号时间长些。
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名。
如“三场小组赛,进6球,失17球,让人吃惊。4月份还在绝境下逆转淘汰A国队,获得奥运会入场券的B国女足,那支让C市看台上老爷们痛哭流涕的铿锵玫瑰去哪了?”将通过语音识别后划分成包含内容为“三场小组赛,进6球,失17球,让人吃惊。”、“4月份还在绝境下逆转淘汰A国队,获得奥运会入场券的B国女足,那支让苏州看台上老爷们痛哭流涕的铿锵玫瑰去哪了?”的两个语音子文件,并根据时间信息按顺序命名成文件名为“语音子文件1”和“语音子文件2”的语音子文件。
S2.3,获取所述语音子文件内声音频率变化信息,根据所述匹配句式模型获得所述语音子文件的句式类型信息。
在说话演讲叙述时,在不同句式时演讲者会根据需要发出不同声调变化,在音频中则体现在整句话时间内的声音频率变化,根据实际的声音频率变化去匹配句式模型,获得语音子文件的句式类型信息。如陈述句的句式模型中声音频率变化形状类似于局有厚度的平面;反问句的句式模型中声音频率变化形状类似于具有初始厚度平面后连接趋势为斜向上带有厚度的鞋面;感叹句的句式模型中声音频率变化形状类似于具有明显向上凸出的几何体构造。
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名。
所述预设分段特征参数包括声音停顿时长、每个发音的音频数值。
所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件。
所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件。如被执行文件的名称为“女足怎么了”,则从标准字幕文件库中匹配到文件名匹配的标准字幕文件。或者更优选的,提取被执行文件的作者信息以及上传时间信息,从从标准字幕文件库中匹配到在预设时间段内相同作者上传的标准字幕文件。
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件。
进一步的,所述S3.2中当对比结果为不相同时,且不同率小于5%时:此时可能发生的情况为口误,可能是发错字音或用错词
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本。
或者,在另一种情况下:
所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:此时可能发生的情况为不同句式替换,但表达内容实质相同
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。有句式错误或整句的错误情况下,删除对应的语句的音频和视频,但在后期错误提示中提示句子序号,以便操作人员重录该段以便修改正确后上传。
所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。根据时间顺序对所述视频画面流子文件进行命名。
所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。
Claims (4)
1.一种处理视频中口误的在线剪辑方法,其特征在于,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记;
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件;
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件;
所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息;
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名;
S2.3,获取所述语音子文件内声音频率变化信息,根据匹配句式模型获得所述语音子文件的句式类型信息;
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名;
所述预设分段特征参数包括声音停顿时长、每个发音的音频数值;
所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件;
所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件;
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件;
所述S3.2中当对比结果为不相同时,且不同率小于5%时:
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本;
所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。
2.根据权利要求1所述的一种处理视频中口误的在线剪辑方法,其特征在于,所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。
3.根据权利要求2所述的一种处理视频中口误的在线剪辑方法,其特征在于,根据时间顺序对所述视频画面流子文件进行命名。
4.根据权利要求3所述的一种处理视频中口误的在线剪辑方法,其特征在于,所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919101.9A CN113973229B (zh) | 2021-08-11 | 2021-08-11 | 一种处理视频中口误的在线剪辑方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919101.9A CN113973229B (zh) | 2021-08-11 | 2021-08-11 | 一种处理视频中口误的在线剪辑方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113973229A CN113973229A (zh) | 2022-01-25 |
CN113973229B true CN113973229B (zh) | 2023-12-29 |
Family
ID=79586595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110919101.9A Active CN113973229B (zh) | 2021-08-11 | 2021-08-11 | 一种处理视频中口误的在线剪辑方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113973229B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971749A (zh) * | 2017-03-30 | 2017-07-21 | 联想(北京)有限公司 | 音频处理方法及电子设备 |
CN108962293A (zh) * | 2018-07-10 | 2018-12-07 | 武汉轻工大学 | 录像修正方法、系统、终端设备及存储介质 |
CN110166816A (zh) * | 2019-05-29 | 2019-08-23 | 上海乂学教育科技有限公司 | 用于人工智能教育的基于语音识别的视频编辑方法和系统 |
CN110401878A (zh) * | 2019-07-08 | 2019-11-01 | 天脉聚源(杭州)传媒科技有限公司 | 一种视频剪辑方法、系统及存储介质 |
CN111885416A (zh) * | 2020-07-17 | 2020-11-03 | 北京来也网络科技有限公司 | 一种音视频的修正方法、装置、介质及计算设备 |
CN112233661A (zh) * | 2020-10-14 | 2021-01-15 | 广州欢网科技有限责任公司 | 基于语音识别的影视内容字幕生成方法、系统及设备 |
CN113079406A (zh) * | 2021-03-19 | 2021-07-06 | 上海哔哩哔哩科技有限公司 | 视频处理方法及装置 |
-
2021
- 2021-08-11 CN CN202110919101.9A patent/CN113973229B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971749A (zh) * | 2017-03-30 | 2017-07-21 | 联想(北京)有限公司 | 音频处理方法及电子设备 |
CN108962293A (zh) * | 2018-07-10 | 2018-12-07 | 武汉轻工大学 | 录像修正方法、系统、终端设备及存储介质 |
CN110166816A (zh) * | 2019-05-29 | 2019-08-23 | 上海乂学教育科技有限公司 | 用于人工智能教育的基于语音识别的视频编辑方法和系统 |
CN110401878A (zh) * | 2019-07-08 | 2019-11-01 | 天脉聚源(杭州)传媒科技有限公司 | 一种视频剪辑方法、系统及存储介质 |
CN111885416A (zh) * | 2020-07-17 | 2020-11-03 | 北京来也网络科技有限公司 | 一种音视频的修正方法、装置、介质及计算设备 |
CN112233661A (zh) * | 2020-10-14 | 2021-01-15 | 广州欢网科技有限责任公司 | 基于语音识别的影视内容字幕生成方法、系统及设备 |
CN113079406A (zh) * | 2021-03-19 | 2021-07-06 | 上海哔哩哔哩科技有限公司 | 视频处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113973229A (zh) | 2022-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11403598B2 (en) | System and method for interview training with time-matched feedback | |
US20080275700A1 (en) | Method of and System for Modifying Messages | |
EP1425736B1 (en) | Method for processing audiovisual data using speech recognition | |
JP4600828B2 (ja) | 文書対応付け装置、および文書対応付け方法 | |
US6161087A (en) | Speech-recognition-assisted selective suppression of silent and filled speech pauses during playback of an audio recording | |
WO2005027092A1 (ja) | 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム | |
US20090037171A1 (en) | Real-time voice transcription system | |
TWI590240B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
US11908449B2 (en) | Audio and video translator | |
WO2001046947A1 (en) | Voice-controlled animation system | |
Edwards et al. | Jali-driven expressive facial animation and multilingual speech in cyberpunk 2077 | |
JP4140745B2 (ja) | 字幕へのタイミング情報付与方法 | |
KR20230106170A (ko) | 데이터 처리 방법 및 장치, 디바이스, 및 매체 | |
CN113973229B (zh) | 一种处理视频中口误的在线剪辑方法 | |
CN113676772A (zh) | 视频生成方法及装置 | |
WO2023018405A1 (en) | Systems and methods for assisted translation and lip matching for voice dubbing | |
JP4210723B2 (ja) | 自動字幕番組制作システム | |
CN116187292A (zh) | 对话模板生成方法、装置及计算机可读存储介质 | |
CN110364139B (zh) | 一种进行智能角色匹配的文字转语音工作方法 | |
JP3816901B2 (ja) | ストリームデータの編集方法と編集システム及びプログラム | |
KR102546559B1 (ko) | 영상 콘텐츠 자동 번역 더빙 시스템 | |
US20230230588A1 (en) | Extracting filler words and phrases from a communication session | |
CN114648975A (zh) | 一种根据知识点对英文电影自动切割生成配音素材的方法 | |
CN113611282A (zh) | 广播节目智能播报系统及方法 | |
JP2021179468A (ja) | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |