CN113973229B - 一种处理视频中口误的在线剪辑方法 - Google Patents

一种处理视频中口误的在线剪辑方法 Download PDF

Info

Publication number
CN113973229B
CN113973229B CN202110919101.9A CN202110919101A CN113973229B CN 113973229 B CN113973229 B CN 113973229B CN 202110919101 A CN202110919101 A CN 202110919101A CN 113973229 B CN113973229 B CN 113973229B
Authority
CN
China
Prior art keywords
file
subfiles
voice
video
stream file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110919101.9A
Other languages
English (en)
Other versions
CN113973229A (zh
Inventor
王晖
周清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHUOYUE RUIXIN DIGITAL TECHNOLOGY CO LTD
Original Assignee
SHANGHAI ZHUOYUE RUIXIN DIGITAL TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHUOYUE RUIXIN DIGITAL TECHNOLOGY CO LTD filed Critical SHANGHAI ZHUOYUE RUIXIN DIGITAL TECHNOLOGY CO LTD
Priority to CN202110919101.9A priority Critical patent/CN113973229B/zh
Publication of CN113973229A publication Critical patent/CN113973229A/zh
Application granted granted Critical
Publication of CN113973229B publication Critical patent/CN113973229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)

Abstract

本发明属于在线视频编辑领域,尤其是涉及一种处理视频中口误的在线剪辑方法。一种处理视频中口误的在线剪辑方法,其中包括步骤:将每段文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对语音子文件进行修改或删除后生成新音频流文件;根据被标记的语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;将新音频流文件和新视频纯画面流文件合并成新执行文件。通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化程度。

Description

一种处理视频中口误的在线剪辑方法
技术领域
本发明属于在线视频编辑领域,尤其是涉及一种处理视频中口误的在线剪辑方法。
背景技术
目前视频剪辑中,对于口误的处理,基本上还是依托于线下人工剪辑,一般使用Adobe Premiere,After Effects等软件,这些软件都提供了根据音频段裁切视频段的功能对视频口误进行处理。在此过程中需要将视频从头到尾观看一遍,确定口误点进行处理,非常耗时。
同时市场上也有一些视频在线剪辑的平台,比如腾讯的腾讯云剪、美摄科技的云剪辑平台,这些平台的操作性比较简单,能快速对视频的图像层进行素材叠加,从而达到视频剪辑的要求,但功能上不支持口误处理,剪辑人员需要线下先对视频预先处理。所以我们需要设计一直能在线编辑处理口误的在线剪辑方法。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种处理视频中口误的在线剪辑方法,可以在线进行口误处理,过程中不需要视频剪辑人员再从头检测口误。
为实现上述目的,本发明提供了如下技术方案:
一种处理视频中口误的在线剪辑方法,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记;
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件;
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件。
作为本技术方案的优选,所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息;
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名;
S2.3,获取所述语音子文件内声音频率变化信息,根据所述匹配句式模型获得所述语音子文件的句式类型信息;
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名。
作为本技术方案的优选,所述预设分段特征参数包括声音停顿时长、每个发音的音频数值。
作为本技术方案的优选,所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件。
作为本技术方案的优选,所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件;
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件。
作为本技术方案的优选,所述S3.2中当对比结果为不相同时,且不同率小于5%时:
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本。
作为本技术方案的优选,所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。
作为本技术方案的优选,所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。
作为本技术方案的优选,根据时间顺序对所述视频画面流子文件进行命名。
作为本技术方案的优选,所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。
通过实施上述技术方案,本发明具有如下的优点:
本发明通过语音识别从被执行文件中获得语音子文件,通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化程度。
附图说明
图1为本发明一种处理视频中口误的在线剪辑方法的流程图;
图2为本发明述S2中具体的流程图;
图3为本发明中S3的具体流程图;
图4为本发明中S3的判断逻辑图;
图5为本发明中标准字幕子文件的获取方法的流程图;
图6为本发明中S4的具体流程图。
具体实施方式
以下结合具体的实施例和实验数据对本发明做进一步的说明。应理解,本发明的实施例只用于说明本发明而非限制本发明,在不脱离本发明技术思想的情况下,根据本领域普通技术知识和惯用手段,做出的各种替换和变更,均应包括在本发明的范围内。
实施例
如图1-6所示,一种处理视频中口误的在线剪辑方法,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记。
在实际操作时,将被执行文件(这里的所述被执行文件为包含音频和画面的原始视频文件)先被分解成音频流文件和视频画面流文件。接下来将音频流文件通过预设分句特征参数进行分句,将整段的视频细分为每段包含一个完整句子的语音子文件,获得语音子文件中的文本内容,生成文字识别子文本,并按时间顺序进行命名。
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件。
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件。
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件。
本发明通过语音识别从被执行文件中获得语音子文件,通过将语音子文件和标准字幕子文件进行比较获得差异,根据不同差异进行不同的自动化剪辑,自动处理口误,无需人工参与,提升在线剪辑智能化。
所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息。
一般在朗读文段时,在完成一句完整的句子后会有短暂停顿,在0.8秒至1.1秒之间。标点符号的停顿规律一般是:句号、问号、感叹号、省略号停顿略长于分号、破折号、连接号;分号、破折号、连接号的停顿时间又长于逗号、冒号;逗号、冒号的停顿时间又长于顿号、间隔号。另外,在作品上的段落之间,停顿的时间要比一般的句号时间长些。
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名。
如“三场小组赛,进6球,失17球,让人吃惊。4月份还在绝境下逆转淘汰A国队,获得奥运会入场券的B国女足,那支让C市看台上老爷们痛哭流涕的铿锵玫瑰去哪了?”将通过语音识别后划分成包含内容为“三场小组赛,进6球,失17球,让人吃惊。”、“4月份还在绝境下逆转淘汰A国队,获得奥运会入场券的B国女足,那支让苏州看台上老爷们痛哭流涕的铿锵玫瑰去哪了?”的两个语音子文件,并根据时间信息按顺序命名成文件名为“语音子文件1”和“语音子文件2”的语音子文件。
S2.3,获取所述语音子文件内声音频率变化信息,根据所述匹配句式模型获得所述语音子文件的句式类型信息。
在说话演讲叙述时,在不同句式时演讲者会根据需要发出不同声调变化,在音频中则体现在整句话时间内的声音频率变化,根据实际的声音频率变化去匹配句式模型,获得语音子文件的句式类型信息。如陈述句的句式模型中声音频率变化形状类似于局有厚度的平面;反问句的句式模型中声音频率变化形状类似于具有初始厚度平面后连接趋势为斜向上带有厚度的鞋面;感叹句的句式模型中声音频率变化形状类似于具有明显向上凸出的几何体构造。
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名。
所述预设分段特征参数包括声音停顿时长、每个发音的音频数值。
所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件。
所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件。如被执行文件的名称为“女足怎么了”,则从标准字幕文件库中匹配到文件名匹配的标准字幕文件。或者更优选的,提取被执行文件的作者信息以及上传时间信息,从从标准字幕文件库中匹配到在预设时间段内相同作者上传的标准字幕文件。
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件。
进一步的,所述S3.2中当对比结果为不相同时,且不同率小于5%时:此时可能发生的情况为口误,可能是发错字音或用错词
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本。
或者,在另一种情况下:
所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:此时可能发生的情况为不同句式替换,但表达内容实质相同
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。有句式错误或整句的错误情况下,删除对应的语句的音频和视频,但在后期错误提示中提示句子序号,以便操作人员重录该段以便修改正确后上传。
所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。根据时间顺序对所述视频画面流子文件进行命名。
所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。

Claims (4)

1.一种处理视频中口误的在线剪辑方法,其特征在于,包括以下步骤:
S1,解析被执行文件得到音频流文件和视频画面流文件;
S2,对所述音频流文件进行语音识别,根据预设分句特征参数对所述音频流文件进行语音分句,按时间顺序命名所有语音子文件,并对应将所述视频画面流文件进行分段并标记;
S3,得到每段所述语音子文件对应的文字识别子文本,将每段所述文字识别子文本文件与标准字幕子文件进行对比,若对比不匹配,则对所述语音子文件进行修改或删除后生成新音频流文件;
S4,根据被标记的所述语音子文件保留或删除对应的视频画面流子文件,生成新视频纯画面流文件;
S5,将所述新音频流文件和所述新视频纯画面流文件合并成新执行文件;
所述S2中具体包括以下步骤;
S2.1,对所述音频流文件进行语音识别,获取所述音频流文件的声音停顿点,标记每个所述声音停顿点的停顿点时间信息;
S2.2,根据所述停顿点时间信息对所述音频流文件进行语音分句,将所述音频流文件划分成多个包含一句整句的所述语音子文件并按时间顺序对所有的所述语音子文件命名;
S2.3,获取所述语音子文件内声音频率变化信息,根据匹配句式模型获得所述语音子文件的句式类型信息;
S2.4,获取所以所述语音子文件的始末时间端点信息,根据所述始末时间端点信息对所述视频画面流文件分段生成多个所述视频画面流子文件并按时间顺序对所述视频画面流子文件命名;
所述预设分段特征参数包括声音停顿时长、每个发音的音频数值;
所述S3中具体包括以下步骤;
S3.1,对所述语音子文件进行语音识别得到所述文字识别子文本,并根据所述语音子文件的文件名对应命名;
S3.2,根据所述文字识别子文本调取对应的所述标准字幕子文件进行内容对比,若对比结果为完全相同,则生成所述新音频流文件并所述视频画面流文件在时间轴上合轨生成正确执行文件;若对比结果为不相同,则标记不匹配的所述语音子文件并删除后生成新音频流文件;
所述标准字幕子文件的获取方法包括:
SA1,根据被执行文件信息从标准字幕文件库中匹配对应的标准字幕文件;
SA2,将所述标准字幕文件分割为多段所述标准字幕子文件并根据所述顺序命名每段所述标准字幕子文件;
所述S3.2中当对比结果为不相同时,且不同率小于5%时:
获取所述所述文字识别子文本文件和所述标准字幕子文件的不同之处,抓取所述标准字幕子文件中的正确内容,将所述正确内容添加入所述文字识别子文本文件中对应的位置形成正确文字识别子文本;
所述S3.2中当对比结果为不相同时,且不同率大于等于5%时:
获取所述标准字幕子文件中的正确句式类型信息,与所述句式类型信息进行对比,若判断结果为句式不同,则删除所述标准字幕子文件并标记所述标准字幕子文件的信息记录在后期编辑提示文件中。
2.根据权利要求1所述的一种处理视频中口误的在线剪辑方法,其特征在于,所述视频画面流子文件为根据所有的所述语音子文件的始末时间信息对应将所述视频画面流文件根据时间轴进行分割得到的子文件。
3.根据权利要求2所述的一种处理视频中口误的在线剪辑方法,其特征在于,根据时间顺序对所述视频画面流子文件进行命名。
4.根据权利要求3所述的一种处理视频中口误的在线剪辑方法,其特征在于,所述S4包括以下步骤:
S4.1,根据被标记的所述语音子文件对应删除所述视频画面流子文件;
S4.2,将剩余所有的所述视频画面流子文件命按名称顺序进行排序生产所述新视频纯画面流文件。
CN202110919101.9A 2021-08-11 2021-08-11 一种处理视频中口误的在线剪辑方法 Active CN113973229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110919101.9A CN113973229B (zh) 2021-08-11 2021-08-11 一种处理视频中口误的在线剪辑方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110919101.9A CN113973229B (zh) 2021-08-11 2021-08-11 一种处理视频中口误的在线剪辑方法

Publications (2)

Publication Number Publication Date
CN113973229A CN113973229A (zh) 2022-01-25
CN113973229B true CN113973229B (zh) 2023-12-29

Family

ID=79586595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110919101.9A Active CN113973229B (zh) 2021-08-11 2021-08-11 一种处理视频中口误的在线剪辑方法

Country Status (1)

Country Link
CN (1) CN113973229B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971749A (zh) * 2017-03-30 2017-07-21 联想(北京)有限公司 音频处理方法及电子设备
CN108962293A (zh) * 2018-07-10 2018-12-07 武汉轻工大学 录像修正方法、系统、终端设备及存储介质
CN110166816A (zh) * 2019-05-29 2019-08-23 上海乂学教育科技有限公司 用于人工智能教育的基于语音识别的视频编辑方法和系统
CN110401878A (zh) * 2019-07-08 2019-11-01 天脉聚源(杭州)传媒科技有限公司 一种视频剪辑方法、系统及存储介质
CN111885416A (zh) * 2020-07-17 2020-11-03 北京来也网络科技有限公司 一种音视频的修正方法、装置、介质及计算设备
CN112233661A (zh) * 2020-10-14 2021-01-15 广州欢网科技有限责任公司 基于语音识别的影视内容字幕生成方法、系统及设备
CN113079406A (zh) * 2021-03-19 2021-07-06 上海哔哩哔哩科技有限公司 视频处理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971749A (zh) * 2017-03-30 2017-07-21 联想(北京)有限公司 音频处理方法及电子设备
CN108962293A (zh) * 2018-07-10 2018-12-07 武汉轻工大学 录像修正方法、系统、终端设备及存储介质
CN110166816A (zh) * 2019-05-29 2019-08-23 上海乂学教育科技有限公司 用于人工智能教育的基于语音识别的视频编辑方法和系统
CN110401878A (zh) * 2019-07-08 2019-11-01 天脉聚源(杭州)传媒科技有限公司 一种视频剪辑方法、系统及存储介质
CN111885416A (zh) * 2020-07-17 2020-11-03 北京来也网络科技有限公司 一种音视频的修正方法、装置、介质及计算设备
CN112233661A (zh) * 2020-10-14 2021-01-15 广州欢网科技有限责任公司 基于语音识别的影视内容字幕生成方法、系统及设备
CN113079406A (zh) * 2021-03-19 2021-07-06 上海哔哩哔哩科技有限公司 视频处理方法及装置

Also Published As

Publication number Publication date
CN113973229A (zh) 2022-01-25

Similar Documents

Publication Publication Date Title
US11403598B2 (en) System and method for interview training with time-matched feedback
US20080275700A1 (en) Method of and System for Modifying Messages
EP1425736B1 (en) Method for processing audiovisual data using speech recognition
JP4600828B2 (ja) 文書対応付け装置、および文書対応付け方法
US6161087A (en) Speech-recognition-assisted selective suppression of silent and filled speech pauses during playback of an audio recording
WO2005027092A1 (ja) 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
US20090037171A1 (en) Real-time voice transcription system
TWI590240B (zh) 會議記錄裝置及其自動生成會議記錄的方法
US11908449B2 (en) Audio and video translator
WO2001046947A1 (en) Voice-controlled animation system
Edwards et al. Jali-driven expressive facial animation and multilingual speech in cyberpunk 2077
JP4140745B2 (ja) 字幕へのタイミング情報付与方法
KR20230106170A (ko) 데이터 처리 방법 및 장치, 디바이스, 및 매체
CN113973229B (zh) 一种处理视频中口误的在线剪辑方法
CN113676772A (zh) 视频生成方法及装置
WO2023018405A1 (en) Systems and methods for assisted translation and lip matching for voice dubbing
JP4210723B2 (ja) 自動字幕番組制作システム
CN116187292A (zh) 对话模板生成方法、装置及计算机可读存储介质
CN110364139B (zh) 一种进行智能角色匹配的文字转语音工作方法
JP3816901B2 (ja) ストリームデータの編集方法と編集システム及びプログラム
KR102546559B1 (ko) 영상 콘텐츠 자동 번역 더빙 시스템
US20230230588A1 (en) Extracting filler words and phrases from a communication session
CN114648975A (zh) 一种根据知识点对英文电影自动切割生成配音素材的方法
CN113611282A (zh) 广播节目智能播报系统及方法
JP2021179468A (ja) 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant